首页 今日快讯文章正文

6大顶级模型交易比拼,DeepSeek暂列第一,怎么说?

今日快讯 2025年10月22日 09:04 0 admin
6大顶级模型交易比拼,DeepSeek暂列第一,怎么说?

府库第1103期基金投顾观察原创内容

最近有一个特别有趣的AI实验,是让六大顶级模型,一起来进行交易比拼,目标是衡量当前模型在投资能力的基准。

6大顶级模型交易比拼,DeepSeek暂列第一,怎么说?

规则是这样的,每个模型在初始的时候,会有1万美元的本金,交易的是数字货币合约,目标是最大化风险调整后的收益。而给到每个模型的信息都是一样的,交易记录也是公开的。需要模型自己去根据信息做决策,把握交易时机,控制风险,获得超额收益。这一期的时间是截止到美国东部时间11月3日下午5点。

这次的6大模型,分别是海外的4个顶级模型OpenAI的GPT-5,Anthropic的Claude Sonnet 4.5,谷歌的Gemini2.5 Pro,xAI的Grok4,还有咱们国内两大模型,分别是DeepSeek V3.1和阿里的Qwen3 Max,下面咱们就来看看战况。

6大顶级模型交易比拼,DeepSeek暂列第一,怎么说?

目前DeepSeek暂居第一位,Claude位居第二,而OpenAI的GPT-5模型落后明显,看起来好像没赚过钱。而这些所有的交易都是透明的,可以看到他们的交易信息是怎样的。

6大顶级模型交易比拼,DeepSeek暂列第一,怎么说?

比如这是DeepSeek的一次决策数据,他会根据当前持仓的情况,分析了一下这些仓位都应该继续持有,有部分持仓虽然出现超买的情况了,但也在可以接受的范围内,最后看了一下兜里面的现金和整体的回报率,最后选择没有进行交易,保持当前持仓。

6大顶级模型交易比拼,DeepSeek暂列第一,怎么说?

每个模型的决策过程,目前是分为上面三个阶段,首先是市场行情数据还有账户数据来给到模型,之后模型去做整体的投资分析,最终形成投资决策。

AI 的决策过程其实很像一个严谨的逻辑推演。它首先把所有能看到的市场信息都整理出来——每个资产的价格、波动、成交量、资金流向,还有自己账户里的持仓、盈亏、风险区间。对它来说,这些不是杂乱的数据,而是当前局面的“事实”。它先不做判断,只是建立一个清晰的全景:市场在什么位置、仓位处在哪个状态、风险边界在哪里。

接着,它会逐个去看每一个持仓。它不去猜未来的涨跌,只关心现在是不是还符合原本的计划。它会对比当前价格和入场价,看有没有接近止盈或止损的位置;会看趋势指标是不是发生了变化;也会看资金面有没有出现异常。如果所有条件都还正常,它就认为这笔投资可以继续持有;如果某个关键条件被打破,比如跌破止损线、触发预警信号,它就会把这一仓位标记为需要调整或退出。整个判断的核心逻辑就是:当环境改变到足以影响原计划时,再改变决策。

在完成所有分析后,它会把这些判断汇总成一个清晰的结论。哪些仓位继续持有,哪些需要平掉,哪些需要注意潜在风险。它不会情绪化,也不会因为一时的涨跌而频繁操作,而是始终围绕“是否触发条件”来行动。这样一个流程,让决策过程变得干净、透明——每一个结果都有迹可循,每一次选择都建立在事实和规则之上。这就是它做决策的方式:先看清当下,再根据规则执行,不多想,也不乱动。


这个实验蛮有意思的,我也想过这么玩玩。目前这个实验更多的还聚焦在短线交易方面,而且给了很多人为的预设信息。目前开着一个AI嘎嘎把咱们当做韭菜就给割了还是挺有困难的,AI起作用也需要在一个非常大的体系下,它能更好地工作,单纯拿一个行情数据做交易,是有点困难的。

不过现在咱们真的挺牛的,这种世界级的模型比拼,咱们都能有两个模型参与进来,确实非常厉害啊,真是值得吹一波。

府库投顾观察

6大顶级模型交易比拼,DeepSeek暂列第一,怎么说?

6大顶级模型交易比拼,DeepSeek暂列第一,怎么说?

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap