6大顶级模型交易比拼，DeepSeek暂列第一，怎么说？

今日快讯 2025年10月22日 09:04 0 admin

府库第1103期基金投顾观察原创内容

最近有一个特别有趣的AI实验，是让六大顶级模型，一起来进行交易比拼，目标是衡量当前模型在投资能力的基准。

规则是这样的，每个模型在初始的时候，会有1万美元的本金，交易的是数字货币合约，目标是最大化风险调整后的收益。而给到每个模型的信息都是一样的，交易记录也是公开的。需要模型自己去根据信息做决策，把握交易时机，控制风险，获得超额收益。这一期的时间是截止到美国东部时间11月3日下午5点。

这次的6大模型，分别是海外的4个顶级模型OpenAI的GPT-5，Anthropic的Claude Sonnet 4.5，谷歌的Gemini2.5 Pro，xAI的Grok4，还有咱们国内两大模型，分别是DeepSeek V3.1和阿里的Qwen3 Max，下面咱们就来看看战况。

目前DeepSeek暂居第一位，Claude位居第二，而OpenAI的GPT-5模型落后明显，看起来好像没赚过钱。而这些所有的交易都是透明的，可以看到他们的交易信息是怎样的。

比如这是DeepSeek的一次决策数据，他会根据当前持仓的情况，分析了一下这些仓位都应该继续持有，有部分持仓虽然出现超买的情况了，但也在可以接受的范围内，最后看了一下兜里面的现金和整体的回报率，最后选择没有进行交易，保持当前持仓。

每个模型的决策过程，目前是分为上面三个阶段，首先是市场行情数据还有账户数据来给到模型，之后模型去做整体的投资分析，最终形成投资决策。

AI 的决策过程其实很像一个严谨的逻辑推演。它首先把所有能看到的市场信息都整理出来——每个资产的价格、波动、成交量、资金流向，还有自己账户里的持仓、盈亏、风险区间。对它来说，这些不是杂乱的数据，而是当前局面的“事实”。它先不做判断，只是建立一个清晰的全景：市场在什么位置、仓位处在哪个状态、风险边界在哪里。

接着，它会逐个去看每一个持仓。它不去猜未来的涨跌，只关心现在是不是还符合原本的计划。它会对比当前价格和入场价，看有没有接近止盈或止损的位置；会看趋势指标是不是发生了变化；也会看资金面有没有出现异常。如果所有条件都还正常，它就认为这笔投资可以继续持有；如果某个关键条件被打破，比如跌破止损线、触发预警信号，它就会把这一仓位标记为需要调整或退出。整个判断的核心逻辑就是：当环境改变到足以影响原计划时，再改变决策。

在完成所有分析后，它会把这些判断汇总成一个清晰的结论。哪些仓位继续持有，哪些需要平掉，哪些需要注意潜在风险。它不会情绪化，也不会因为一时的涨跌而频繁操作，而是始终围绕“是否触发条件”来行动。这样一个流程，让决策过程变得干净、透明——每一个结果都有迹可循，每一次选择都建立在事实和规则之上。这就是它做决策的方式：先看清当下，再根据规则执行，不多想，也不乱动。

这个实验蛮有意思的，我也想过这么玩玩。目前这个实验更多的还聚焦在短线交易方面，而且给了很多人为的预设信息。目前开着一个AI嘎嘎把咱们当做韭菜就给割了还是挺有困难的，AI起作用也需要在一个非常大的体系下，它能更好地工作，单纯拿一个行情数据做交易，是有点困难的。

不过现在咱们真的挺牛的，这种世界级的模型比拼，咱们都能有两个模型参与进来，确实非常厉害啊，真是值得吹一波。