DeepSeek发布V4,并承认与Claude存在差距

今天 DeepSeek V4 预览版上线了,第一时间去看了官方公告,然后被一句话逗乐了。
他们在介绍 V4-Pro 的 Agent 能力时,原话是这么写的,「使用体验优于 Sonnet 4.5,交付质量接近 Opus 4.6 非思考模式,但仍与 Opus 4.6 思考模式存在一定差距。」
你见过几家公司,在自己的新品发布公告里,主动告诉你「我们比不上某个竞品」的?
回忆了一下,几乎没有。 大多数 AI 公司发新模型的时候,标准操作是什么?
精心挑选几个自己得分最高的 benchmark,做一张漂亮的对比表格,把自己放在第一的位置,然后配一句「全面超越」或者「遥遥领先」。至于那些跑不赢的维度?
不提就行了,反正用户也不会把所有评测都翻一遍。

DeepSeek 反着来了。 不光说了自己赢在哪,还明确告诉你输在哪。

赢了 Sonnet 4.5,接近 Opus 4.6 的非思考模式,但跟 Opus 4.6 思考模式还有差距。说得清清楚楚。

本作品采用《CC 协议》,转载必须注明作者和本文链接
讨论数量: 0
(= ̄ω ̄=)··· 暂无内容!

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容,与人为善,比聪明更重要!