DeepSeek发布V4，并承认与Claude存在差距

FanchAI 的个人博客 / 61 / 0 / 创建于 3个月前

今天 DeepSeek V4 预览版上线了，第一时间去看了官方公告，然后被一句话逗乐了。
他们在介绍 V4-Pro 的 Agent 能力时，原话是这么写的，「使用体验优于 Sonnet 4.5，交付质量接近 Opus 4.6 非思考模式，但仍与 Opus 4.6 思考模式存在一定差距。」
你见过几家公司，在自己的新品发布公告里，主动告诉你「我们比不上某个竞品」的？
回忆了一下，几乎没有。大多数 AI 公司发新模型的时候，标准操作是什么？
精心挑选几个自己得分最高的 benchmark，做一张漂亮的对比表格，把自己放在第一的位置，然后配一句「全面超越」或者「遥遥领先」。至于那些跑不赢的维度？
不提就行了，反正用户也不会把所有评测都翻一遍。

DeepSeek 反着来了。不光说了自己赢在哪，还明确告诉你输在哪。

赢了 Sonnet 4.5，接近 Opus 4.6 的非思考模式，但跟 Opus 4.6 思考模式还有差距。说得清清楚楚。