开云APP下载DeepSeek“偷偷”发布新版本最新测评来了

开云体育NEWS CENTER

您当前位置：首页 > 开云体育

2025-03-30

浏览次数：次

　　没有官方新闻稿，没有技术报告，甚至在Hugging Face上传的最初文件中，连README文档都是空的，看上去，这只是V3模型的一次版本升级。

　　不过由于DeepSeek自带的极高话题性，这次版本升级还是引发了大量讨论和测评，并且果然没有令人失望——很多专业人士都指出，V3-0324模型在编程能力上有了显著提升。

　　在大模型编程能力测试Aider LLM中，V3-0324的多语言基准测试得分为55%，相较于此前版本不到50%的水平有明显进步，并且超越了OpenAI的o3-mini，接近于自家的R1，但仍然稍稍落后于以编程见长的Claude 3.7 sonnet。

　　考虑到V3-0324并非推理模型，能够在编程能力上接近R1，算得上是自身短板的精准补强。

　　知名的大模型竞技场Chatbot Arena也已经开始将V3-0324纳入测试，但还具体成绩还要等待几天时间。

　　随着今年以来OpenAI推出最后一代非推理模型GPT-4.5，以及推理模型o3的升级，再加上Grok、Claude和Gemini等模型的持续迭代，外界对于DeepSeek何时能够再次升级也有了更高期待。

　　此前路透社消息称，DeepSeek下一代推理模型R2可能会比预期的5月更早发布。

　　考虑到DeepSeek R1是以V3作为基础模型训练而来，此次V3-0324的亮相，或许也意味着R2愈发临近了。