开云体育官方DeepSeek-R1再进化！周鸿祎解读DpSk更新

开云体育NEWS CENTER

您当前位置：首页 > 开云体育

2025-06-09

浏览次数：次

　　别看名字没变，这波 R1 版本的升级可不简单，特别是在复杂推理前端开发幻觉降低等方向，带来了实打实的进化。

　　这次的 DeepSeek-R1-0528 还是沿用了 2024 年 12 月发布的 DeepSeek V3 Base 模型，只不过这次后台砸了更多算力，让它能像人一样多想一步、再多想一步。

　　思考用料足了，答案自然更准：准确率从原来的 70% 一口气飙到了 87.5%。

　　有网友实测，新版 R1-0528 连续思考一个复杂问题能跑上 25 分钟。

　　似乎为了提升模型的深度思考能力，DeepSeek-R1-0528 有意拉长了大模型的思考时长。

　　为了测试新版 R1-0528 在物理世界的推理能力，有网友拿同一句提示，让它们生成一个页面：R1-0528 一次性输出了 728 行代码，而 Claude 4 Sonnet 只给出了 542 行。

　　老狐仔细对比后发现，新版 R1-0528 在细节处理上更精致，无论是橙色球表面的光影反射，还是砖块墙被破坏后的不规则倒塌，都稳赢 Claude 4 Sonnet。

　　而在数学推理方面，不少网友提到，DeepSeek-R1-0528 是目前唯一一个能持续稳定地正确回答 9.9 - 9.11 等于多少？的模型。

　　不仅如此，有网友让 DeepSeek-R1-0528 搭建一个单词评分系统，结果只用一次提示就能生成前后端文件，直接跑起来、根本不用调试。

　　要知道，之前只有 Open AI 的 o3 模型能做到这么稳定的输出，现在新版 R1-0528 也成功追了上来，成了第二个达到这种水平的模型。

　　DeepSeek-R1-0528 在数学、编程和通用逻辑等多个测评中，不仅稳坐国内领先的位置，还紧追国际顶尖模型 o3 和 Gemini 2.5 Pro 的表现。

　　对于 AI 模型来说，编程和推理能力固然是核心，但像 Chat GPT 和 Gemini 这样的国外模型，面对中文的复杂语境，有时会显得水土不服。

　　相比之下，DeepSeek 作为本土 AI，这次更新在语言对话方面下足了功夫，更贴合咱们国人用户的需求。

　　先说 AI 的老毛病：幻觉，用户苦 AI 幻觉久矣，DeepSeek-R1-0528 在这方面进步不小。

　　以前，旧版 R1 在改写润色、总结摘要、阅读理解时，总爱脑补些不靠谱的内容。

　　新版 R1-0528 则稳了不少，幻觉率直接降低了 45%～50%，输出内容靠谱多了，不用担心它瞎编了。

　　而在创意写作方面，DeepSeek-R1-0528 的表现也更上一层楼了。

　　相比旧版 R1 常见的卡壳现象，用新版 R1-0528 输出论文、小说、散文时，基本都能一气呵成，不仅逻辑顺畅，情节也很自然，再也不用大删大改了。

　　有一说一，看完 DeepSeek-R1-0528 写的小说，老狐的心情那叫一个复杂。

　　大模型越来越卷，这写作水平真让人瑟瑟发抖，难道连写小说的饭碗也要被抢了？

　　不管是和旧版 R1 比，还是和别家大模型比，DeepSeek-R1-0528 的表现都非常能打。

　　当然，也不是所有人都买账。也有网友吐槽这次更新雷声大雨点小，觉得 DeepSeek-R1-0528 还是有点名不副实。

　　不过，更多人还是抱着期待的态度。作为国产 AI 的代表，网友们更希望 DeepSeek 能越做越强，真正撑起国产之光的牌面！

　　老狐倒觉得，就算不谈技术硬核，不提民族情怀，这次 DeepSeek R1 的更新依然值得点赞。

　　“韦神”出镜4秒涨粉超百万！评论区秒变“高考许愿池”，“韦神”已被多方申请为商标