开云体育
开云APP下载外媒:阿里大模型全线切换放弃DeepSeekR1
据The Information报道,知情人士透露,阿里巴巴旗下各业务单元已启动基于Qwen3模型的智能体开发计划。
值得注意的是,部分原采用DeepSeek R1模型的阿里系应用,现已开始技术迁移至Qwen3平台。这一举措标志着阿里在AI技术选型上的重大转变,从依赖外部先进模型转向自主研发的技术路线。
这种“自我造血”式的技术迭代,不仅是对阿里技术实力的一次检验,也标志着阿里AI战略进入了一个新的阶段。
阿里的这一决策背后,是对技术自主性和长期发展战略的深刻考量。在全球科技竞争日益激烈的今天,掌握核心技术成为企业保持竞争力的关键。通过全面转向自研的Qwen3模型,阿里有望在AI领域构建更加自主可控的技术体系,减少对外部技术的依赖。
此外,这一转变还将为阿里带来更多的定制化优势。Qwen3模型可以根据阿里各业务的特定需求进行深度优化,从而提升整体业务效率和用户体验。例如,在电商业务中,AI智能体可以更好地理解用户需求,提供更加精准的商品推荐;在物流配送中,能够实现更高效的路径规划和智能调度。
对于阿里而言,这一决策不仅是技术上的升级,更是一次战略布局的深化。通过强化自研技术,阿里将在AI时代的竞争中占据更加有利的位置,为未来的业务拓展和创新发展奠定坚实基础。
DeepSeek R1是今年1月由中国AI创业公司DeepSeek推出的推理模型,在数学、编程和推理等多个任务上达到了与Open AI o1相当的表现水平,同时将API调用成本降低了90-95%。DeepSeek R1-Zero是首个完全通过强化学习(RL)训练的大型语言模型,无需依赖监督微调(SFT)或人工标注数据。这一突破验证了仅通过奖励信号,模型也能发展出强大的推理能力。
DeepSeek R1采用MIT许可协议,完全开源,并提供了六个蒸馏版本(1.5B至70B),适合不同规模的开发者使用。
今年5月28日,DeepSeek官方宣布DeepSeek R1模型已完成小版本试升级,欢迎前往官方网页、APP、小程序测试(打开深度思考),API接口和使用方式保持不变。初步测试结果表明,R1-0528在编程能力、审美设计和代码补全等方面表现出色,尤其在复杂指令处理和前端页面生成上展现了高精度和高效能。
有网友反馈,感觉模型的理解能力上了一个层次,比如激活参数部分,R1可以制作交互动画来展示,另外关键信息的逻辑也非常清晰。还有网友表示,编程能力也大幅提升,太吓人了,1000多行代码一次搞定,没有bug。
DeepSeek由前阿里巴巴高管陈颖创立,陈颖在2019年离开阿里巴巴,在阿里巴巴工作的13年间,他参与创建了天猫,后来负责领导淘宝和天猫的技术部门。
DeepSeek创立之初便获得了阿里的支持,阿里对其进行了种子轮投资。此后,DeepSeek团队迅速扩张,成员规模从最初的30人增长至约200人。团队成员大多来自阿里,部分核心成员更是来自阿里达摩院。
随着DeepSeek的发展,阿里与DeepSeek的合作愈发紧密。阿里不仅为DeepSeek提供了丰富的业务场景进行模型训练和优化,还在算力等关键资源上给予了大力支持。作为回报,DeepSeek的先进模型技术也反哺了阿里的业务,为阿里在电商、物流、金融等多个领域的智能化升级提供了强大的技术驱动力。
这种深度合作模式在科技行业并不罕见,企业通过投资和支持初创公司,获取前沿技术和创新能力,而初创公司则借助企业的资源和平台实现快速发展。然而,随着技术的不断演进和市场竞争的加剧,合作双方的战略决策也面临着诸多变数。此次阿里全面转向自研的Qwen3模型,便是在这样的背景下做出的重要战略调整。返回搜狐,查看更多