阿里千问3发布并开源，参数仅为DeepSeek-R1三分之一

2025-4-29 15:04| 发布者: 仟茂传媒| 查看: 850| 评论: 0|来自: 和讯财经

摘要: 新浪科技讯4月29日上午消息，阿里巴巴开源了新一代通义千问模型Qwen3，参数量仅为DeepSeek-R1的1/3，宣布成本大幅下降，性能超越R1、OpenAI-o1等领先模型。千问3是一个“混合推理模型”，将“快思考”与“慢思考”集 ...

仟茂科技讯 4月29日上午消息，阿里巴巴开源了新一代通义千问模型Qwen3（简称千问3），参数量仅为DeepSeek-R1的1/3，宣布成本大幅下降，性能超越R1、OpenAI-o1等领先模型。千问3是一个“混合推理模型”，将“快思考”与“慢思考”集成进同一个模型，极大节省了算力消耗。

据了解，千问3采用混合专家（MoE）架构，总参数量235B，激活仅需22B。千问3预训练数据量达36T tokens，并在后训练阶段经过多轮强化学习，将非思考模式无缝整合到思考模型中。千问3在推理、指令遵循、工具调用、多语言能力等方面均大幅增强。性能大幅提升的同时，千问3的部署成本还大幅下降，仅需4张H20即可部署千问3满血版，显存占用仅为性能相近模型的三分之一。（文猛）

责任编辑：郝欣煜

（责任编辑：张晓波）

【免责声明】本文仅代表作者本人观点，与和讯网无关。和讯网站对文中陈述、观点判断保持中立，不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考，并请自行承担全部责任。邮箱：news_center@staff.hexun.com