阿里发布并开源模型Qwen3，成本仅为DeepSeek-R1的1/3

0次浏览发布时间：2025-04-29 11:21:00

4月29日凌晨，阿里巴巴开源新一代通义千问模型Qwen3（简称千问3），参数量仅为DeepSeek-R1的1/3，成本大幅下降，性能全面超越R1、OpenAI-o1等领先模型，登顶全球最强开源模型。

千问3是国内首个“混合推理模型”，将“快思考”与“慢思考”集成进同一个模型，大大节省算力消耗。

根据官方的说法，千问3的旗舰版本 Qwen3-235B-A22B，在代码、数学、通用能力等基准测试中，达到了与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 同一梯度的水平。

在奥数水平的 AIME25 测评中，Qwen3-235B-A22B 斩获 81.5 分，刷新了开源模型的纪录；在考察代码能力的 LiveCodeBench 评测中，Qwen3-235B-A22B 突破 70 分，表现甚至超过 Grok 3；在评估模型人类偏好对齐的 ArenaHard 测评中，Qwen3-235B-A22B 以 95.6 分超越 OpenAI-o1 及 DeepSeek-R1。

在相同计算资源下，千问3模型以更小的规模实现了对更大体量上一代模型的超越，真正做到了“小而强大”。

千问3总参数量235B，刷新了开源模型的智能水平新高，阿里称仅需4张H20即可部署千问3满血版，显存占用仅为性能相近模型的三分之一。

千问3模型版本包含2款30B、235B的MoE模型，以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型。

同时，千问3为即将到来的智能体Agent和大模型应用爆发提供了更好的支持。在评估模型Agent能力的BFCL评测中，千问3创下70.8的新高，超越Gemini2.5-Pro、OpenAI-o1等顶尖模型，将大幅降低Agent调用工具的门槛。

据悉，千问3系列模型依旧采用宽松的Apache2.0协议开源，并首次支持119多种语言，全球开发者、研究机构和企业均可免费在魔搭社区、HuggingFace等平台下载模型并商用，也可以通过阿里云百炼调用千问3的API服务。个人用户可立即通过通义APP直接体验千问3，夸克也即将全线接入千问3。

目前，阿里通义已开源200余个模型，全球下载量超3亿次，千问衍生模型数超10万个，已超越美国Llama，成为全球第一开源模型。

本文系观察者网独家稿件，未经授权，不得转载。

本文分类：实时讯息
本文标签：模型开源阿里仅为全球夸克水平能力
浏览次数：0 次浏览
发布日期：2025-04-29 11:21:00
本文链接：https://m.nhwz.net/news/wgeBkQADK7.html

上一篇 > 商务部新闻发言人就波音公司飞回拟交付飞机答记者问
下一篇 > “从跟跑到领跑”彰显科技创新强劲实力

栏目导航

阿里发布并开源模型Qwen3，成本仅为DeepSeek-R1的1/3