阿里推新模型QwQ-32B,性能媲美DeepSeek-R1,股价曾升逾7%

发布时间:2025-03-06 11:04

阿里旗下通义千问Qwen团队推出QwQ-32B大语言模型,据称其性能媲美拥有6,710亿参数的DeepSeek-R1(其中370亿被激活),更在某些测试中超越了对方。受消息影响,阿里股价今早曾升逾7%至139.6港元;暂报138.2元,续升逾6%。

阿里

或证通用AI可行之路

据内媒引述阿里Qwen团队指出,有关成果突显了将强化学习应用于经过大规模预训练的强大基础模型的有效性,希望以此证明强大的基础模型叠加大规模强化学习也许是一条通往通用人工智能的可行之路。

集成与Agent相关能力

除了基础推理能力外,QwQ-32B还集成了与Agent相关的能力,使其能够在使用工具时进行批判性思考,并根据环境反馈调整推理过程。

部份测试结果更胜DeepSeek-R1

根据官方披露测试结果,QwQ-32B在测试数学能力的AIME24评测集上,以及在评估代码能力的LiveCodeBench中,表现同样与DeepSeek-R1相当;而在Meta首席科学家杨立昆领衔的“最难LLMs评测榜”LiveBench上、在谷歌等提出的指令遵循能力IFEval评测集中,以及在加州大学伯克利分校等提出的评估准确调用函数或工具的BFCL测试中,同样超越DeepSeek-R1。

报道又指,QwQ-32B的发佈与阿里近期宣佈的AI战略高度一致,而阿里早前自研的“深度思考”推理模型已在夸克AI搜索平台上线,成为国内少数没有接入DeepSeek的大体量C端AI应用。在基础模型层面,阿里通义大模型家族更已跻身全球顶尖开源模型行列,并有传更大规模的模型也将接入夸克。


热门文章