阿里旗下通义千问Qwen团队推出QwQ-32B大语言模型,据称其性能媲美拥有6,710亿参数的DeepSeek-R1(其中370亿被激活),更在某些测试中超越了对方。受消息影响,阿里股价今早曾升逾7%至139.6港元;暂报138.2元,续升逾6%。
或证通用AI可行之路
据内媒引述阿里Qwen团队指出,有关成果突显了将强化学习应用于经过大规模预训练的强大基础模型的有效性,希望以此证明强大的基础模型叠加大规模强化学习也许是一条通往通用人工智能的可行之路。
集成与Agent相关能力
除了基础推理能力外,QwQ-32B还集成了与Agent相关的能力,使其能够在使用工具时进行批判性思考,并根据环境反馈调整推理过程。
部份测试结果更胜DeepSeek-R1
根据官方披露测试结果,QwQ-32B在测试数学能力的AIME24评测集上,以及在评估代码能力的LiveCodeBench中,表现同样与DeepSeek-R1相当;而在Meta首席科学家杨立昆领衔的“最难LLMs评测榜”LiveBench上、在谷歌等提出的指令遵循能力IFEval评测集中,以及在加州大学伯克利分校等提出的评估准确调用函数或工具的BFCL测试中,同样超越DeepSeek-R1。
报道又指,QwQ-32B的发佈与阿里近期宣佈的AI战略高度一致,而阿里早前自研的“深度思考”推理模型已在夸克AI搜索平台上线,成为国内少数没有接入DeepSeek的大体量C端AI应用。在基础模型层面,阿里通义大模型家族更已跻身全球顶尖开源模型行列,并有传更大规模的模型也将接入夸克。
热门文章
- 特朗普国会演说 | 万斯忘关麦克风对话疯传,疑似抱怨老板啰嗦惹热议 伦敦中国博士生迷奸10女罪成 ,临终身监禁 ,检方形容外表“聪明具魅力” 美国首与哈马斯直接谈判,特朗普发最后通牒:释放人质否则“你们死定了” 96岁李嘉诚据报亲自处理长和天价交易,仅数周完成与美方谈判,成功把巴拿马港口转危为机 马克龙:俄乌和平协议签署后,欧洲军队可能部署乌克兰 北海道札幌现大量弃置行李箱,贴有深圳、香港机场代码,媒体揭原因 柯建铭紧咬王世坚杀鸡儆猴?徐巧芯断言:不听话就往死里打 台积电送美,网曝绿营“沉默多数”反对:大罢免成功率低 民进党内讧白热化,赖清德下封口令止血 两会2025小百科│选举国家主席、修改《宪法》,一文看清全国人大权力
专题 更多 >





