中国AI初创DeepSeek再发表新技术论文,可令处理长文的速度提高11倍,创办人梁文锋更亲自参与该论文研究。另外,梁文锋2009年读研期间曾到上海一科技公司实习,直接担任新技术部经理,月薪达1.6万人民币,属高薪一族。
推新技术处理长文快11倍
据内媒报道,DeepSeek昨公布一项由梁文锋亲自参与的研究论文成果——原生稀疏注意力(Native Sparse Attention, NSA)机制,结合算法创新和硬件优化,解决长文建模中的计算瓶颈。
▲DeepSeek成为炙手可热的科技新贵。路透社
报道指,论文显示,NSA仍未用于训练DeepSeek V3模型。论文指出,NSA处理长文的速度可提升11.6倍,在通用基准测试中,实现性能反超传统的“全注意力模型”。
此外,梁文锋成为举世瞩目的科技红人后,他出道前的经历也成为关注焦点。快科技报道,梁文锋在2009年曾在上海闵行的艾麒信息科技实习,负责人工智能有关的内容。
专注研究半天不出办公室
艾麒信息创办人周朝恩透露,梁文锋是他的浙大校友,读研期间就以实习生身分加入艾麒,后经推荐直接担任新技术部经理,给予月薪人民币1.6万元,算是高薪特别聘请。
周朝恩忆述称,“初见梁文锋时,他戴著一副眼镜,斯文有礼,身材清瘦,给人一种文静内敛的印象。入职后,就全身心投入到人工智能视频与图像技术的研究中,常常一整天都待在办公室里,专注地钻研技术难题,甚至半天都不出来一次。”。
不善言辞典型技术男
周朝恩形容,梁文锋不善言辞,但交流技术时则能清晰表达观点,展现强大逻辑思维能力,指他“为人沉著冷静,性格简单直接,对产品和技术有极高的追求,堪称典型的技术男风格”。
梁文锋也曾管理过多位演算法工程师,采用扁平化管理方式,给团队成员充分的自由和信任,发挥每个人的特长,并带领团队攻克了多项技术难题,优化影像处理演算法。
丰富的管理经验在梁文锋创业后得到了延续。周朝恩指出,梁文锋招聘的团队成员大多是数学竞赛一等奖、拿过国际金牌的演算法人才,这种对高端人才的管理和激励方式,使得梁文锋在管理量化投资和深度求索时,能够迅速组织一支高效专业的技术团队。