分享好友 资讯频道首页 频道列表

阿里凌晨开源新模型:性能对标DeepSeek-R1,参数仅为其1/20今日资讯

发布时间: 2025-03-07 08:03 更新时间: 4小时前1560

3月6日凌晨3点,阿里巴巴发布并开源全新的推理模型通义千问QwQ-32B。阿里巴巴称,这是一款拥有320亿参数的模型,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1媲美,但二者在参数量上相差将近20倍。

据悉,QwQ-32B 在一系列基准测试中进行了评估,测试了数学推理、编程能力和通用能力,并与OpenAI的o1-mini以及DeepSeek满血版及蒸馏版进行了比较。

在测试数学能力的AIME24评测集上,以及评估代码能力的LiveCodeBench 中,千问 QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1蒸馏模型。

在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜”LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek- R1。

官方介绍称,这一成果突显了将强化学习应用于经过大规模预训练的强大基础模型的有效性。此外,阿里团队还在推理模型中集成了与Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。

除了性能上的大幅提升,QwQ-32B的另外一个亮点是大幅降低了部署使用成本,开发者和企业可以在消费级硬件上轻松将其部署到本地设备中。

资料显示,从2023年至今,阿里通义团队已开源200多款模型,包含大语言模型千问Qwen及视觉生成模型万相Wan等两大基模系列,覆盖从0.5B到110B等参数,实现了全模态、全尺寸大模型的开源。

开源社区Hugging Face此前的榜单显示,开源仅6天的阿里万相大模型已反超DeepSeek-R1,登顶模型热榜、模型空间榜两大榜单,成为近期全球开源社区最受欢迎的大模型。根据最新数据,万相2.1(Wan2.1)在Hugging Face及魔搭社区的总下载量已超百万,在Github的Star数超6k。

在通义千问最新推理模型发布并开源后,阿里巴巴股价应声大涨。隔夜美股收盘涨8.61%,报收141.03美元。截至发稿,阿里巴巴港股涨超7%。今年以来,阿里巴巴股价累计涨幅已近70%。

 拔打报修电话
反对 0
举报 0
收藏 0
打赏 0
评论 0
复星医药收到回购贷款承诺函头条热点
热点栏目  (02196)公布,近日,公司收到中国股份有限公司上海市长宁支行出具的《承诺函》,主要内容如下:  1、承诺贷款额度:最高不超过已公告的本次 A 股回购金额上限的 90%;  2、贷款期限:不超过 3 年;  3、贷款用途:为本次 A 股回购所需资金提供融资支持。

0评论2025-03-07101

技术派|美军将装备“农改军”螺旋桨攻击机,为何反其道而行?今日资讯
美国空军近日宣布将OA-1K轻型攻击机命名为“天袭者II”,这是一种从农用飞机基础上发展而来的多用途螺旋桨攻击机。在喷气式飞机和无人机大行其道的当下,美军为何反其道而行,装备带有浓浓二战味道的螺旋桨攻击机,这引发了讨论。OA-1K轻型攻击机挂载能力比较强,可携带多种弹药。“

0评论2025-03-07178

“杭州六小龙”等科技成果爆火出圈,浙江省长谈“创新之道”网友怎么看
“浙江将以长期主义者的坚定,真正做好科技创新与产业创新深度融合这篇大文章。”3月6日,在十四届全国人大三次会议浙江代表团的开放团组活动上,全国人大代表、浙江省省长刘捷在回答媒体提问时表示。当天下午,浙江代表团举行全体会议,审议政府工作报告,审查计划报告和草案、

0评论2025-03-07141

DeepSeek回应两会走红:嘿嘿,怪不好意思的具体怎么回事
这两天,谁要是不说说 DeepSeek,好像就不太时髦了。全国两会期间, DeepSeek 太火。从大会发言人、部长们的点赞,到代表委员们的热议,DeepSeek 参与掀起的 " 人工智能 +" 浪潮席卷而来,中国的 AI 故事也正翻开新篇章。对此,记者与这位新晋 " 顶流 " 展开了一场跨越次元的对话——图源 DeepSeek

0评论2025-03-07338

光大期货:官员鸽派发言强化降息预期 关注今夜非农表现到底是什么回事
热点栏目  3月6日,COMEX黄格下跌0.21%至2919.80美元/盎司,沪金主连上涨0.17%至680.60元/克。  降息方面,欧洲央行消息人士表示四月暂停降息的可能性正在增加,利率仍然可能进一步下调,2.5%不太可能是本轮周期的底部。美联储理事沃勒表示美联储可能会在3月后进行降息,2025年进行两次降

0评论2025-03-07270

加拿大将暂停对美国商品征收第二阶段报复性关税今日资讯
加拿大财政部长勒布朗6日说,加拿大4月2日前不会对美国商品征收第二阶段报复性关税。勒布朗在社交媒体上发文说,美国已同意暂停对加拿大符合“美国-墨西哥-加拿大协定”(美墨加协定)出口的产品征收关税,直至4月2日。因此,加拿大不会在4月2日之前对价值1250亿加元(约合875亿美元)

0评论2025-03-07317

巴菲特卖股票的原因揭晓具体怎么回事
现在轮到巴菲特说 " 我早就告诉过你 " 这句话了。去年年底标普 500 创下 50 多个收盘新高时,伯克希尔 - 哈撒韦(BRK.B)CEO 巴菲特却忙着抛售股票,他的这种操作曾让许多市场观察人士摸不着头脑。现在答案似乎有了。2025 年美股市场的下跌,证明了伯克希尔去年第四季度买股票操作的先见之

0评论2025-03-07197

明查|新加坡逮捕向DeepSeek走私英伟达芯片的团伙9人?误导头条热点
点击进入澎湃新闻全球事实核查平台速览- 网传说法援引了亚洲新闻台的报道,但与原文不完全一致。原报道称新加坡抓捕的3名走私诈骗犯与非法贩卖英伟达芯片有关,文中提及了“美国商务部调查DeepSeek是否使用了禁止运往中国的美国芯片”一事,暗示该案与DeepSeek有所关联。但没有可靠依据

0评论2025-03-07133

世纪交易!李嘉诚228亿美元卖掉43个港口,全球港口控制权格局生变网友怎么看
界面新闻记者 | 白帆界面新闻编辑 | 李慎中国香港富豪李嘉诚完成了一场世纪交易,刷新了全球港口并购的记录。3月4日晚间,李嘉诚创办的长江和记实业有限公司(CK Hutchison,下称“长和”,股票代码:00001.HK)发布公告称,其与贝莱德集团(BlackRock)牵头组成的贝莱德-TiL财团达成原则性协

0评论2025-03-07253

“闲鱼式消费”如何重构消费意义?到底是什么回事
今年春节,凭借一支秧歌舞和精彩的转手绢表演,宇树机器人一夜爆火。由于价格昂贵,租赁比购买更具性价比,因此春晚同款机器人成了闲鱼上的“新宠”,并且供不应求,而闲鱼卖家也意外成为这场科技热潮的最大收益者。闲鱼上不少商家打着“春晚同款”标签出租,日租金从5000到15000元

0评论2025-03-07225