阿里Qwen-2成全球开源大模型排行榜第一

发布时间:2024-6-27 15:30    发布者:eechina
关键词: 阿里 , Qwen-2 , 开源大模型
来源:快科技

全球知名的开源平台Hugging Face的联合创始人兼首席执行官Clem在社交平台激动宣布,阿里巴巴最新开源的Qwen2-72B指令微调版本在开源模型排行榜上荣登榜首。

为了打造一个更为公正和准确的开源大模型排名,Clem及其团队利用300块H100高性能硬件,对全球100多个主流开源大模型,包括Qwen2、Llama-3、Mixtral、Phi-3等,在BBH、MUSR、MMLU-PRO、GPQA等严格的基准测试集上进行了全面而深入的评估。

这次重新评估的初衷在于,许多开发者过于追求排行榜的名次,导致在模型训练过程中过度依赖评估集数据,并且过去的评估标准对于模型而言显得过于简单。因此,本次评估提高了难度标准,以检验这些模型在更高挑战下的真实性能。

令人瞩目的是,阿里巴巴开源的Qwen-2 72B模型在激烈竞争中脱颖而出,不仅超越了科技巨头Meta的Llama-3,还超越了法国知名大模型平台Mistralai的Mixtral,成为了新的行业领军者。这一成绩充分展示了中国在全球开源大模型领域的领导地位。

针对这一排名结果,Stability AI的研究总监、早年在19岁便获得博士学位的Tanishq表示,他早前就预测中国在开源大模型领域具有强大的竞争力。除了Qwen2,还有零一万物、InternLM、Deepsseek等众多优秀的中国开源模型,都在国际舞台上崭露头角。

Tanishq进一步强调,任何关于中国在开源大模型领域落后的观点都是站不住脚的。相反,中国在这一领域正逐渐展现出领导者的姿态,引领着全球开源模型的发展潮流。
本文地址:https://www.eechina.com/thread-861984-1-1.html     【打印本页】

本站部分文章为转载或网友发布,目的在于传递和分享信息,并不代表本网赞同其观点和对其真实性负责;文章版权归原作者及原出处所有,如涉及作品内容、版权和其它问题,我们将根据著作权人的要求,第一时间更正或删除。
您需要登录后才可以发表评论 登录 | 立即注册

厂商推荐

  • Microchip视频专区
  • 利用模拟开发工具生态系统进行安全电路设计
  • 更佳设计的解决方案——Microchip模拟开发生态系统
  • 深度体验Microchip自动辅助驾驶应用方案——2025巡展开启报名!
  • 我们是Microchip
  • 贸泽电子(Mouser)专区

相关视频

关于我们  -  服务条款  -  使用指南  -  站点地图  -  友情链接  -  联系我们
电子工程网 © 版权所有   京ICP备16069177号 | 京公网安备11010502021702
快速回复 返回顶部 返回列表