搜索
APP下载
扫码下载APP
关注我们
登录
注册
首页
热点资讯
互动论坛
同城服务
人才网
实用工具
搜索
每日签到
本地新闻
时事评论
华人世界
斯里兰卡资讯
中国新闻
新闻视频
国际新闻
娱乐新闻
科技新闻
菲龙广场
本地新闻
八卦娱乐
华人世界
时事评论
中外新闻
房产网
菲龙速聘
二手交易
便民电话
美食餐厅
旅游签证
物流速运
商品买卖
二手车市场
支票转换
便民电话
话费充值
实时汇率
每日签到
我的任务
道具商店
菲龙网
»
论坛
›
新闻频道
›
科技新闻
›
又创新高,阿里通义开源模型Qwen2.5进入大模型盲测全球 ...
菲龙网编辑部7
有 745 人收听 TA
157729
主题
157746
回复
184384
积分
收听TA
发消息
加好友
本文来自
科技新闻
订阅
|
收藏
(
2953
)
菲龙网编辑部7发布过的帖子
0/165
东西问丨吴景明:当我们种下一棵树,究竟在“种”什么?
0/160
(全国两会)一部法律,一张新时代民族工作的“导航图”
0/153
(全国两会)清晰坐标、温暖底色,“十五五”启航
0/160
(全国两会)“代表通道”映照前进的中国
0/169
(全国两会)创新动能不断积蓄 四川加快重塑对外开放格局
0/156
(全国两会)特写:两会公文包里的中国
0/157
(全国两会)蓝图深度对接 港澳与国家发展“同频共振”
0/153
(全国两会)两会展现大陆对台新动向:反“独”更主动 促融更清晰
0/155
(全国两会)8天人代会,在确定性中看见中国未来
查看TA的全部帖子>>
又创新高,阿里通义开源模型Qwen2.5进入大模型盲测全球前十
时间:2024-9-30 09:47
0
929
|
复制链接
|
互动交流
显示全部楼层
阅读模式
直达楼层
马上注册,结交更多好友
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
9月29日消息,基准测试平台Chatbot Arena日前公布最新大模型盲测榜单,10天前发布的阿里通义千问开源模型Qwen2.5再次闯入全球十强,其大语言模型Qwen2.5-72B-Instruct排名LLM榜单第十,是前十唯一的中国大模型;Qwen系列视觉语言模型Qwen2-VL-72B-Instruct排名Vision榜单第九,是得分最高的开源大模型。
同一时间,全球开源社区基于Qwen系列二次开发的衍生模型数量突破7.43万,超越Llama系列衍生模型的7.28万。通义千问Qwen成长为世界最大的生成式语言模型族群,在Hugging Face社区的开源模型权威榜单Open LLM Leaderboard上,Qwen系列及其衍生模型包揽了前十全部座次。
不论是模型性能还是生态影响力,Qwen都创造了中国开源大模型的历史。
Qwen2.5-72B-Instruct排名Chatbot Arena大语言模型榜单第十
Chatbot Arena是由开放研究机构LMSYS Org推出的大模型性能测试平台,自2023年5月推出以来一直是世界顶级大模型的最重要竞技场。平台目前集成了全球70多个大模型,采用匿名方式将大模型两两组队,交给用户进行盲测,用户根据真实对话体验对模型能力进行投票。
9月19日发布的Qwen2.5迅速进榜,旗舰模型Qwen2.5-72B-Instruct得分位列LLM榜单第十,居于OpenAI的o1、GPT-4o等模型之后,是得分最高的中国大模型;同天开源的视觉语言模型Qwen2-VL-72B-Instruct闯入Vision榜单第九,略逊于GPT-4o、Gemini-1.5-Pro等闭源模型,是成绩最好的开源模型。此前Qwen系列已有多款开源模型闯入Chatbot Arena榜单。
Chatbot Arena官方发文,Qwen2-VL-72B-Instruct是排名最高的开源视觉语言模型
Qwen2.5的发布在海内外开源社区引发一场狂欢,这套开源模型涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,几乎所有尺寸的模型都实现了同等规模业界最佳性能,发布10天下载量超过150万。有国外开发者称赞通义千问称得上是真正的“开放AI”;有用户测评发现Qwen2.5从0.5B到72B都是SOTA水平,于是发起话题:“大家都用Qwen2.5替换了那些常用模型?”
海外开源社区盛赞Qwen2.5
雷峰网
回复
举报
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
点我进行验证
本版积分规则
发表回复
回帖后跳转到最后一页
关闭
站长推荐
/1
【菲龙网】邀你共享2026央视春晚
菲龙网邀你共享2026央视春晚
查看 »
扫码添加微信客服
快速回复
返回列表
返回顶部