中文通用大模型基准测试 SuperCLUE 发布，讯飞星火认知大模型国内第一报道 - 驱动中国网

首页
热点
家电
数码
业界
财经
云计算
游戏
机器人
资讯
科技

首页>机器人 > 正文

中文通用大模型基准测试 SuperCLUE 发布，讯飞星火认知大模型国内第一报道

来源: 时代财经　发布于：2023-05-10 16:10:28

【资料图】

5月9日，中文通用大模型综合性评测基准 SuperCLUE 正式发布。该基准测试主要关注以下问题：中文大模型在不同任务上的表现如何？与国际代表性模型相比，中文大模型的表现达到了何种程度？中文大模型与人类表现相比如何？

该模型可通过多个层面，考验市面上主流的中文 GPT 大模型的能力：

基础能力: 包括了常见的有代表性的模型能力，如语义理解、对话、逻辑推理、角色模拟、代码、生成与创作等 10 项能力。

专业能力: 包括了中学、大学与专业考试，涵盖了从数学、物理、地理到社会科学等 50 多项能力。

中文特性能力: 针对有中文特点的任务，包括了中文成语、诗歌、文学、字形等 10 项多种能力。

该机构利用 SuperCLUE 测试基准，对市面上主流的支持中文的通用大模型进行了评测与排名。从排名中我们可以看出，GPT-4 一骑绝尘，已经非常接近人类的能力。国产大模型中讯飞科技研发的星火认知大模型总排名第三，国内排名第一。

以下为该机构公布的各个子项目的具体得分。排行榜会定期更新，并于CLUEbenchmarks 官方网站进行公示。

关键词：

猜你喜欢

中文通用大模型基准测试 SuperCLUE 发布，讯飞星火认知大模型国内第一报道

送培训进企业扎实开展双百行动

山西省朔州市2×100万千瓦“上大压小”煤电项目_焦点信息

涨价也阻挡不了中国人对黄金的爱！一季度金条销售创2019年来新高世界热推荐

环球最资讯丨小米新专利摄像头可旋转伸缩手机可实现全面屏

机构：5月30城房租收入比为29% 长沙等5城租房压力小-当前热点

从“网红”到“长青” 小小一碗螺蛳粉是如何实现产业进阶的？

今日快看!5G技术种出“智慧辣椒” 中国金控(00875)子公司从玉农业新品从玉软香辣椒上市

从用户实际体验出发，鲁大师2023评测沟通会发布全新久用流畅测试|全球即时看

10日券商力推的十大金股(名单)

天天报道:VR全景直播+H5！天舟六号物资收集还差一份你的助力！

每日焦点！国家林草局：以下一代互联网技术助力旗舰物种保护

2023年河南省涉台知识网络大赛系列活动圆满落幕热议

【全球播资讯】4名肇事者被抓！哈尔滨、广州高楼装修拆承重墙现场调查

户外广告销售拜访客户成功签单的6个步骤6大绝招实战秘笈|世界观焦点

苹果芯片战略的又一个“受害者” 当前头条

马斯克：推特很快将支持通话、加密私信等功能当前播报

又崩了？苹果回应

环球头条：疯狂联盟12本阵型文件下载-疯狂联盟12本布局图

天天短讯！草莓洗完了如何保鲜草莓洗完了如何保存新鲜呢

业界

送培训进企业扎实开展双百行动
机构：5月30城房租收入比为29% 长沙等5城租房压力小-当前热点
10日券商力推的十大金股(名单)
2023年河南省涉台知识网络大赛系列活动圆满落幕热议

送培训进企业扎实开展双百行动
机构：5月30城房租收入比为29% 长沙等5城
10日券商力推的十大金股(名单)
2023年河南省涉台知识网络大赛系列活动圆满
天天短讯！草莓洗完了如何保鲜草莓洗完了

财经

三去一降一补是什么时候提出来的？三去一降一补具体指什么？
在线教育的收入来源主要有哪些？在线教育概念龙头股票有哪些？
开高铁需要报考什么专业？开高铁工资多少一个月？
农机股票龙头股有哪些？农机展会2023年具体时间

三去一降一补是什么时候提出来的？三去一降
在线教育的收入来源主要有哪些？在线教育概
开高铁需要报考什么专业？开高铁工资多少一
农机股票龙头股有哪些？农机展会2023年具体
铁路股票龙头股有哪些？铁路股票龙头股排名

云计算

苹果芯片战略的又一个“受害者” 当前头条
你是人类还是AI？傻傻分不清楚_新动态
每日快报!AI精准“算病”，将“癌症之王”扼杀在摇篮中
环球速看：怎样才能实现绝对零度？

苹果芯片战略的又一个“受害者” 当前头条
你是人类还是AI？傻傻分不清楚_新动态
每日快报!AI精准“算病”，将“癌症之王”
环球速看：怎样才能实现绝对零度？
AI读取大脑，还破译了人们的内心独白

联系邮箱：897 18 09@qq.com

Copyright © 2004-2017 驱动中国网版权所有备案号：豫ICP备2021032478号-5