首页>机器人 > 正文
中文通用大模型基准测试 SuperCLUE 发布,讯飞星火认知大模型国内第一 报道
来源: 时代财经 发布于:2023-05-10 16:10:28


【资料图】

5月9日,中文通用大模型综合性评测基准 SuperCLUE 正式发布。该基准测试主要关注以下问题:中文大模型在不同任务上的表现如何?与国际代表性模型相比,中文大模型的表现达到了何种程度?中文大模型与人类表现相比如何?

该模型可通过多个层面,考验市面上主流的中文 GPT 大模型的能力:

基础能力: 包括了常见的有代表性的模型能力,如语义理解、对话、逻辑推理、角色模拟、代码、生成与创作等 10 项能力。

专业能力: 包括了中学、大学与专业考试,涵盖了从数学、物理、地理到社会科学等 50 多项能力。

中文特性能力: 针对有中文特点的任务,包括了中文成语、诗歌、文学、字形等 10 项多种能力。

该机构利用 SuperCLUE 测试基准,对市面上主流的支持中文的通用大模型进行了评测与排名。从排名中我们可以看出,GPT-4 一骑绝尘,已经非常接近人类的能力。国产大模型中讯飞科技研发的星火认知大模型总排名第三,国内排名第一。

以下为该机构公布的各个子项目的具体得分。排行榜会定期更新,并于CLUEbenchmarks 官方网站进行公示。

关键词:

猜你喜欢

  • 中文通用大模型基准测试 SuperCLUE 发布,讯飞星火认知大模型国内第一 报道
  • 送培训进企业 扎实开展双百行动
  • 山西省朔州市2×100万千瓦“上大压小”煤电项目_焦点信息
  • 涨价也阻挡不了中国人对黄金的爱!一季度金条销售创2019年来新高 世界热推荐
  • 环球最资讯丨小米新专利摄像头可旋转伸缩 手机可实现全面屏
  • 机构:5月30城房租收入比为29% 长沙等5城租房压力小-当前热点
  • 从“网红”到“长青” 小小一碗螺蛳粉是如何实现产业进阶的?
  • 今日快看!5G技术种出“智慧辣椒” 中国金控(00875)子公司从玉农业新品从玉软香辣椒上市
  • 从用户实际体验出发,鲁大师2023评测沟通会发布全新久用流畅测试|全球即时看
  • 10日券商力推的十大金股(名单)
  • 天天报道:VR全景直播+H5!天舟六号物资收集还差一份你的助力!
  • 每日焦点!国家林草局:以下一代互联网技术助力旗舰物种保护
  • 2023年河南省涉台知识网络大赛系列活动圆满落幕 热议
  • 【全球播资讯】4名肇事者被抓!哈尔滨、广州高楼装修拆承重墙现场调查
  • 户外广告销售拜访客户成功签单的6个步骤6大绝招实战秘笈|世界观焦点
  • 苹果芯片战略的又一个“受害者” 当前头条
  • 马斯克:推特很快将支持通话、加密私信等功能 当前播报
  • 又崩了?苹果回应
  • 环球头条:疯狂联盟12本阵型文件下载-疯狂联盟12本布局图
  • 天天短讯!草莓洗完了如何保鲜 草莓洗完了如何保存新鲜呢