当前关注："书生·浦语"：商汤科技推出1040亿参数的创新大型语言模型

来源: ITBEAR　发布于：2023-06-07 22:43:39

【资料图】

【ITBEAR科技资讯】6月7日消息，商汤科技与上海AI实验室近日联合香港中文大学、复旦大学和上海交通大学发布了一款名为"书生·浦语"的大型语言模型。该模型参数量达到1040亿，是当前千亿级参数的大语言模型之一。它基于一个包含1.6万亿token的多语种高质量数据集进行训练。

据报道，"书生·浦语"在全面评测中表现出色，在知识掌握、阅读理解、数学推理、多语翻译等多项测试任务上都表现优秀，并展现出强大的综合能力。尤其在综合性考试中，该模型在多项中文考试中的成绩超过了ChatGPT，甚至包括中国高考各科目的数据集。

据ITBEAR科技资讯了解，早在今年3月，商汤科技就发布了另一款名为"书生(INTERN)2.5"的多模态多任务通用大模型。据官方介绍，"书生2.5"具备通用场景下的高级感知和复杂问题处理能力，可以通过文本定义任务，并根据给定的视觉图像和任务提示语句提供相应的指令或作答。此外，它还能根据用户的文本创作需求利用扩散模型生成算法生成写实图像。

据悉，"书生2.5"在图文跨模态领域的性能表现得益于视觉、语言和多任务建模三种能力的有效融合。而这次最新发布的"书生·浦语"大语言模型与"书生2.5"大模型之间可能存在一定联系。

商汤科技与上海AI实验室的这一发布显示了大型模型在各行业中的普遍应用趋势。这些模型的出色表现为人工智能技术的发展带来了新的可能性，也为各领域的应用带来了更多机会和挑战。随着大模型的不断涌现，我们可以期待在语言理解、图像识别等领域取得更多突破。

关键词：