商汤新一代大模型“书生·浦语”2.0正式开源

作者:王鹤迦 责任编辑:王鹤迦 2024.01.17 15:53 来源:通信世界全媒体

通信世界网消息(CWW)1月17日,商汤科技与上海AI实验室联合香港中文大学和复旦大学正式发布新一代大语言模型书⽣·浦语2.0(InternLM2)。InternLM2 的核心理念在于回归语言建模的本质,致力于通过提高语料质量及信息密度,实现模型基座语言建模能力质的提升,进而在数理、代码、对话、创作等各方面都取得长足进步,综合性能达到开源模型的领先水平。

InternLM2是在2.6万亿token的高质量语料上训练得到的。相比于初代InternLM,InternLM2的各项能力获得全面进步,在推理、数学、代码等方面的能力提升尤为显著,综合能力领先于同量级开源模型。根据大语言模型的应用方式和用户关注的重点领域,研究人员定义了语言、知识、推理、数学、代码、考试等六个能力维度,在55个主流评测集上对多个同量级模型的表现进行了综合评测。

评测结果显示,InternLM2的轻量级及中量级版本性能在同量级模型中表现优异。沿袭第一代书生·浦语(InternLM)设定,InternLM2包含7B及20B两种参数规格及基座、对话等版本,满足不同复杂应用场景需求,继续开源,提供免费商用授权。

图片

InternLM2的轻量级及中量级版本性能在同量级开源模型中表现优异

通信世界网版权及免责声明:
1、凡本网注明“来源:通信世界全媒体”及标有原创的所有作品,版权均属于通信世界网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非通信世界网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。
发表评论请先登录
...
热点文章
    暂无内容