腾讯全面开放自研混元大模型,更可靠、更成熟

作者:梅雅鑫 责任编辑:王鹤迦 2023.09.07 11:43 来源:通信世界全媒体

通信世界网消息(CWW)继百度文心大模型、阿里巴巴通义大模型发布之后,业界对腾讯的大模型一直抱以期待。今天,在2023腾讯全球数字生态大会上,腾讯混元大模型正式发布,至此,BAT正式会师大模型赛道。

image.png

腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示,腾讯将迈入“全面拥抱大模型”时代:“以大模型生成技术为核心,人工智能正在成为下一轮数字化发展的关键动力,也为解决产业痛点,带来了全新的思路。腾讯产业互联网将通过智能增强、数据增强、连接增强,持续助力产业增强。”

image.png

腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生

持续投入2300亿,夯实自主可控“技术底座”

“腾讯深信产品为王,坚定做扎实的技术,构建性能卓越、自主可控的云产品体系。”汤道生表示,五年来,腾讯的研发投入超过2300亿,在核心数字科技的许多领域,实现了性能的突破。在音视频领域,腾讯编码器在MSU世界大赛中,一次性包揽了全部15个世界冠军。结合了腾讯云高性能的星星海服务器、深度优化的操作系统Tencent OS与自研数据库TDSQL,腾讯云在最近一次TPC-C性能测试中,创下了每分钟支撑8.14 亿笔交易的世界纪录。

此外,腾讯在人工智能、云原生、音视频通讯、区块链、网络安全等领域,在全球获得专利授权3.3万件,申请总数超过6.6万件,位列中国企业第一名,全球第二。

值得一提的是,腾讯提出聚焦产品,在生态体系中做好数字化工具的提供者,将集成、交付、销售等环节,更多交给生态伙伴,请伙伴“唱主角”。目前,腾讯和1万1千家生态伙伴展开紧密合作,推出覆盖100多个产业场景的行业解决方案,共同服务千行百业。而腾讯的冠军产品,广泛适配和被集成到伙伴的系统中,成为伙伴破局的“尖刀”。

去年,生态伙伴收入占到腾讯云整体收入的三分之一,收入增速是腾讯云增速的4倍。

全链路自研, 混元大模型更可靠、更成熟

腾讯混元大模型是由腾讯全链路自研的通用大语言模型,拥有超千亿参数规模,预训练语料超2万亿tokens,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。

据腾讯集团副总裁蒋杰介绍,腾讯混元大模型从第一个token开始从零训练,掌握了从模型算法到机器学习框架,再到AI基础设施的全链路自研技术。

image.png

腾讯集团副总裁 蒋杰

从2021年开始,腾讯先后推出千亿和万亿参数的NLP稀疏大模型,打破CLUE三大榜单记录,实现在中文理解能力上的新突破。

目前,业界大模型在场景中的应用依然有限,主要集中在容错率高、任务简单的休闲场景。腾讯在算法层面进行了一系列自研创新,提高了模型可靠性和成熟度。

针对大模型容易“胡言乱语”的问题,腾讯优化了预训练算法及策略,让混元大模型的幻觉相比主流开源大模型降低了30%至50%;通过强化学习的方法,让模型学会识别陷阱问题;通过位置编码优化,提高了超长文的处理效果和性能;提出思维链的新策略,让大模型能够像人一样结合实际的应用场景进行推理和决策。

此外,腾讯还自研了机器学习框架Angel,使训练速度相比业界主流框架提升1 倍,推理速度比业界主流框架提升1.3倍。

得益于全链路自研技术,腾讯混元大模型能够理解上下文的含义,并且有长文记忆能力,可以流畅地进行专业领域的多轮对话。除此之外,它还能进行文学创作、文本摘要、角色扮演等内容创作,做到充分理解用户意图,并高效、准确的给出有时效性的答复。

在中国信通院《大规模预训练模型技术和应用的评估方法》的标准符合性测试中,混元大模型共测评66个能力项,在“模型开发”和“模型能力”两个重要领域的综合评价均获得了当前的最高分。在主流的评测集MMLU、CEval和AGI-eval上,混元大模型均有优异的表现,特别是在中文的理科、高考题和数学等子项上表现突出。

融入产业场景,释放数据最大价值

腾讯混元大模型是“从实践中来,到实践中去”的实用级大模型。蒋杰表示:“我们研发大模型的目标不是在评测上获得高分,而是将技术应用到实际场景中。腾讯将全面拥抱大模型。”

目前,混元大模型已经接入腾讯50多个业务并取得初步效果,包括腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等业务和产品。

其中,腾讯会议基于混元大模型打造了AI小助手,只需要简单的自然语言指令,就能完成会议信息提取、内容分析等复杂任务,会后还能生成智能总结纪要。据实测,在指令理解、会中问答、会议摘要、会议待办项等多个方面,混元大模型均获得较高的用户采纳率。

“以大模型生成技术为核心,人工智能正在成为下一轮数字化发展的关键动力,也为解决产业痛点带来了全新的思路。大语言模型让人机交互体验变得更简单,理解意图与操控系统的能力也更强大,大幅度提升数字化在产业中的可用性、易用性。”在汤道生看来,大模型需要基于产业场景,与企业数据融合,才能释放出最大的价值。

为此,腾讯推出了“腾讯云MaaS服务”,在腾讯云行业大模型精选商店中,不仅提供混元大模型,还上架了20多种行业最新、最流行的开源通用大模型,以及覆盖金融、文旅、零售、政务、医疗、教育等20多个领域的行业大模型。

企业可以根据需要,选择合适的模型,然后借助腾讯云智能的TI平台,导入企业专有数据,做进一步的训练与精调,快速生成更有针对性的专属大模型,满足企业个性化需求。

同时,腾讯也将大模型与腾讯的行业解决方案、企业级应用结合,在生产、营销、售后服务、办公等多个环节,实现能力提升,达至降本增效。

最近,腾讯云也全面接入Llama 2、Bloom等20多个主流模型,和混元一样,都支持直接部署调用。客户可以根据实际需求,基于混元、也可以基于开源模型,打造自己专属的行业大模型。

“在探索未来的道路上,腾讯愿与伙伴携手,共同探索大模型等全新行业机遇,持续拓展下沉市场,坚持打磨‘好产品’,拥抱‘被集成’,搭建‘数字化大舞台’,请伙伴当好主角,共建产业智能未来。”汤道生最后强调。

通信世界网版权及免责声明:
1、凡本网注明“来源:通信世界全媒体”及标有原创的所有作品,版权均属于通信世界网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非通信世界网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。
发表评论请先登录
...
热点文章
    暂无内容