腾讯混元开源:升级模型矩阵,云上推出256k长文模型

责任编辑:王鹤迦 2024.05.19 22:23 来源:通信世界全媒体

通信世界网消息(CWW)近日,腾讯云对外公布大模型研发、应用产品的系列进展。据官方介绍,腾讯混元大模型能力持续升级,多个版本模型hunyuan-pro、hunyuan-standard、hunyuan-lite通过腾讯云对外开放,满足企业客户、开发者在不同场景下的模型需求,落地最优性价比模型方案。

其中,最大模型已拓展至万亿级参数规模,并在1B、3B、7B、13B等不同参数量下,均有布局。

升级后的腾讯混元,在国内率先采用混合专家模型 (MoE) 结构,模型总体性能相比上一代提升了50%,部分中文能力已追平GPT-4,在“时新”问题的回答表现上,数学、推理等能力上均有较大提升。

在腾讯云上,混元大模型也提供了万亿参数hunyuan-pro、千亿参数hunyuan-standard、百亿参数hunyuan-lite等多种尺寸的模型服务,目前已面向企业及个人开发者全量开放。

hunyuan-standard最新上线了支持256k超长上下文窗口的长文模型,具备单次处理超过38万字符的超长文本能力,在长文档的阅读理解和大规模数据分析方面展现出强大性能,能够为金融、医疗、教育、出行等行业的专业人士提供强有力的工作支持,显著提高工作效率。

在多模态能力方面,混元大模型也持续迭代升级。在生图领域,腾讯混元文生图基础架构已全面升级至Sora同款的DiT架构,支持中英文双语输入及理解,具备多轮绘图能力,测评结果国内领先;在生视频领域,腾讯混元支持文生视频、图生视频、图文生视频、视频生视频等多种视频生成能力,已经支持 16s 视频生成;在生3D层面,腾讯混元已布局文/图生3D,单图仅需30秒即可生成3D模型。

腾讯集团副总裁蒋杰宣布,腾讯混元大模型将拥抱开源。此前,混元文生图大模型已全面开源,仅3天时间就在Github上获得超千位开发者关注。多种尺寸的腾讯混元MoE模型也即将对外开源,可分别支持手机端、PC端、云/数据中心等多样化的部署场景。

腾讯云大模型知识引擎、图像创作引擎、视频创作引擎三大工具发布,打造大模型时代原生工具链,通过PaaS服务简化数据接入、模型精调、应用开发流程,助力企业更高效、简单地用大模型开发AI原生应用,快速接入生产场景。

腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示,通过打造高性能的模型、高效率的工具平台、高敏捷的场景应用、高可用的算力基础设施,以及强安全的模型环境,构建离产业最近的AI。


通信世界网版权及免责声明:
1、凡本网注明“来源:通信世界全媒体”及标有原创的所有作品,版权均属于通信世界网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非通信世界网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。
发表评论请先登录
...
热点文章
    暂无内容