Sora按下元宇宙加速键,运营商需把握发展新机

责任编辑:王鹤迦 2024.06.07 08:15 来源:天翼智库

通信世界网消息(CWW)OpenAI多模态文生视频大模型Sora的发布,加速元宇宙虚实融合场景构建、变革元宇宙内容生产模式以及推动元宇宙新经济体系规范构建。基于对Sora如何加速元宇宙落地的分析,进一步挖掘生成式人工智能时代运营商发力元宇宙的机遇,并为提出相关建议。

Sora为元宇宙落地按下加速键

2024年2月,OpenAI发布多模态文生视频大模型Sora,其深度语义理解、物理世界模型、跨场景超长视频的行业领先能力,将会加速推动元宇宙落地。

(一)Sora推动虚实融合场景的构建及优化,提升元宇宙沉浸交互体验。

一是Sora通过数据增强的方式能准确理解长达135个单词的提示,深入理解场景、角色和故事情节,并将其转化为生成指令。同时,Sora的Transformer Diffusion Model能够生成高质量、连贯的视频内容。Transformer的自注意力机制捕捉视频数据的复杂时空依赖关系,确保生成视频的连贯性。Diffusion Model通过将噪声转化为细节,生成具有丰富细节和叙事效果的高清视频(分辨率高达2048×2048),构建高度仿真元宇宙场景。SDEdit技术保持视频的3D一致性及稳定性,且能根据需求进行实时渲染及动态调整,智能优化更具沉浸感的虚拟环境。

二是Sora可根据虚拟现实终端的屏幕纵横比,生成相匹配的任何尺寸的高清视频,解决了元宇宙内容供给与XR设备兼容性差、适配不足的问题。如Sora可生成与Apple Vision Pro匹配的内容,通过Apple Vision Pro的超高像素显示能力、更成熟、更适人化的人机交互技术,为用户带来元宇宙3D沉浸视听的感知跃迁,打造自由参与、身临其境的元宇宙强交互入口。

(二)Sora变革3D沉浸视听内容生产模式,丰富多样化应用场景。

一是面向传媒、影视等内容行业,降低3D沉浸视听内容制作技术门槛,变革内容生产模式。相较于传统视频制作中动捕、拍摄、渲染环节等对摄影师、剪辑师等专业人员的强依赖,Sora赋能创作者基于多模态文生视频模型,深度分析大量的文学作品、影视剧本以及用户反馈指令,解决视频或图像构思等难题,优化后期编辑、制作及合成等流程,零门槛、低成本快速产出视频,提升元宇宙3D数字内容的创作效率及降低创作成本。

二是Sora通过创建高逼真的视频序列,生成多样化数字孪生训练场景及协作平台,缓解真实世界数据匮乏的限制,推动对产业元宇宙对垂类、细分领域的生产赋能。如:在工业元宇宙领域中,Sora融合行业知识,在实际生产前,通过多次生产仿真更快速、更准确地规划高度复杂的生产系统、快速定位操作故障,为行业生产提质增效。

(三)Sora推动平台经济向创作者经济演进,加速元宇宙新经济体系规范构建。

一是推动平台经济向创作者经济演进。Sora能根据用户的偏好及行为对生成的视频实时动态调整,使得内容的消费者也是视频内容的生产者,重构业务主导权与价值体系,推动平台经济向创作者经济演进,收益模式由流量货币化向内容货币化转变。

二是加速内容生成和传播的规范体系构建。Sora训练所需的大量数据推动数据要素价值化的同时,也面临数据来源、泄露、数据篡改/伪造等真实性及合法性的挑战。如:OpenAI CTO Murati在接受采访时对Sora训练数据来源含糊其辞。同时,基于生成式人工智能的内容也存在侵权争议及合规等问题,倒逼内容生产与传播的相关监管技术及规范加速完备。

Sora为运营商布局元宇宙带来新机遇

Sora类生成式人工智能加速元宇宙落地的同时,也为运营商发力元宇宙赛道带来新机遇、提出新要求。

(一)沉浸式产业发展离不开基础设施的支撑,加大了对运营商融合、泛在、灵活的算力网络供给需求。

相较于传统大语言模型,Sora需要近百倍的算力用以支撑Transformer架构的实时渲染及沉浸式计算,以及5ms级时延、99%帧可靠性、Gbps上行的超宽带、低时延、高可靠确定性网络能力用以实现音视频的实时编辑及沉浸式交互。同时,图形渲染、空间计算等业务推动算力向边缘扩展。元宇宙时代打造网云数智安边端多要素融合、跨域编排、灵活调度的智能算力供给体系,成为运营商满足业务需求、提升运营效率、塑造企业核心竞争力的关键。

(二)基于多模态的视觉大模型平台及服务将成为MaaS新范式,赋能运营商加速在产业元宇宙的落地。

Sora生成视频的同时,还帮助计算机更好地理解和处理图像,加速了人工智能从LLM(大规模语言模型)向LVM(大规模视觉模型)转变。未来LVM将成为AI主流形态,赋能行业打造新质生产力。

在内容生产领域,视觉模型为内容生产基础模型,以工具形态向软硬耦合、质量效率兼顾的精细化方向发展,赋能游戏、影视/广告/短视频创作等领域降低视频制作技术门槛及成本,变革视频内容生产模式。在垂类场景方面,基于生成式人工智能的轻量级多模态视觉大模型平台及服务将成为MaaS新模式,助力运营商加速深入产业元宇宙垂类场景,提高全要素生产率,实现生产力的跃升。

(三)平台责任向内容生成和传播扩展,提升了对运营商加速构建生成式AI内容安全屏障的责任要求。

随着Sora类的生成式人工智能发展,平台责任从单纯关注“内容传播”向"内容生成和传播”拓展,增加了平台监管难度。近年来我国相继出台的《互联网信息服务算法推荐管理规定》、《互联网信息服务深度合成管理规定》 等监管规范对算法备案、AI生成/合成内容标识等提出要求。2023年发布的《生成式人工智能服务管理办法(征求意见稿)》希望通过制定新的监管规范促进生成式人工智能健康发展和规范应用。作为企业、网络运营商、以及内容平台生产者,运营商肩负着用户信息保护、网络安全保障、平台监管等安全责任,构建“技术+制度”的融合措施将成为运营商落实生成式AI内容安全的关键举措。

运营商应把握元宇宙加速落地机遇相关建议

建议运营商从基础设施建设、应用及场景创新拓展、以及内容安全管理切入,优化元宇宙赛道布局。

(一)加强算网基础设施的部署与升级,筑牢元宇宙沉浸式产业发展底座。

一是提升网络运力。坚持网为基础,选取产业成熟、业务集中区域,进行骨干网400G 及以上超大容量光传输网络研发小规模部署,重点推进算力网络400G全光传送网规模化应用,提升骨干传送网络运力。二是深化边缘算力。加强硬件、基础软件、应用软件等国产化软硬适配协同,将算力进一步下沉,形成浅边缘-深边缘-最边缘的多级算力布局。三是强化算网融合。积极推进算力度量、算力路由、算网编排、算力交易、确定性网络等算网融合技术创新突破,优化算力资源调度及一体编排能力。打造云网数智安边端多要素融合、跨域编排、弹性供给的网络化和任务式的多样化智能算力供给体系,高效适配元宇宙业务的发展。

(二)以价值为导向做深向实,拓展元宇宙应用向“线”状行业场景迈进。

一是做深“AI+”能力。在核心技术上,与行业合作伙伴联合,加强专为AI和高级图形处理优化的国产化专业AI芯片研发以及与算法的适配,加强高性能云渲染、云化增强现实技术的研发,加快构建基于轻量级LVM能力的云渲染平台,并集成到大模型中,以工具形式赋能元宇宙内容生产。二是做实场景价值。基于政企场景及行业积累,拓展产业元宇宙特质的高价值应用场景,如:工业、交通等,联合生态建设跨领域跨环节的模拟仿真与协同开发环境,强化大模型与跨领域行业数据及知识的融合与兼容,并将多模态视频大模型能力封装成“量体裁衣、普惠适用”的行业大模型解决方案,加速推动运营商元宇宙“点”状业务应用向“线”状行业场景迈进。

(三)积极探索构建“AI工具+制度管理”相结合的安全保障措施,实现内外赋能。

一是强化数据管理。遵循隐私保护原则,严格筛选和清洗训练数据。加强水印、元数据等技术对人工智能生成内容进行适当的标注,实现对数据源的管理和质量控制。二是落实主体责任。建立健全用户注册、算法机制机理审核、科技伦理审查、信息发布审核、数据安全、个人信息保护、反电信网络诈骗、应急处置等管理制度,打造“AI工具+制度管理”相结合的安全保障措施。三是加强内容管理。对标行业AI工具,如:内容检测类的GPTdetector,内容审核过滤类的Content Moderator等,将其作为安全核心工具加载到行业通用大模型中,用以识别生成式AI生产的内容来源或真实性。建立健全用于识别违法和不良信息的特征库,记录并留存相关网络日志。对内赋能企业强化内容监管和审核,对外以产品及服务形式赋能行业实现创收。


通信世界网版权及免责声明:
1、凡本网注明“来源:通信世界全媒体”及标有原创的所有作品,版权均属于通信世界网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非通信世界网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。
发表评论请先登录
...
热点文章
    暂无内容