着眼三个维度,亚马逊云科技降低生成式AI应用门槛

作者:梅雅鑫 责任编辑:王鹤迦 2023.12.18 16:05 来源:通信世界全媒体

通信世界网消息(CWW)在这场生成式AI浪潮中,不少企业纷纷将目光投向了人工智能和机器学习。全球IT研究与顾问咨询公司Gartner发布的“2024年十大战略技术趋势报告”显示,到2026年,超过80%的企业都会接入生成式AI或大模型,然而这一比例在2023年初还不到5%。

虽然许多企业都希望能顺势抓住红利,但无论是成本还是技术壁垒,大模型的门槛之高,都会把许多企业拒之门外。亚马逊云科技作为云计算的开拓者和引领者,在生成式AI端到端的3个不同层面展开持续投入,最底层是训练和推理的基础设施层,中间层是所有的微调模型需求的工具服务,上层是构建生成式 AI 应用层。

image.png

“我们始终将企业的严苛要求置于产品设计理念的首位,坚信并实践着这一理念,确保我们是企业构建和应用生成式AI的最佳选择。”亚马逊云科技大中华区产品部总经理陈晓建在2023亚马逊云科技re:Invent中国行北京站演讲时表示,亚马逊云科技为千行百业应用生成式AI降低门槛,重塑每个产业,改变每个人的生活。这其中就包括如何兼顾规模与成本,真正让业务收益,如何选择最适合业务场景的模型,如何用企业自己的数据定制并快速行动,当然还有如何充分保护数据的安全隐私的前提下负责任的应用生成式AI。

自研芯片创新升级,夯实基础设施层

在13年前,亚马逊云科技就看到了GPU这种加速计算芯片的价值,也是第一个把GPU带入到云上的云供应商,现在GPU服务器已经广泛用于HPC、视频、AI的工作负载等等多种应用。

“要提供生成式AI的基础训练性能,企业不仅需要GPU芯片,还需要一个真正高性能的服务器集群来训练所需的基础模型。”陈晓建表示,针对基础模型训练和推理,亚马逊云科技推出了专为生成式 AI 和机器学习训练设计的云端 AI 芯片 Amazon Trainium2,与第一代Trainium相比,它的性能大幅提升了四倍,特别针对于数千亿甚至数万亿参数的大模型训练做了特别的调优。

据了解,在本次re:Invent 2023全球大会上,亚马逊云科技和英伟达共同宣布了几项最新合作:亚马逊云科技将提供首款搭载NVIDIA Grace Hopper超级芯片和亚马逊云科技UltraClusters技术的云AI超级计算机;首款使用NVIDIA最新芯片GH200 NVL32 的NVIDIA DGX云即将登录亚马逊云科技;两家公司共同开展“Project Ceiba”合作项目, 将全球最快的GPU驱动AI超级计算机和NVIDIA DGX云超级计算机用于NVIDIA AI的训练、研发、定制化模型的开发,它将拥有1.6万个最新的GH200超级芯片,提供高达65 ExaFLOPS的惊人算力。

除了底层芯片的创新,模型训练的环境也需要改善。陈晓建认为,当下的大模型训练一定是通过分布式训练来做,但是在分布式环境下可能会遇到单台机器故障、节点失联等情况,客户必须能够实时地去识别、隔离、修复和重新配置训练环境。这些过程都带来训练的复杂性,而大大降低训练的效率。

为此,亚马逊云科技推出了Amazon SageMaker HyperPod工具,可大规模加速基础模型训练,能够缩短高达40%的训练时间,并可以确保持续数周或数月的训练过程不中断。通过Amazon SageMaker HyperPod,能够自动管理多达上千台机器的大规模训练环境,自动检测和定位硬件故障,并且能够更换故障的实例和更改配置来自动规避所遇到的这些问题。它们还能自动备份,从上次所保持的检查点来恢复训练。

服务托管Amazon Bedrock,降低生成式AI应用门槛

“各行各业客户的需求千变万化,不会有任何一个大模型能够满足所有要求。”陈晓建强调,模型选择得太复杂,可能是“杀鸡用牛刀”;而选择一个能力不足的模型,不足以达到企业的要求。

在模型选择方面,亚马逊云科技推出全托管式生成式 AI 服务 Amazon Bedrock,Amazon Bedrock是利用大模型构建和扩展生成式人工智能应用的最简单方法,这是中间工具层的创新。通过Amazon Bedrock,用户可轻松访问来自 AI21 Labs、Anthropic、Cohere、Meta、Stability AI 和亚马逊的多种行业领先大语言模型和其他模型,以及客户构建生成式AI应用程序所需的广泛的功能,包括确保隐私和安全的同时简化开发。

此外,亚马逊云科技还提供了 Titan Multimodal Embeddings 和 Amazon Titan Image Generator 为客户使用模型构建生成式 AI 应用程序提供更多选择和灵活性。Amazon Titan 模型由 Amazon Bedrock 独家提供,由亚马逊云科技在适用于各种用例的大型且多样化的数据集上创建和预训练,并内置对负责任地使用 AI 的支持。“如果正式可用的 Amazon Titan 模型或其输出的内容侵犯了第三方版权,亚马逊将对使用这些模型的客户进行赔偿。”陈晓建强调。

在陈晓建看来,企业创造真正价值的生成式人工智能应用程序的关键就是能够用企业自己的书据进行定制,用数据进行定制才能构建企业的差异化壁垒。Amazon Bedrock新发布的持续预训练功能、微调功能、具有知识库的检索增强生成功能可帮助客户使用自己的数据私密且安全地定制模型,以构建差异化的生成式 AI 驱动的应用程序。

总之,Amazon Bedrock可以为客户提供了更多行业领先的模型选择和评估模型新功能,以简化客户使用相关和专有数据定制模型的方式;提供自动执行复杂任务的工具;并为客户配备了提供负责任地构建和部署应用程序的保障。

据了解,Amazon Bedrock 的这些新功能为千行百业、各种规模的企业应用生成式 AI 的方式都带来改变,助力企业激发创新并重塑客户体验。Amazon Bedrock 在两个月前推出,目前已经吸引了超过 10000 名来自各个行业的活跃客户使用Amazon Bedrock 来快速构建和扩展生成式 AI 应用,在实现简化开发的同时确保隐私性和安全性,极大地降低了客户从基础模型到构建生成式 AI 应用的门槛。

量身定制AI助手Amazon Q,释放生成式AI潜能

开发者和IT人员需要跟上最新的技术发展,快速设计和交付新功能,管理应用程序和工作负载端到端的生命周期,并在维护既有产品和构建新功能之间平衡优先级。所有这些都需要开发者和 IT 人员进行大量工作,这会分散他们的核心注意力。

为了帮助他们简化任务、加速决策和解决问题,并帮助激发工作中的创造力和企业创新。亚马逊云科技推出Amazon Q,Amazon Q由亚马逊云科技 17 年来积累的知识和经验训练而成,改变了开发者和 IT 人员在亚马逊云科技上构建、部署和运维应用程序和工作负载的方式。Amazon Q是一种新型生成式 AI 支持的助手,专门用于满足办公场景需要,可以根据客户业务进行定制。客户可以快速获得复杂问题的相关答案、生成内容并采取行动 - 所有这些都基于客户自身的信息存储库、代码和企业系统的见解。

陈晓建表示,Amazon Q 是亚马逊云科技优良架构框架、最佳实践、文档和解决方案实施的专家,使客户能够更轻松地探索新服务和功能、学习不熟悉的技术、构建解决方案、发现问题、升级应用程序等,而且能够更快上手。

具体而言,Amazon Q可以在Amazon CodeWhisperer中回答开发人员的各种代码相关的问题并附上可一键实施的代码,并提供代码转换功能可以将应用维护和升级时的代码转换所需时间从几天缩短至几分钟。

虽然许多应用场景和行业将受益于生成式 AI 的变革潜力,但目前可用的解决方案通常是通用的,并不具备执行专业领域任务所需的特定上下文。为了充分发挥生成式 AI 的优势,客户需要针对其应用场景或行业专门构建的解决方案。因此,亚马逊云科技将 Amazon Q 引入多种服务和应用程序,让 Amazon Q 成为企业业务的专家、商业智能专家、联络中心专家。

首先,作为企业业务的专家,Amazon Q拥有40多个兼容流行数据源的内置连接器,并支持自定义连接器,企业可以轻松将其连接至其业务数据和系统中。陈晓建强调,Amazon Q可使用身份验证系统来确认用户职能和访问权限,并支持指定话题屏蔽或关键词过滤等管理控制功能。

其次,作为商业智能专家,Amazon Q支持将其引入多种服务和应用中以提供基于生成式AI的帮助。 将Amazon Q引入BI应用Amazon QuickSight中,它能够在几秒钟内响应用户要求,创建精准且美观的月度业务变化的相关描述。

最后,亚马逊云科技将Amazon Q引入云联络中心应用Amazon Connect中,它能够根据实时对话检测客户问题,并能够自动回复、给出建议以及提供相关资料,该功能现已正式可用。

从底层基础设施到中间工具层,再到顶端应用层,亚马逊云科技展现了生成式AI的巨大潜力和创新空间生成式AI都能为我们提供前所未有的创造力和灵感,而亚马逊云科技在本次re: Invent 2023上发布的产品和新工具,为开发者提供了更完整、更灵活的开发环境和技术堆栈。

通信世界网版权及免责声明:
1、凡本网注明“来源:通信世界全媒体”及标有原创的所有作品,版权均属于通信世界网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非通信世界网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。
发表评论请先登录
...
热点文章
    暂无内容