AI与科技出海生态平台

生成式AI的魔法世界,需要哪些充满魔力的云服务来构建?

作为当今科技领域的热点之一,AI在各个行业展现出了前所未有的推进力。英国著名科幻作家亚瑟克拉克的第三定律中这样表述:任何非常先进的技术,初看都与魔法无异。

智能时代,如果说AI是无数数字化拥趸手中的“魔法棒”,相信没有人会提出质疑,因为数智化的世界需要AI的“魔法”变革之力来构建,进化,成长!

亚马逊云科技大中华区产品总经理陈晓建

成为生成式AI世界最有力的构建者

“今天就是成为构建者的绝佳时机,因为今天我们所有人都有幸处在下一个技术变革的伟大时代。我们每个人的创新,都将对世界产生深远的影响,改变行业,甚至改变人类的生活。因此,当您在了解到亚马逊云科技的这些工具、产品、解决方案和合作伙伴后,我想你们会想知道如何利用好这些开发应用程序。”亚马逊云科技大中华区产品总经理陈晓建在2024亚马逊云科技中国峰会上如是说。

2024亚马逊云科技中国峰会召开之际,也是生成式AI在全球,特别是在中国蓬勃发展的阶段。对于许多中国的行业用户而言,在生成式AI时代,他们需要的云服务不仅要强大和高效,还要灵活、安全、可靠,能够支持快速创新和业务扩展。

显而易见,亚马逊云科技多年来的持续投入和创新,已成为企业实施生成式AI应用的理想选择。

诚然,科技重塑每一个时代,每一项技术创新,都伴随着几十年的发明和新想法的诞生。例如:互联网使亚马逊能够建立在线零售业务,最终服务于世界各地数亿客户。亚马逊云科技所开创的云计算,帮助任何规模的公司从世界任何地方启动和扩展自己的业务。

杰夫·贝索斯(Jeff Bezos)曾说,“我们不只是要想我们现有的优势,还要努力找到新的方式来为客户服务。”

今天,亚马逊云科技在全球的33个地区提供超过200项全功能的服务,每项服务都旨在消除创新障碍,降低创新门槛。Amazon S3成为众多用户上云的第一步,从存储开始步入云计算驱动的数字化转型。2023年re:Invent全球大会上发布了AmazonS3 Express One Zone,使开发人员和数据科学家能够更高效的利用GPU的资源,提升工作的效率,此外,亚马逊云科技还在不断优化自研芯片和处理器,为客户的应用程序提供更好的性价比。

亚马逊云科技在数智化时代的种种创新努力,都在印证着:其持续不断的让AI这一充满科技“魔法”深入到用户的应用场景中。 

三层生成式AI技术栈到底有何“魔力”

为了助力企业生成式AI应用落地,亚马逊云科技打造三层生成式AI技术栈:底层即是以GPU和自研芯片为代表的基础设施,用于基础模型的训练以及在生产环境中运行推理;中间层是以Amazon Bedrock为代表的,提供可以访问所需基础模型,以及构建和扩展生成式 AI 应用程序的工具;顶层则是以Amazon Q为代表的,利用基础模型构建的开箱即用的生成式AI应用程序,用户无需任何专业知识即可快速上手生成式 AI。

在业界看来,三层技术栈各司其职,层层递进,相互使能。

一、底层基础设施,聚焦基础模型训练和推理

众所周知,生成式AI创新中,训练和推理工作负载消耗了大量算力,为了使生成式AI应用在经济上可行, 客户需要在专门构建的、高性价比的芯片和计算实例去运行训练和推理工作负载。

例如,以训练500亿参数量的模型为例,需要提供1T(1万亿)token的数据量,如果用一张A100的GPU需要74年的时间才能完成,而用2048张GPU则只需要13天。StabilityAI训练Stable Diffusion用了4,000张A100 GPU,而Meta训练Llama3则使用了超过16,000张A100 GPU。

除此之外,要应对如此大规模的模型训练,底层基础设施不仅需要算力的大规模升级,网络性能、存储系统等都需要同步适配。

为此,Amazon UltraCluster 提供了超大规模,超高带宽以及超高稳定的高性能计算集群。而FSx for Lustre和S3 提供了高性能的存储的稳定方案。这些方案与亚马逊云科技上广泛的编排选项结合,允许客户以最习惯的开源框架进行代码开发及部署。

值得一提的是,由英伟达和亚马逊云科技联合打造的Project Ceiba ,搭载超过2万个英伟达最新的Grace架构Blackwell 200 超级芯片和第四代 EFA 网络,每个超级芯片可提供高达 800 Gbps 的网络带宽,其AI算力将能达到惊人的 414 exaflops。

而亚马逊云科技中国区域也正式推出了基于英伟达A10G GPU 的Amazon EC2 G5 实例,以帮助中国区的客户运行生成式AI工作负载提供更好的性价比。Amazon EC2 G5的性能是Amazon EC2 G4DN的三倍,而推理性价比则提升了40%。推出以来已经有很多客户在使用EC2 G5 实例,来处理基于Llama基础模型的微调与推理等工作负载。

在自研芯片上,过去五年里,亚马逊云科技在定制芯片领域的投资带来了机器学习训练和推理成本的大幅下降,其中,基于Amazon Trainium的Trn1 EC2实例和基于Amazon Inferentia芯片的Inf2 EC2实例,与类似的基于英伟达GPU的Amazon EC2实例相比,可分别将训练成本降低高达50%(Trn1),推理成本降低高达40%(Inf2)。

亚马逊云科技定制芯片的优势不仅体现在成本和性能上,还体现在可持续性上。客户能够减少训练和推理所需的资源,其中Amazon Inferentia2可以将深度学习推理能效提升高达50%,Amazon Trainium可以将深度学习训练能效提升高达25%。

由此可见,亚马逊云科技在定制芯片领域的投资不仅带来了显著的成本和性能优势,还提升了能效和可持续性,增强了技术自主性和市场竞争力。这种战略布局和技术创新将对其未来的发展和市场表现产生深远影响。

而在加速大规模分布式训练任务,以及帮助用户更快地实现模型开发和部署上,Amazon SageMaker HyperPod 的正式可用,直接为用户在生产效率、成本效益、市场竞争力、技术前沿和用户体验等多个方面的实现了重要提升。与之相伴,Amazon SageMaker Jumpstart则提供了模型选择、深度模型定制和评估等功能。

此次峰会,亚马逊云科技也正式宣布:零一万物的Yi-1.5 6B/9B/34B的基础模型在中国区域正式上线SageMaker Jumpstart,同时来自百川智能的Baichuan-2 7B基础模型也即将上线中国区域的SageMaker Jumpstart,为开发生成式AI应用提供更多基础模型选择。

二、加速生成式 AI 应用构建的中间层

作为亚马逊云科技推出的一个托管服务,Amazon Bedrock旨在简化和加速生成式 AI 应用的开发和部署。Bedrock 提供了对多个基础模型的访问,开发者可以方便地使用这些模型来构建生成式 AI 应用,而无需担心底层基础设施的复杂性。

例如,用户可以通过单一的API访问来自AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI和亚马逊等领先人工智能公司的高性能基础模型。这些人工智能公司承诺亚马逊云科技的客户可以通过Amazon Bedrock在第一时间使用和访问其未来发布的最新基础模型。

陈晓建强调,Amazon Bedrock是使用基础模型构建和扩展生成式AI应用程序的最简单方式,几乎所有行业的客户都在使用Amazon Bedrock重塑他们的用户体验、产品和流程,将生成式AI融入到他们的核心业务中。

Amazon Bedrock提供四大差异化价值——模型选择、模型定制、应用集成和负责任AI,让生成式AI触手可及。模型选择上,客户基于Llama, Mistral和Flan T5等开源架构微调过的私有模型也可以导入到Bedrock进行全托管,而无需管理底层基础设施。

例如,Claude 3模型是Anthropic在2024年3月发布的业界领先基础模型之一,作为Anthropic和亚马逊云科技的战略合作的一部分,Amazon Bedrock也同步首发了Claude 3模型家族的产品,今天,包括Claude 3 Haiku 、Claude 3 Sonnet 和 Claude 3 Opus 都已经在Amazon Bedrock可用, 成千上万的客户已经通过Amazon Bedrock体验到了 Claude 3 在认知任务中树立的新基准,以及这些模型具有的无与伦比的智能、速度和成本效率。

另外,Llama 3 模型是Meta于2024年4月发布的业界领先的开源基础模型,其中Llama 3 8B 在文本摘要、分类、情感分析和翻译方面表现出色,极为适合资源有限的边缘设备,Llama 3 70B 在内容创作、对话式 AI、语言理解、研发、企业、准确摘要、情感分析、语言建模、对话系统、代码生成和指令遵循方面表现出色,Llama 3 8B 和70B 模型也是同样在Amazon Bedrock上第一时间同步可用。

通过自定义模型导入功能Custom Model Import for Amazon Bedrock,企业可以将基于Llama, Mistral和Flan-T5开发的定制模型导入到 Bedrock之中,以完全托管的 API方式进行访问。这一全新功能让企业既可以使用SageMaker来持续预训练或者微调一个定制化模型,又能够充分享受Bedrock的诸多模型管理功能,而无需管理底层设施。

值得一提的是,Amazon Bedrock提供了一套完整的功能,帮助企业基于私有的数据创建与业务相关的生成式AI应用。例如微调、持续预训练,检索增强生成(RAG)等,可以帮助客户利用企业系统和数据源定制个性化生成式AI应用。

在AI责任承担上,亚马逊云科技一直倡导负责任的人工智能——Responsible AI。以安全、可信和负责任的方式部署生成式AI是亚马逊在生成式AI领域的“最高行动纲领”。

亚马逊云科技承诺以负责任的方式构建服务,同时重点考虑公平和偏见、稳定性、可解释性、治理、透明度、隐私和安全性等6大方面。其中,在保护数据安全和隐私上,Amazon Bedrock承诺不会使用客户的数据来训练或改进原始的基础模型,微调模型时,亚马逊云科技将创建该模型的一个私有版本,将其放入安全的容器中,不会放在其他地方。

客户的数据也永远不会被暴露于公共互联网、永远不会离开亚马逊云科技的网络,它将通过虚拟私有云进行安全传输,并且在传输和存储时始终加密。在应用集成方面,Amazon Bedrock的Agent功能提供了一种工具,支持开发人员定义特定的任务、工作流程或决策过程,增强控制和自动化,同时确保与预期用例保持一致。Agents for Amazon Bedrock现已支持Claude 3 Sonnet和Haiku模型。

三、顶层创新,开箱即用的生成式AI应用

亚马逊云科技的生成式 AI 助手 Amazon Q 不仅是一款强大的工具,更是企业实现加速软件开发、发挥业务数据价值等目标的利器。

新发布的Amazon Q Developer、Amazon Q Business 和 Amazon Q in QuickSight均已正式可用。

Amazon Q Developer旨在协助开发人员完成繁琐重复的工作,让他们能够将更多时间专注于创新体验的开发,加快应用部署速度。其提供了广泛的使用案例,其中包括大规模消除技术门槛、提升开发者效率以及提升代码质量与安全性等关键类别。通过Amazon Q Developer,开发人员可以轻松升级Java版本和依赖项,大规模消除技术冗余,将数天的工作缩减为几分钟。此外,它还可以帮助解决整个软件开发生命周期中的繁琐和耗时任务,包括安全扫描、故障排除和单元测试生成等,从而提升开发效率和代码质量,为企业的持续创新提供坚实支撑。

而Amazon Q Business 则是为企业提供的一个强大的生成式 AI 平台,旨在让每个企业都能够获取到生成式 AI 的力量,从其所有数据(非结构化和结构化)中获得洞见,采取行动并构建应用程序。Amazon Q Business拥有四大应用场景,包括统一的对话检索式体验、生成总结与提炼关键发现、提升内容创作的效率以及简化任务流程。

值得一提的是,最新发布的Amazon Q Apps功能更是为企业带来了极大的便利。它可以帮助每位员工从对话到构建生成式 AI 驱动的应用程序只需几秒钟,从而更容易 streamline 和自动化日常任务。使用Amazon Q Apps创建应用程序极为简便,员工可以用自然语言描述他们想要的应用程序类型,或者只需告诉Amazon Q Apps从Amazon Q帮助解决问题的对话中执行即可。

结语

亚马逊云科技以其卓越的技术实力和前瞻的创新精神,为生成式 AI 应用的发展开辟了新的篇章。从底层基础设施到中间层工具,再到顶层开箱即用的应用,亚马逊云科技构建了完整的技术生态,助力企业在智能时代获得巨大的发展机遇。

致力于数智化转型的千行百业用户有理由相信,亚马逊云科技将继续以其独特的,充满魔力的技术优势和开放合作的态度,为全球及中国用户带来更多惊喜与成就。

 

赞(12)
未经允许不得转载:维端网 » 生成式AI的魔法世界,需要哪些充满魔力的云服务来构建?
分享到

AI与科技出海生态平台

联系我们关于维端

登录

找回密码

注册