亚马逊云科技作为全球云计算的先驱与引领者,不仅持续推动云服务前沿创新,更在生成式AI领域屡次展示其卓越能力。近日举行的亚马逊云科技2024 re:Invent中国行北京站活动,再度彰显了亚马逊云科技在从芯片到模型、再到应用的全栈技术发展中,所取得的技术突破和云服务实力。
在业界看来,这种全面协同的创新模式,不仅能够满足当今企业日益复杂的技术需求,更有效地加速了前沿技术的应用和行业变革。
亚马逊云科技大中华区产品部总经理陈晓建认为,几乎所有的应用程序都可以分解成为几个核心的构建单元,亚马逊云科技所做的就是构建出非常优秀的核心单元,用户可以通过自由搭建这些核心单元,满足他们在特定场景下不同的业务需求。
同时,他强调,企业在选择生成式AI模型时,通常依据性能、功能和成本进行权衡,并根据不同任务要求选择合适的高性能或低成本模型。多模型策略已经在各行业中广泛应用,体现了亚马逊云科技在技术整合与优化上的前瞻性思维。
用技术升级迎接生成式AI的大潮
众所周知,生成式AI技术的创新步伐正在加快,亚马逊云科技不再局限于每年re:Invent大会发布重大特性,而是开始在其他时间段频繁推出新功能。以Amazon Bedrock为例,2024年仅在re:Invent期间便发布了21个关键特性,表明其持续推动技术前行的决心。
亚马逊预测,“智能体”已成为生成式AI应用的重要支柱,预计将在2025年迎来爆发式增长。生成式AI的实际应用需要借助智能体进行任务执行和与业务场景的交互,亚马逊云科技在Amazon Bedrock中引入了智能体及其协作功能,以解决这一领域的关键挑战。此外,Amazon Q也已在生成式AI功能上进行持续的迭代与更新,进一步强化了智能体在实际应用中的价值。
未来,企业将从原型验证阶段跃升至生产阶段,面临的技术需求和挑战将更为复杂。亚马逊云科技的目标不仅是提供广泛的生成式AI模型市场,更在于提供能确保模型推理顺畅运行所需的生产力工具与环境,真正释放生成式AI的潜力,提升生产效率,推动各行各业进入技术与业务的深度融合阶段。
沙利文大中华区总监李庆表示:本届re:Invent大会上的新发布更加侧重于产品的实际应用和工具优化,这表明过去一年中,全球用户正在积极使用亚马逊云科技进行生成式AI应用的探索和创新。本次更新有两个方面让我印象深刻:一是随着全球企业对生成式AI的深入应用,数据不仅实现跨区域的传输与协同,更实现跨地域、跨区域的深度连接;二是亚马逊云科技进一步优化生成式AI的应用,从数据存储、治理到管理的全流程提升,旨在简化 AI 对数据的使用,同时强化模型功能、增加AI agent 管理和应对模型幻觉的功能。此外,新发布的 Amazon Nova 大模型家族备受期待,这一系列的模型和亚马逊云科技的开放选择理念将为用户带来更多创新机会,进一步推动 AI 的发展。
re:Invent大会作为亚马逊云科技的重要年度盛会,至今已走过13年。每年,这场技术学习的盛会都会吸引大量技术人员、企业高管和合作伙伴参与。今年,大会吸引了近6万人现场出席,超过40万人通过在线平台观摩,成为业界瞩目的焦点。
早在2006年,初创企业便成为亚马逊云科技的首批客户。在过去的18年里,亚马逊云科技一直是初创企业最受青睐的云服务提供商,这一领先地位无疑将在未来持续巩固。在生成式AI蓬勃发展的时代,亚马逊云科技紧抓机遇,计划于2025年为初创企业提供超过10亿美元的云计算资源,进一步助力他们的成长与创新。
如今,亚马逊云科技已成为全球各行业大型企业的首选云服务提供商,服务数百万客户。秉承以客户为中心的原则,亚马逊云科技坚持“逆向工作”的理念,从客户需求出发推动技术创新,不断为客户创造价值。
亚马逊云科技深信:应用程序的本质在于核心构建单元的组合。我们的使命是提供卓越的服务,帮助用户以简单而灵活的方式搭建这些单元,满足不同场景下多样化的业务需求。这一方法不仅激发了客户的创新潜力,也不断拓展了云技术的应用边界。
计算与存储:驱动云计算的核心引擎
亚马逊云科技以领先业界的计算实例类型提供多样化解决方案,例如,Amazon EC2凭借更多选择和更高性价比满足多样化应用需求。
据悉,搭载Nvidia Blackwell芯⽚的Amazon EC2 P6实例系列在亚⻢逊云科技海外区域上线了,其计算性能较是当前GPU的2.5倍。
在⾃主研发的AI芯⽚领域,搭载Amazon Trainium2的Amazon EC2 Trn2实例现已正式在海外区域推出,与当前⼀代基于GPU的实例相⽐,Amazon Trainium2的性价⽐提升了30-40%。这样的性能表现是其他云服务提供商⽆法企及的。
据了解,每个Trn2实例都配备了16个Amazon Trainium2芯⽚,这些芯⽚通过NeuronLink的⾼带宽、低延迟互连技术相连,使单个实例能够提供⾼达20.8 Petaflops的计算性能。
在行业表现力上,Adobe在使⽤Trainium2测试其Firefly frontier图像模型时已获得了令⼈振奋的初步成果。Poolside计划在Trainium2上训练其未来的模型,预计训练成本可降低40%。Databricks作为全球最⼤的数据和AI公司之⼀,计划使⽤Trainium2为客户带来更好的效果,同时将总体拥有成本降低30%。⾼通也很看好Trainium2 能帮助开发者通过⾼通AI Hub构建具有成本效益的⾼性能模型,并实现在边缘设备上的便捷部署。
除此之外,Amazon EC2 Trn2 UltraServer通过NeuronLink互连技术将4个Trn2实例(共64个Trainium2芯⽚)连接在⼀起,单个计算节点的峰值计算性能超过83.2Petaflops。这不仅能为超⼤规模模型提供更好的推理性能,还能让构建超⼤规模训练集群的过程更加⾼效。
亚⻢逊云科技与Anthropic正在合作打造⼀个名为Rainier项⽬的EC2 UltraServer集群,该集群将使用数十万个Trainium2芯片,规模是其之前集群的五倍以上。另一则重磅消息是,亚马逊云科技计划于明年推出的Trainium3芯片采用3纳米工艺,性能提升2倍,能效提升40%,将以更低成本支持更高性能应用,持续引领计算创新。
亚马逊云科技通过不断优化计算服务,为用户提供更强大、更灵活的技术基础,推动行业持续进步。
自2006年推出以来,Amazon S3彻底变革了数据管理的方式。从存储架构设计之初,Amazon S3便着眼于应对数据的爆炸式增长。
十年前,仅有不到100家客户在Amazon S3中存储容量达到1PB。如今,这一数字已经飙升至数千家,甚至有客户的存储量突破了1EB。目前,Amazon S3存储的对象数量已超过400万亿。如此庞大的扩展能力早已成为客户的默认期望,但这不仅是规模的飞跃,还涉及如何高效管理成本。Amazon S3通过持续创新,让这一切变得更加简单而高效。
本次大会上,亚马逊云科技宣布Amazon S3 Tables正式可用,这是⼀种专为Iceberg表设计的全新存储桶类型 ,查询速度提⾼到3倍,与常规Amazon S3存储桶相⽐,每秒可处理事务数量提升到10倍。
同时,Amazon S3 Metadata元数据服务正式可用,这是⼀项全新服务,能帮助客户即时发现和理解Amazon S3中的数据,能够⾃动为客户创建可查询的元数据,并且⼏乎实时进⾏更新。
数据与AI并行驱动行业转型
亚马逊云科技为客户提供了多种专为特定场景构建的数据库服务,从关系型数据库到图数据库、文档数据库,应对广泛的业务需求。这些数据库工具不仅广受欢迎,还让许多原本无法实现的复杂工作负载成为可能。其中,关系型数据库仍然是许多应用的最佳选择,这也是我们在这一领域不断创新的原因。
今年是Amazon Aurora发布的第十周年。这款完全兼容MySQL和PostgreSQL的关系型数据库服务为客户提供了商业数据库级别的可靠性,同时具备开源数据库的可移植性。与自托管的开源数据库相比,Aurora性能提升3-5倍,成本仅为商业数据库的十分之一,成为企业可靠性与经济性兼顾的首选解决方案。
“一个理想的数据库方案应具备高可用性、跨区域部署支持、低延迟性能、强一致性、零运维负担,并完全兼容SQL。为实现这一目标,我们开发了一种全新的事务处理方法,通过将事务处理与存储层分离,显著提升了效率”。陈晓建强调,其所有写操作在提交阶段并行执行到各区域,确保强一致性;另外,其减少存储层查询次数,实现极速数据库写入性能。
值得一提的是,全新推出的Amazon Aurora DSQL数据库,结合Amazon Time Sync服务,采用无服务器架构,可在多区域实现几乎无限扩展,具备99.999%的高可用性和低延迟性能。DSQL完全兼容PostgreSQL,与其他分布式SQL数据库相比,读写速度提升4倍。
另外,Amazon DynamoDB Global Tables全球表现已支持多区域强一致性,使客户无论选择SQL还是NoSQL数据库,都能受益于主动-主动多区域部署,同时实现强一致性、低延迟和高可用性。
亚马逊云科技持续以创新推动数据库服务的发展,让客户能够灵活应对多样化场景的挑战,轻松实现数据驱动的业务增长。
在数据分析服务上,亚马逊云科技正在将所有这些组件整合起来,推出了新⼀代Amazon SageMaker,它现已成为满⾜客户所有数据、分析和AI需求的统⼀平台,其整合了最全⾯的数据、分析和AI⼯具集(包括⼤家熟悉且信赖的 SageMaker)。新的Amazon SageMaker涵盖了分析、数据处理、搜索、数据准备、AI模型开发和训练、⽣成式AI等所有必需功能。全部功能都可以通过统⼀的企业数据视图实现。
其中,Amazon SageMaker Unified Studio,现已开放预览。它可以访问企业数据并使用最合适的工具进行处理,整合了多种功能,支持创建包含AI或分析资源的共享项目,方便数据科学家、分析师和机器学习专家开展协同工作,同时内置数据目录和治理功能,通过安全控制确保组织中的不同用户只能访问其权限范围内的资源和数据。
同时,Amazon SageMaker Lakehouse,它为所有数据源提供简单统一的访问方式,兼容Apache Iceberg。用户可以在统一开发环境中轻松处理所有数据,也可以通过任何支持Apache Iceberg API的第三方AI或分析工具、查询引擎直接访问SageMaker数据湖仓。
而全新Zero-ETL与领先的软件即服务(SaaS)应用程序的集成,让客户无需复杂的数据管道,即可在Amazon SageMaker Lakehouse和Amazon Redshift中访问第三方SaaS应用程序的数据,并进行分析或机器学习。
值得一提的是,耳熟能详的Amazon SageMaker现在更名为Amazon SageMaker AI,并推出数项重要更新:Amazon SageMaker HyperPod现在提供30多个精选的模型训练配方,可适用于时下热门的一些公开可用模型,包括Llama 3.2 90B、Llama 3.1 405B和Mistral 8x22B。这些配方极大地简化了客户的入门过程;Amazon SageMaker HyperPod 灵活训练计划,借助这项功能,用户可以快速制定训练计划,自动预留资源、配置集群并创建模型训练作业,为数据科学团队节省数周训练新模型的时间。
HyperPod会根据用户的时间安排和预算,利用EC2容量块制定最优的训练计划;Amazon SageMaker HyperPod任务治理功能,用户可以轻松设定从实验、训练到微调等各类模型开发任务的优先级。该功能可将模型开发成本降低最多40%;用户可以直接在Amazon SageMaker中整合亚马逊云科技合作伙伴的热门AI应用。用户的数据始终在Amazon SageMaker开发环境的安全边界内,确保数据安全与隐私。
陈晓建认为,生成式 AI 推理将成为未来应用的核心构建块,需支持大规模推理平台,以利用专有数据、平衡性能、安全性和成本,其中模型选择至关重要。
新发布的 Amazon Nova 系列模型包括多种类型:Nova Micro:文本到文本模型,成本极低,提供低延迟响应,适用于高效的推理任务;Nova Lite:多模态模型,成本效益高,能够快速处理多种输入,如文本、图像和视频;Nova Pro:强大的多模态模型,兼顾准确性、速度和成本,适用于复杂的推理任务;Nova Premier:即将推出的高性能多模态模型,专为处理复杂推理任务和指导定制模型蒸馏而设计。
在型合作与扩展上,新发布的合作伙伴模型将很快上线 Amazon Bedrock。
Amazon Bedrock是构建和扩展生成式AI应用的关键平台,为客户提供将推理功能整合到生产环境所需的工具,已为客户带来价值。
最新发布的Amazon Bedrock推出延迟优化选项,基于Amazon EC2 Trn2实例,利用最新硬件和软件优化,可在多模型上实现更好的推理性能。用户指定推理请求优先级后,平台自动处理,该功能已面向特定模型开放预览,如Llama 405B模型在延迟优化版本中性能显著提升,Anthropic的 Claude 3.5 Haiku模型延迟优化版处理速度大幅提高。
同时,Amazon Bedrock推出模型蒸馏功能,用户只需提供示例提示,平台自动完成工作,通过蒸馏得到的模型运行速度提升到5倍,成本降低75%,显著提升生成式AI项目投资回报;另外,Amazon Bedrock 知识库支持GraphRAG,利用Amazon Neptune自动生成图谱,建立数据源关联,无需专业知识即可开发更全面的生成式AI应用,清晰展示连接和信息来源,提升事实验证透明度,通过API调用可让应用生成更准确响应。其还可预防模型幻觉引起的事实性错误,基于数学验证检查模型事实性陈述准确性并展示推理过程,如在保险领域可确保回答准确性。Amazon Bedrock多智能体协作功能,支持多个Agent协作处理复杂工作流程,为特定任务创建一系列独立Agent,创建监督Agent负责设置信息访问权限、决定任务执行方式并确保协作,用户无需单独管理Agent,可轻松处理复杂任务。
Amazon Q Business是⼀款功能强⼤的⽣成式AI助⼿,它既能充分利⽤公司内部数据,⼜能加快任务处理速度。Amazon Q可以连接企业数据源、亚⻢逊云科技、第三⽅应⽤和维基百科等各类业务系统,让用户能够在不同的数据孤岛中进⾏搜索、总结信息,并就相关内容展开对话。通过新API,独立软件供应商可访问Amazon Q Business索引功能,权限控制精细化,完全由客户⾃主管理,同时还能降低安全风险,实现多方共赢。
Asana、Miro、PagerDuty、Smartsheet和Zoo 等公司都已经在开发相关集成。而即将推出Amazon Q Business Automate功能,将帮助企业实现跨团队、跨应⽤的任务⾃动化。它采⽤了⼀系列经过训练的⾼级智能体来创建、编辑和维护⼯作流,使其更能适应各种变化。过去需要数周乃⾄数⽉才能搭建的⼯作流,现在只需⼏分钟就能完成,从⽀持⼤规模训练基础模型的强⼤⼯具,到能够彻底改变⽣产⼒的⽣成式AI助⼿。
作为云计算领域的先驱者,亚马逊云科技正通过前沿技术的持续突破,加速行业转型,帮助客户重新定义未来。2025 年,我们期待看到更多客户借助亚马逊云科技的全栈服务,将生成式 AI 应用落地到实际业务场景中,为全球创新注入新动力。