随着ChatGPT引爆的AI热潮逐渐升温,“时代风口”的智能红海对云计算的平台实力提出了更具高度的思考——如何通过高效、安全且具有弹性的云基础设施,深度服务于行业业务数字化创新,从而在瞬息万变的市场竞争中把握机会,实现业务增长。
近年来,中国云计算产业呈现持续高速增长的态势,年增速超过30% ,是全球增速最快的市场之一,并逐渐成为全球云计算市场的前沿阵地。
这一趋势中也凸显了一个鲜明的事实:智能经济的快速发展,带动了大量企业加速适配上云进程,云上规模效应与提速效应气势如虹。
响应智能时代的云力量
作为全球云服务的“行家里手”,亚马逊云科技凭借其敏捷、弹性、高效、安全等等特质为企业降低成本、提高业务转化能力、加速企业创新输出了强有力的云力量!同时,亚马逊云科技顺应中国行业企业出海机遇,以安全合规等方式加快了以数据为底座的创新输出。
显然,对于亚马逊云科技而言,这是对时代发展的响应,更是对市场强需求的理解。
“现今创新至关重要,而云技术能更快、更高效地帮助企业创新亚马逊云科技广泛和深入的服务可以让客户摆脱基础架构的束缚,专注于创新。” 亚马逊云科技大中华区产品部总经理 陈晓建如是说。
创新,对于当下的千行百业而言充满了机遇与挑战。亚马逊云科技敏锐的洞察到了AI创新风潮带来的算力爆发、基础设施云化升级、简化算力应用等技术需求,通过自身的云力量为行业用户使能,助力其更好的驾驭AI的当下与未来。
正如陈晓建所言:“面对算力的需求井喷所带来挑战,亚马逊云科技通过自研芯片提供更好的性价比,通过各种丰富的计算、网络、存储等各种产品的组合应对突发的算力需求,通过Serverless有效降低运维的复杂性,从而简化算力的使用,全面满足用户的多样化的算力需求。”
众所周知,算力是云上数字化转型进程中的核心生产力资源。它的强弱决定了行业转型的步调。
在陈晓建看来,算力需求井喷正在呈现三个特点:需要更高性价比的软硬件解决方案以应对算力资源紧缺;云服务需要提供快速高效的弹性资源供给,以应对生成式AI的迅速发展和快速变化的业务需求;云服务需要进一步降低使用门槛,让客户能快速上手。
“亚马逊云科技在为客户提供广泛的机器学习能力方面有着悠久的历史,过去10年间提供每一个级别的机器学习能力,包括底层芯片、Amazon SageMaker机器学习服务和开箱即用的AI服务。” 亚马逊云科技 全球产品副总裁 Matt Wood如是说。
计算性能升级转化井喷算力
针对算力需求紧缺,亚马逊云科技一方面全面提供深入的基础设施能力,与Intel、AMD、英伟达共同累积了芯片计算的合作经验;另一方面,亚马逊云科技通过自研的CPU及加速芯片产品持续为云用户提供强力的计算服务。
其中,作为亚马逊云科技的第一款自研芯片产品,去年推出的第五代Nitro已将每瓦性能提高了40%:同时,Nitro通过硬件虚拟化,整个性能损耗不到1%;实现了网络和存储在硬件级别的隔离机制;在硬件层面实现了硬件的加密,最大限度保证用户数据通信的安全。
另外,基于Arm架构的通用处理器Graviton 3与上一代产品相比,计算性能提高多达25%,浮点性能提高多达2倍,加密工作负载性能最多加快2倍。第四代产品Gravtion3E则在针对高性能计算应用场景的向量计算性能上,再提升了35%。
为支持大规模机器学习训练工作负载,Trainium 芯片也展现出了过人的能力:
例如,HuggingFace BERT模型作为案例来看,基于Trainium的Trn1实例和通用的GPU实例对比,在训练的吞吐率上面,单节点的吞吐率可以提升1.2倍,而多节点集群的吞吐率可以提升1.5倍,从成本考虑,单节点成本可以降低1.8倍,集群的成本更是降低了2.3倍。
同时,增强型Trn1n实例的网络带宽跃升至1.6Tbps,可将万余个Trainium芯片构建在一个超大规模集群上,实现对超大模型进行并行训练。
与Trainium师出同门的机器学习推理芯片Inferentia,在其第二代版本实现了更强大的优化——大规模部署复杂的模型,例如大型语言模型(LLM)和Diffusion类模型。
针对弹性资源供给,亚马逊云科技提供600多种不同的计算实例,从处理器、网络和存储等各种服务都能够与计算进行很好的结合,以积木的方式搭建出一个丰富灵活的计算实例的资源,满足多种不同算力的要求。以存储为例,数据规模到达PB级别时存储方式变得非常重要,“热、温、冷、冻”不同类型的存储方式,成本和性能都有很大差别。Amazon S3对象存储提供8种存储层级,同时提供智能分层,自动选择最适合的存储层级。
在简化算力应用上,亚马逊云科技始终不渝地云服务全面迈向Serverless。事实上,亚马逊云科技所实现的全栈数据服务Serverless化极具便捷性——让客户无需预置或管理基础设施,就可以运行几乎任何类型的应用程序或后端服务代码,帮助客户最大限度减轻运维工作,并增加业务敏捷性,更好地应对业务的各种不确定性。
助力行业解锁生成式AI
随着生成模型的不断发展和应用领域的扩大,越来越多的企业和组织开始意识到生成式AI的潜力和价值。从娱乐、创作、广告到教育、医疗、金融等各行各业,都在积极探索和应用生成式AI技术。这种市场需求的增加推动了生成式AI市场的蓬勃发展。
亚马逊云科技 全球产品副总裁 Matt Wood认为,生成式AI在过去6-8个月时间里所呈现的大爆发趋势表明,大语言模型可以接受复杂的输入,并产生复杂的输出。亚马逊云科技深信生成式AI在重塑各行各业,它可以突破以前无法突破的极限。生成式AI的典型场景包括:创意输出,如写作、设计、编码、建模等;功能增强,如搜索、总结、排序等;全新的交互式体验,可产生新的知识和想法,以及通过聊天机器人提供开放的知识;决策支持,在人工监督下自动执行复杂任务。
科幻作家威廉·吉布森说“未来已至,只是还没有均匀分布”,亚马逊云科技始终希望将拥有广阔前景的且令人兴奋的技术提供给每个人,在云计算时代我们提供通过API访问云上应用的快捷访问,这一愿景不会因为生成式AI的出现而改变,我们希望将这项技术交到每一个构建者和每一个商业用户的手中。
那么,千行百业的用户该以何种姿势正确解锁生成式AI价值?亚马逊云科技给出的答案既有方法更有实践:
首先,用户需要实现对一流基础模型的访问,而Amazon Bedrock则提供了这一能力:这项新服务允许用户通过 API 访问来自 AI21 Labs、Anthropic、Stability AI 和亚马逊的基础模型。在 Amazon Bedrock上,用户可以通过可扩展、可靠且安全的亚马逊云科技托管服务,访问从文本到图像的一系列强大的基础模型;
其次,用户需要安全私密的环境去定制模型,而Amazon Titan模型库,可实现文本归纳总结、搜索结果嵌入、有害内容删减等,用户可以非常安全、隐私地对这些模型做优化和微调;
第三需要通过定制芯片提供低成本和低延迟访问,推理芯片Inferentia和训练芯片Trainium即可实现用户所要获得的吞吐率和延迟的优化。
第四需要搜寻机会提升使用体验:代码生成服务——Amazon CodeWhisperer,支持包括Java、JavaScript和Python等在内的15种不同的编程语言,个人用户可免费使用。在测试中,与未使用CodeWhisperer的参与者相比,使用CodeWhisperer的参与者完成任务的速度平均快57%,成功率高27%。
数据赋能提升生成式AI应用价值
数据在生成式AI中起着至关重要的作用,其作为训练和提升生成模型性能的基础,助力生成式AI提升学习概率分布和模式,以生成新的内容。
那么,高质量、多样性与合规数据如何与生成式AI适配,从而产生高质量、创造性的输出?亚马逊云科技的方法论为千行百业提供了指引参考:
一、通过全面的工具集,满足现在和未来所需。亚马逊云科技推出15种专门构建的云上托管数据库服务,为各类用户的应用场景提供完美契合的数据服务;亚马逊云科技的分析服务已全面实现Serverless化,包括交互式查询服务Amazon Athena、大数据处理服务Amazon Managed Streaming for Apache Kafka (Amazon MSK)、实时分析服务Amazon Kinesis、数据仓库服务Amazon Redshift、数据集成服务Amazon Glue、商业智能服务Amazon QuickSight以及运营分析服务Amazon OpenSearch Service。
二、借助轻松集成,连接所有数据。亚马逊云科技提出了Zero-ETL的愿景,致力于实现无缝的数据转换和调用,而用户不用编写任何的代码。我们最近推出了Aurora新的服务——Amazon Aurora可以与Amazon Redshift进行Zero-ETL集成,允许使用 Amazon Redshift 对来自Aurora的PB级事务数据进行近实时分析和机器学习 (ML)。事务数据在被写入Aurora后的几秒钟内,即可用在Amazon Redshift中,因此您不必构建和维护复杂的数据管道来执行提取、转换和加载 (ETL) 操作。
三、构建端到端的数据治理。通过数据治理,加速并保障数据流通。亚马逊云科技去年推出的一项全新的数据管理服务Amazon DataZone,可以让客户更快、更轻松地对存储在亚马逊云科技、客户本地和第三方来源的数据进行编目、发现、共享和治理。借助Amazon DataZone,管理员和数据资产管理者可以使用精细的控制工具管理和治理数据访问权限,确保数据访问发生在正确的权限和正确的情境之下。
无论是受益于云服务,亦或是顺AI大势“武装”业务能力,中国企业凭借自身的创新力在全球大展拳脚,这也由此印证了一个事实:更高,布局更广德的IT架构越受到行业用户青睐。
显然,亚马逊云科技从中心到边缘,从全球基础架构到快速部署稳定系统的能力,以及全面支持全球各个国家和地区业务合规能力,都成为用户心中创造坚实底层架构的基石。
之所以被称为无处不在的云服务,是指亚马逊云科技提供的高度安全可靠的云基础架构,让创新能够快速抵达每一个角落,为客户提供支持业务创新的算力,并能很好地支持客户的全球化布局战略。我们希望客户无论何时何地,都可以使用相同的基础设施、服务、API和工具。如今,亚马逊云科技全球31个区域的99个可用区,可以覆盖245个国家和地区。
快速部署可靠系统的能力对于行业用户而言,意味着后者能够在较短的时间内完成系统的构建、配置和部署过程,且避免故障的发生。
亚马逊云科技CTO Werner Vogels曾说,“Everything fails, all the time”。所有的功能模块都有可能出故障,我们不能完全避免故障的发生,但是我们通过努力,把风险降到最低。
亚马逊云科技从区域隔离、控制面与数据面解耦、蜂窝架构、随机分片再到服务责任模型等维度,为提高客户满意度、减少成本、增强业务竞争力,立下汗马功劳。
值得一提的是,在助力企业出海进程中,亚马逊云科技几乎满足全球所有监管机构的合规性要求,支持143项安全标准与合规认证。我们有超过300种安全合规服务,帮助我们各行各业的客户能够更方便的搭建满足全球各地安全和合规要求的架构。
亚马逊云科技深信:对云技术的前沿探索,正为全球各行各业、各种类型的客户加快数字化转型和创新提供生产力。亚马逊云科技提供了全面和深入的服务和功能,其拥有从计算、存储和网络到机器学习和量子技术的200多项至广至深的服务,为用户提供全方位的支持。
在业界看来,亚马逊云科技所释放出的云力量,不仅能驾驭AI的未来,更能为千行百业带来前所有未有的“因构建,而可见”之感!