跟着东说念主工智能 (AI) 工夫的迅猛发展,云规划鸿沟正在经验权贵变革。愈发复杂的 AI 应用对规划处分决策的性能、截至和老本效益建议了更高条目。在云表部署责任负载的客户正在从头评估其所需的基础阵势,以餍足当代责任负载需求,其中不仅包括提高性能和裁减老本,还涵盖了需适应监管条目或可络续发展标的的新能效基准。
Arm 与亚马逊云科技 (AWS) 弥远互助,为完了性能更苍劲、更高效和可络续的云规划提供专用芯片和规划工夫。在近期举行的 AWS re:Invent 2024 大会上,AWS 进一步展示了 AWS Graviton4 所获得的权贵进展,使树立者和企业大略充分施展其云责任负载的性能后劲。
独特的性能发达
相较于上一代 Graviton3 处理器,基于 Arm Neoverse V2 平台的 AWS Graviton4 处理器在规划性能上种植了 30%,中枢数加多了 50%,内存带宽提高了 75%。凭借这些工夫上风,AWS Graviton 处理器在生态系统和客户群体中得到了平时应用。
Arm Neoverse V2 平台涵盖 Armv9 架构的新特点,包括高性能浮点和向量提醒扶直,以及 SVE/SVE2、Bfloat16 和 INT8 MatMul 等特点。这些特点为 AI/机器学习 (ML) 以及高性能规划 (HPC) 责任负载提供了独特性能。
AI/ML 责任负载
本年早些时候,Arm 与主流的 AI 框架和软件生态系统互助,推出了 Arm Kleidi 软件,以确保Arm 平台上开机即用的推感性能优化能惠及悉数 ML 栈,树立者无需掌捏荒谬的 Arm 专科学问即可构建其责任负载,从而进一步激动 AI 责任负载的平时应用。此前,Arm 已展示了 PyTorch 中的这些优化何如赋能 AWS Graviton4 上启动大言语模子(LLM),如 Llama 3 70B 和 Llama 3.1 8B,并权贵改善了每秒生成词元 (token) 数和词元初次反馈时间的发达规划。
HPC 和 EDA 责任负载
关于 HPC 责任负载,Graviton4 相较于 Graviton3E 在功能上完了了权贵种植。每个中枢的主内存带宽加多了 16%,每个 vCPU 的 L2 缓存容量翻倍。这些更正关于 HPC 应用的性能至关迫切,因为 HPC应用频频受限于内存带宽。AWS 还是在这些鸿沟获得了权贵上风,如下所示。
凭证 Arm 工程团队试验启动 EDA 责任负载所得出的截至,Graviton4 提供的 RTL 仿真责任负载性能比 Graviton3 逾越 37%。
图:AWS Graviton4 上的 HPC 和 EDA 责任负载上风
生态系统平时继承
频年来,跟着云规划用户将各式云责任负载部署在 AWS Graviton 处理器上,其软件生态系统络续膨胀。如斯一来,客户不仅省俭了用度,获利了性能的种植,还能优化其碳踪迹和可络续发展踪迹。以下是部分示例:
图:继承基于 Arm Neoverse 的 AWS Graviton3 所获得的生态上风
入部属手附近 Graviton 的巨大性能
Arm 将在云规划的以前中施展关节作用,并将链接扶直 AWS Graviton 立于工夫翻新的前沿。Arm 将链接插足并进一步强化软件生态系统,从而使树立者大略愈加爽快地在 Arm 平台上构建其应用,并充分附近 Arm 规划平台所提供的独特性能和截至上风。
- 乌军复制八路军战术?挖2米战壕困住俄军,无东谈主机投弹挨个补刀2024-12-25
- 卢卡申科随口线路核好意思妙,普京的“尚方宝剑”,能让北约有来无回2024-12-25
- 五角大楼论说夸大中国兵力,称中国核弹头将超千枚,酬酢部辩驳2024-12-25
- 好意思军海上换装导弹,备战围堵中国?台媒强行碰瓷,开脱军圮绝融合2024-12-25
- 12月25日神马转债下降0.71%,转股溢价率20.97%2024-12-25
- 12月25日天业转债上升0.21%,转股溢价率62.01%2024-12-25