AWS 宣布 EC2 P5e 实例正式上线，搭载 NVIDIA H100 Tensor Core GPU

InfoQ ·

AWS 宣布 EC2 P5e 实例正式上线，搭载 NVIDIA H100 Tensor Core GPU

💡 原文英文，约500词，阅读约需2分钟。

📝

内容提要

亚马逊云服务（AWS）推出了搭载NVIDIA H100 Tensor Core GPU的Amazon EC2 P5e实例，提升了人工智能、机器学习和高性能计算（HPC）应用的计算基础设施。P5e实例具有更高的性能、成本效益和可扩展性，配备了8个H200 GPU，提供更大的GPU内存和带宽。支持3200 Gbps网络和低延迟的Amazon EC2 UltraClusters。可用于大规模语言模型（LLM）训练和推理，以及高性能模拟，如天气预报、基因组研究和流体动力学建模。

🎯

关键要点

亚马逊云服务（AWS）推出了搭载NVIDIA H100 Tensor Core GPU的Amazon EC2 P5e实例，提升了人工智能、机器学习和高性能计算（HPC）应用的计算基础设施。
P5e实例在性能、成本效益和可扩展性方面相较于前代P5实例有显著提升。
P5e实例配备8个H200 GPU，提供更大的GPU内存和带宽，支持3200 Gbps网络和低延迟的Amazon EC2 UltraClusters。
可用于大规模语言模型（LLM）训练和推理，以及高性能模拟，如天气预报、基因组研究和流体动力学建模。
H200 GPU的更高内存带宽使得数据处理更快，降低推理延迟，适用于实时应用如对话AI系统。
用户可以利用AWS Deep Learning AMIs（DLAMI）支持P5实例，快速开发可扩展的机器学习应用。
Azure和Google Cloud也提供类似的高性能实例，适用于HPC和AI/ML工作负载。
随着生成性AI需求的增长，GPU在大型软件公司中的重要性日益增加。
目前，P5e实例在美国东部（俄亥俄州）AWS区域通过EC2容量块可用。

🏷️

继续阅读

AWS在EC2实例上引入嵌套虚拟化
AWS最近宣布支持在KVM和Hyper-V虚拟化的EC2实例中嵌套虚拟机，适用于C8i、M8i和R8i实例，主要用于应用仿真和硬件模拟。开发者可以运行移动...
当地媒体称伊朗使用无人机袭击AWS数据中心是故意为之因为AWS为美国提供情报支持
伊朗无人机袭击亚马逊AWS数据中心，称其为美国及盟友提供军事支持，导致中东多国企业服务中断。亚马逊建议客户备份和迁移数据，官方未承认责任，可能影响未来投资。
EP205：CPU与GPU与TPU的比较
支持多客户端，网页和移动应用可请求不同数据。网页客户端使用GET /v2/home获取详细信息，移动客户端使用GET /v1/home获取轻量响应。网关负...
如何在生产工作负载中使用 Docker Compose — 配置文件、监控模式和 GPU 支持
Docker Compose 近年来更新显著，新增配置文件、监控模式和GPU支持，使其适用于复杂部署场景。通过配置文件管理环境、监控模式加速开发及健康检查...
技术获 NVIDIA、Pi 双重认可！原力灵机 DM0 模型重塑具身智能新范式
原力灵机 DM0 模型通过 MemoryVLA 和 Real-time VLA 技术，获得 NVIDIA 和 Pi 的认可，显著提升了机器人的智能和反应速...
OpenAI在1100亿美元多云交易中为Frontier平台获得AWS分销权
OpenAI宣布获得1100亿美元融资，亚马逊投资500亿美元成为其云平台独家分销商，重塑OpenAI的云战略。Azure保留无状态API的独占权，AWS...

AWS 宣布 EC2 P5e 实例正式上线，搭载 NVIDIA H100 Tensor Core GPU

内容提要

关键要点

标签

继续阅读