DigitalOcean推出AMD Instinct MI300X GPU,支持AI工作负载,带宽高达5.3 TB/s,适用于AI、机器学习和高性能计算。该GPU可在单租户裸金属配置中使用,支持多种框架,提升计算效率。年底将推出GPU Droplets,便于按需扩展AI/ML工作负载。
AMD正在发送两台MI300X设备,显示其软件发展前景良好。与NVIDIA相比,AMD被低估,未来AI需求将推动其增长,MI300X有望超越H100。
随着AI模型参数增加,算力需求也在增长。Felafax公司通过简化AI训练集群,将训练成本降低了30%。他们使用JAX在AMD GPU上微调LLaMA 3.1 405B模型,展示了JAX在非英伟达硬件上的优势。JAX支持多硬件并行,适应性强,迁移方便。Felafax利用JAX的设备网格功能进行参数分片,优化内存和计算效率,并通过LoRA技术减少可训练参数,实现高效微调。相关代码已开源,并提供详细教程。
完成下面两步后,将自动完成登录并继续当前操作。