软通华方推出3700四卡液冷工作站,具备1120T INT8推理算力和384GB显存,支持复杂AI任务。液冷技术降低噪音50%,提升能效,助力智慧教育发展。
达摩院在ICLR 2025上发布了DyDiT架构,通过智能资源分配将DiT模型的推理算力减少51%,生成速度提升1.73倍,几乎无损生成质量。该架构动态调整计算,解决了传统模型的算力冗余问题,并已开源,适配多种生成任务。
《2024 中国开源开发者报告》分析了大模型基础设施的未来趋势,指出推理算力需求上升对大模型应用的影响。报告提出通过存换算和全系统异构协同推理来平衡效果、效率与成本,以促进大模型的广泛应用。
Jeff Dean与Noam Shazeer回顾了谷歌25年的AI发展,讨论了推理算力的未来和模型架构的灵活性。他们认为AI算力相对便宜,未来将采用模块化架构,允许不同团队独立开发。Shazeer提到某些bug可能带来意想不到的积极效果,并分享了在谷歌的快乐时光及对AI潜在风险的担忧。
完成下面两步后,将自动完成登录并继续当前操作。