小红花·文摘 - 小红花技术领袖俱乐部

软通华方超炫3700四卡液冷工作站，赋能教育应用新场景

软通华方超炫3700四卡液冷工作站，赋能教育应用新场景

全球TMT-美通国际 ·

达摩院在ICLR 2025上发布了DyDiT架构，通过智能资源分配将DiT模型的推理算力减少51%，生成速度提升1.73倍，几乎无损生成质量。该架构动态调整计算，解决了传统模型的算力冗余问题，并已开源，适配多种生成任务。

质量无损，算力砍半！达摩院开源视觉生成新架构，出道即SOTA｜ICLR 2025

量子位 ·

《2024 中国开源开发者报告》分析了大模型基础设施的未来趋势，指出推理算力需求上升对大模型应用的影响。报告提出通过存换算和全系统异构协同推理来平衡效果、效率与成本，以促进大模型的广泛应用。

推理中心化：构建未来AI基础设施的关键

dotNET跨平台 ·

Jeff Dean与Noam Shazeer回顾了谷歌25年的AI发展，讨论了推理算力的未来和模型架构的灵活性。他们认为AI算力相对便宜，未来将采用模块化架构，允许不同团队独立开发。Shazeer提到某些bug可能带来意想不到的积极效果，并分享了在谷歌的快乐时光及对AI潜在风险的担忧。

本想去谷歌捞一笔就跑，却成了改变AI历史的人｜Transformer作者对话Jeff Dean

量子位 ·