机器之心 ·

登上Nature的AI芯片设计屡遭质疑，谷歌发文反击，Jeff Dean：质疑者连预训练都没做

💡 原文中文，约3500字，阅读约需9分钟。

📝

内容提要

谷歌回应了对其AI芯片设计AlphaChip的质疑，指出Cheng等人的研究未遵循其方法，缺乏预训练和计算资源，导致结果不佳。谷歌强调，AlphaChip的开源数据支持预训练，且其方法可完全复现。

🎯

🔎

谷歌强调，AlphaChip的核心优势在于预训练，这一过程使模型能够从先验知识中学习。Cheng等人未进行预训练，导致其结果不佳。这表明，在评估AI模型时，预训练的步骤不可或缺，忽视这一点可能导致对模型性能的误解。

Cheng等人在实验中使用的计算资源显著低于谷歌的标准，减少的计算能力直接影响了模型的训练效果。此案例提醒研究者，在进行模型复现时，确保计算资源与原始研究相匹配是至关重要的，否则可能得出不准确的结论。

Cheng等人使用的基准与AlphaChip所针对的技术节点存在显著差异，这使得评估结果缺乏代表性。选择合适的基准对于评估AI模型的有效性至关重要，研究者应确保所用基准与目标应用场景相符，以获得可靠的结果。

❓

谷歌指出Cheng等人的研究未遵循其方法，缺乏预训练和计算资源，导致结果不佳，并强调AlphaChip的开源数据支持预训练，且方法可完全复现。

Cheng等人未进行预训练、使用的计算资源不足、未训练到收敛，并且使用的基准与AlphaChip所用技术节点差异显著。

预训练使模型能够从先验中学习，提升布局效果，未进行预训练会导致模型性能显著下降。

谷歌表示AlphaChip完全开源，提供了软件存储库，允许社区检查、执行或修改代码以复现研究结果。

Cheng等人使用的计算资源少了20倍，GPU数量也减少了一半，这影响了训练效果。

谷歌批评Cheng等人未遵循其方法、缺乏预训练、计算资源不足、未训练到收敛，以及使用不具代表性的基准进行评估。

🏷️