英伟达自毁CUDA门槛!15行Python写GPU内核,性能匹敌200行C++

量子位 量子位 ·

英伟达发布CUDA 13.1,推出CUDA Tile编程模型,使开发者仅需15行Python代码即可实现相当于200行C++的GPU性能。这一变化降低了GPU编程的门槛,吸引更多数据科学家参与,但也引发了对CUDA“护城河”被削弱的担忧。

原文中文,约2200字,阅读约需6分钟。
阅读原文