NVIDIA于2025年发布CUDA 13.1,引入cuTile编程模型,旨在简化GPU编程并降低开发门槛。cuTile支持Python,自动优化硬件性能,以满足AI时代对自定义算子的需求。尽管仍处于早期阶段,开发者反馈积极,显示出成为新编程范式的潜力。
英伟达发布CUDA 13.1,推出CUDA Tile编程模型,使开发者仅需15行Python代码即可实现相当于200行C++的GPU性能。这一变化降低了GPU编程的门槛,吸引更多数据科学家参与,但也引发了对CUDA“护城河”被削弱的担忧。
完成下面两步后,将自动完成登录并继续当前操作。