Hexcute:一种具有自动布局和任务映射合成的基于瓷砖的编程语言 本研究解决了深度学习工作负载在GPU上的优化难题,特别是新型混合输入数据类型的矩阵乘法运算符的优化需求。提出的Hexcute编程语言通过暴露共享内存和寄存器抽象,实现了精细优化,并通过自动化的布局和任务映射合成,显著减少了编码工作量。研究显示,Hexcute对多种深度学习运算符具有广泛的通用性,并在混合类型运算符上实现了1.7-11.28倍的加速。 布局 编程语言