基于单机最高能效270亿参数GPT模型的文本生成与理解

针对GPT基础模型参数量大，训练&推理硬件资源消耗过高等问题，我们采用GPT+MoE的技术架构路线，探索单机最高能效的绿色低碳GPT大模型训练&推理软硬一体化适配技术在中文文本生成场景的落地可行性。