💡
原文中文,约10400字,阅读约需25分钟。
📝
内容提要
Optimum Neuron支持在Neuron设备上编译SDXL Pipeline组件和Llama 2模型,并提供NeuronModel类和TGI支持,帮助用户将大模型部署到亚马逊云科技的自研芯片上进行推理服务。
➡️