Optimum Neuron支持在Neuron设备上编译SDXL Pipeline组件和Llama 2模型,并提供NeuronModel类和TGI支持,帮助用户将大模型部署到亚马逊云科技的自研芯片上进行推理服务。
完成下面两步后,将自动完成登录并继续当前操作。