Waseem Alshikh是一位叙利亚出生的企业家,利用机器学习创建了一家名为Writer的初创公司。借助NVIDIA的NeMo软件,Writer开发了拥有数十亿参数的工业级模型,能够快速为各种公司生成文案。Writer的成功吸引了德勤、欧莱雅和优步等知名客户。该公司的模型托管在他们的云基础设施上,每月处理万亿次API调用。Writer使用Triton推理服务器实现更低的延迟和更大的吞吐量。作为NVIDIA Inception的成员,Writer可以使用尖端工具,并在多模态AI领域探索机会。
本文讨论了Writer公司从Hugging Face用户到客户再到开源模型贡献者的旅程。创始人兼CTO Waseem Alshikh回答了一些问题,包括Writer公司的起因、当前生成AI中最大的误解、为什么Writer现在开始贡献开源模型以及Hugging Face Expert Acceleration Program服务对Writer公司的价值。文章还提到了Writer公司如何在CPU和GPU上进行生产以满足大规模的LLMs需求,以及效率和使用CPU在生产中的重要性。
完成下面两步后,将自动完成登录并继续当前操作。