Arcee AI的Trinity Large-Thinking模型现已在DigitalOcean的Agentic Inference Cloud上公开预览,开发者可轻松运行推理工作负载,无需管理基础设施。该模型经过压力测试,适合复杂应用,支持长时间和多步骤操作。Trinity在OpenRouter上已处理超过3.4万亿个令牌,成为美国最常用的开放权重模型。
文章讨论了AI基础设施和推理工作负载的演变,强调了从传统机器学习模型向大规模神经网络转变带来的GPU使用挑战,以及未来硬件特定优化的潜力。Baseten作为AI基础设施平台,提供必要的工具和硬件以快速推出AI产品。
完成下面两步后,将自动完成登录并继续当前操作。