标签
model
相关的文章:本列表汇集了关于模型技术的最新研究与应用,涵盖大型语言模型、AI助手开发及模型评估等多个领域,助您深入了解前沿动态。
使用 Docker Model Runner 本地构建生成式 AI 应用
Docker Model Runner is a new feature of the Docker Desktop designed to streamline the process of running and testing The post Build GenAI Applications Locally With Docker Model Runner appeared...
Docker Model Runner 是 Docker Desktop 的新功能,旨在简化本地运行和测试 AI 模型的过程。它通过将推理引擎嵌入 Docker Desktop,提升性能并优化用户体验,支持从 Docker 和 Hugging Face 拉取模型,特别在 Apple 硅系统上实现 GPU 加速。

LLM-Explorer: A Large Language Model-Driven Plugin for Enhanced Reinforcement Learning Policy Exploration
Set Language Model: A Permutation-Invariant Language Model
Reinforcement Learning and Distillation: Understanding Accuracy and Capability in Large Language Model Inference
CAD-Coder: An Open Source Visual-Language Model for Computer-Aided Design Code Generation
Mixture of Local Experts: Achieving Essentially Free Test-Time Training through Model Merging
本研究解决了当前混合专家模型由于训练和推理成本高而只能使用少量专家的问题。提出的测试时间模型合并(TTMM)方法可以大幅增加专家数量,并几乎不增加测试时间开销。研究表明,TTMM在使用更多专家时性能提升,且测试时间比传统测试时间训练(TTT)快100倍以上,为规模化测试时间训练提供了经济有效的解决方案。
本研究提出了一种测试时间模型合并(TTMM)方法,旨在解决混合专家模型因训练和推理成本高而只能使用少量专家的问题。TTMM显著增加了专家数量,并且测试时间比传统方法快100倍以上,为大规模测试提供了经济有效的解决方案。