新技术使人工智能模型在学习过程中更加精简和快速
MIT News - Computer Science and Artificial Intelligence Laboratory (CSAIL)
·
AI Agent 生成合成数据:从简单提示到物理准确的训练集
Micropaper
·
新方法可能提高大型语言模型(LLM)的训练效率
MIT News - Artificial intelligence
·
跨模块、宽度、深度、批量和时长的完整超参数转移
Apple Machine Learning Research
·
轻松构建隔离测试环境:快速启动和销毁容器服务 | 开源日报 No.791
开源服务指南
·
CAR-Flow:条件感知重参数化对齐源和目标以实现更好的流匹配
Apple Machine Learning Research
·
MoMoE:内存优化的专家混合模型
Nathan Chen
·
GRPO
informal
·
新型AI模型处理文本速度提高4倍,同时内存使用减少75%
DEV Community
·