机器之心 ·

一行代码Post-Train任意长序列！360智脑开源360-LLaMA-Factory

💡 原文中文，约6200字，阅读约需15分钟。

📝

内容提要

360-LLaMA-Factory是基于LLaMA-Factory的开源框架，支持序列并行，简化长序列的后训练。用户只需增加一个参数，经过验证效果良好，适合长文本模型的研究与开发。

🎯

❓

360-LLaMA-Factory是一个开源框架，支持序列并行，简化长序列的后训练，只需增加一个参数即可支持任意长序列的后训练。

用户只需在配置中增加一个参数sequence_parallel_size，并按需增加GPU卡数，即可进行长序列的后训练。

360-LLaMA-Factory在LLaMA-Factory的基础上增加了序列并行功能，解决了长序列后训练的关键技术问题。

长序列后训练面临显存瓶颈，序列长度增加时激活显存会大幅上升，传统方法未能根本解决这一问题。

项目核心开发者包括清华大学的博士和研究生，团队在长文本和强化学习等领域有贡献。

通过对比序列并行开与不开的训练曲线，验证了360-LLaMA-Factory的正确性，结果显示影响几乎可以忽略不计。

🏷️

Meta公司放弃开源Llama，转向专有的Muse Spark
Meta公司宣布其新AI模型Muse Spark将取代已被放弃的Llama。Muse Spark采用全新架构，无法与Llama迁移，Llama用户需寻找替...
LWD——结合“分布式隐式价值学习与基于QAM的策略提取”的RL策略框架，先离线RL预训练，后在线RL微调
本文讨论了在真实世界中部署通用机器人策略的挑战，提出了一种名为“部署中学习”（LWD）的框架，通过车队规模的离线到在线强化学习（RL）实现策略的持续改进。...
安全公告：Qt声明模块中VectorImage组件的QML代码注入漏洞影响Qt
Qt的VectorImage组件存在代码注入漏洞（CVE-2025-14576），影响版本6.8.0至6.8.6及6.9.0至6.10.1。该漏洞允许恶意...
五种强大的Python装饰器，构建整洁的AI代码
本文介绍了五种实用的Python装饰器，旨在提高AI和机器学习代码的整洁性。这些装饰器包括：限制并发请求、结构化日志记录、特征注入、确定性种子设置和开发模...
Meta's Approach to Migrating their Systems to Post-Quantum Cryptography
Meta has already begun preparing for the threats posed by quantum computing a...
扬·维雷梅维奇：开源不会消亡，它只是缺乏资金支持。
开源软件不会消亡，但面临资金不足的问题。许多项目因缺乏资金支持而停滞，开发者需要寻找可持续的商业模式，以确保开源项目的长期发展。