量子位 ·

一句话生成任务专属LoRA！Transformer作者创业公司颠覆LLM微调

💡 原文中文，约3000字，阅读约需8分钟。

📝

内容提要

SakanaAI推出的Text-to-LoRA（T2L）技术简化了大模型的微调流程，用户只需一句话即可生成LoRA，压缩率达到80%，准确率仅下降1.2%。该技术使非技术用户能够轻松适配模型，推动“文本驱动”时代的到来。

🎯

关键要点

SakanaAI推出的Text-to-LoRA（T2L）技术简化了大模型的微调流程，用户只需一句话即可生成LoRA。
T2L技术的压缩率达到80%，准确率仅下降1.2%，使非技术用户能够轻松适配模型。
T2L包含三种架构变体：T2L-L、T2L-M和T2L-S，分别适用于不同的任务需求。
T2L通过两种训练模式：基于LoRA的重建和跨多个任务的监督微调（SFT）来训练模型。
实验表明，T2L在零样本场景下生成的LoRA适配器平均准确率达到78.3%，显著高于现有方法。
SakanaAI由Transformer作者Llion Jones于2023年共同创立，专注于开发基础模型和超网络架构。
该论文已被ICML2025收录，标志着“文本驱动”时代的到来。

❓

延伸问答

Text-to-LoRA技术的主要功能是什么？

Text-to-LoRA技术可以通过一句话生成LoRA，简化大模型的微调流程。

使用Text-to-LoRA生成的LoRA的压缩率和准确率如何？

使用Text-to-LoRA生成的LoRA压缩率达到80%，准确率仅下降1.2%。

Text-to-LoRA包含哪些架构变体？

Text-to-LoRA包含三种架构变体：T2L-L、T2L-M和T2L-S，适用于不同任务需求。

T2L技术如何训练模型？

T2L技术通过基于LoRA的重建和跨多个任务的监督微调两种训练模式来训练模型。

SakanaAI的创始人是谁？

SakanaAI的创始人是Llion Jones，他是Transformer架构的核心作者之一。

T2L在零样本场景下的表现如何？

在零样本场景下，T2L生成的LoRA适配器平均准确率达到78.3%，显著高于现有方法。

🏷️

标签

Text-to-LoRA llm lora transformer 压缩率大模型微调文本驱动

➡️

继续阅读

OpenClaw智编：一句话搞定华为云资源编排
本案例介绍了如何通过OpenClaw AI辅助操作平台，实现华为云资源的智能编排与自动化部署。用户可通过自然语言对话完成资源规划、Terraform脚本生...
论文周报 |微软MAI-Thinking探索纯RL自我进化，AIME准确率达97%；无需架构修改，VLM³凭纯文本坐标实现3D任务泛化...速览一周AI前沿论文
微软 AI 团队提出了「爬山机器」框架，并训练了参数达到 1T 的 MoE 模型 MAI-Thinking-1。该模型通过自适应熵控制的强化学习，在无第三...
AI创业者集结！“2026新一代人工智能（深圳）创业创新大赛”正式启动
2026新一代人工智能（深圳）创业创新大赛启动，聚焦AI大模型、智能体、硬件及文化应用，吸引海内外AI项目参与。大赛旨在推动AI技术落地，链接产业资源与资...
OpenCV 5.0 发布，重写了 DNN 引擎，并内置了 LLM 和 VLM 支持
OpenCV 5.0于2026年6月6日发布，新增深度神经网络引擎重写、80% ONNX覆盖率和内置大型语言模型支持等功能，并针对多种硬件进行了优化，计划...
一分钟读论文：《TOKI：LLM Agent持久记忆矛盾解决的双时间算子代数》
Ziming Wang的论文《TOKI》提出了一种双时间算子框架，解决了LLM Agent持久记忆中的矛盾。现有的四种写入策略存在隔离级别不明确的问题。T...
2026年NBA总决赛期间搜索趋势
Illustration of several basketballs piled together