小红花·文摘

Sakana AI推出Doc-to-LoRa和Text-to-LoRa：能够即时理解长上下文并通过零样本自然语言调整LLM的超网络

实时互动网 ·

从单体到模块化：通过可扩展的LoRA扩展语义路由

vLLM Blog ·

本实验搭建了一个基于云主机和Whisper语音识别系统的平台，结合云计算与深度学习技术，帮助开发者优化模型训练和进行语音识别处理，掌握数据预处理和模型训练等关键步骤。适合企业、开发者和学生，预计时长120分钟。

基于开发者空间 Notebook 进行 LoRA 微调 Whisper_base 实现语音识别

华为云官方博客 ·

vLLM 是一款加速大语言模型推理的框架，解决了内存管理瓶颈，实现了 KV 缓存内存的零浪费。它支持多种量化技术和 LoRA 适配器，并提供离线推理的示例和使用指南。

【vLLM 学习】Lora With Quantization Inference

HyperAI超神经 ·

机器之心数据服务现已上线，提供高效稳定的数据获取，简化数据爬取流程。

ICML 2025 | CoTo：让LoRA训练「渐入佳境」，模型融合、剪枝样样精通

机器之心 ·

Sakana AI 推出 Text-to-LoRA (T2L)：基于任务文本描述生成特定任务 LLM 适配器 (LoRA) 的超级网络

实时互动网 ·

SakanaAI推出的Text-to-LoRA（T2L）技术简化了大模型的微调流程，用户只需一句话即可生成LoRA，压缩率达到80%，准确率仅下降1.2%。该技术使非技术用户能够轻松适配模型，推动“文本驱动”时代的到来。

一句话生成任务专属LoRA！Transformer作者创业公司颠覆LLM微调

量子位 ·

本文介绍了如何通过微调已有文档，优化金仓平台的智能体，以提升其在离线环境下回答数据库迁移问题的能力。采用LoRa技术和Spring AI框架处理文档数据，实现模型私有化部署，从而提高响应速度和数据安全性。

从零到一：利用金仓社区数据，LoRa微调与Spring AI 构建私有化千问模型 - 努力的小雨

努力的小雨 ·

机器之心数据服务现已上线，提供高效稳定的数据获取服务，简化数据爬取流程。

LoRA中到底有多少参数冗余？新研究：砍掉95%都能保持高性能

机器之心 ·

本研究提出TT-LoRA MoE框架，结合参数高效微调与稀疏专家混合路由，解决大型模型部署的可扩展性问题，显著提升多任务推理的计算效率与灵活性。

TT-LoRA MoE: A Unified Framework for Parameter-Efficient Fine-Tuning and Sparse Mixture of Experts Models

BriefGPT - AI 论文速递 ·

本研究提出了Tina微型推理模型系列，采用低秩适应（LoRA）技术，在仅有1.5亿参数的基础上实现高效推理。Tina在计算成本低的情况下，其推理性能与现有模型竞争，甚至超越。

Tiny Reasoning Models via LoRA

BriefGPT - AI 论文速递 ·

本研究提出了一种经济有效的方法，将大型语言模型（LLMs）应用于留学背景的学术咨询，特别适用于低资源环境中的文化适应。通过低秩适应和4位量化，模型在领域特异性和计算效率上显著提升，最终实现92%的推荐准确率。

Fine-tuning Large Language Models for Educational Guidance in Resource-Constrained Environments Using LoRA

BriefGPT - AI 论文速递 ·

该研究解决了在基于LoRA的持续学习中，关键参数在后任务学习后依然显著变化的问题。提出通过冻结视觉变换器中最关键的参数矩阵，并在正交LoRA调优的基础上，提出了正交LoRA组合（LoRAC），以进一步增强方法的灵活性。实验结果表明，该方法在多个持续学习基准测试中达到了SOTA性能，显著改善了准确性和遗忘率。