小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
针对视频智能的多模态模型微调

2026年上半年,Mux推出了@mux/ai SDK,作为开源版本,允许用户自定义AI工作流。通过与Baseten集成,用户可以使用LoRA技术对模型进行微调,提升视频智能处理能力。@mux/ai为需要更高定制化的项目提供了更多控制和灵活性。

针对视频智能的多模态模型微调

Mux Blog - Video technology and more
Mux Blog - Video technology and more · 2026-05-28T16:22:16Z
GR00T N1.7的简介与微调——其中的VLM是“基于Qwen3-VL”的Cosmos-Reason2,且预训练数据中包含2 万小时的 EgoScale人类视频数据(含GR00T N1.6的简介)

GR00T N1.6和N1.7是NVIDIA开发的视觉语言模型(VLM),用于机器人控制。N1.6改进了模型结构,支持灵活分辨率,并引入新数据集;N1.7在此基础上增强了模型的泛化能力,并在大量人类视频数据上进行预训练,提高了机器人控制的精确性和效率。

GR00T N1.7的简介与微调——其中的VLM是“基于Qwen3-VL”的Cosmos-Reason2,且预训练数据中包含2 万小时的 EgoScale人类视频数据(含GR00T N1.6的简介)

结构之法 算法之道
结构之法 算法之道 · 2026-05-27T08:00:00Z
cli-trainer Skill 上线,在 AI Agent 里一键微调大模型

星河社区推出cli-trainer,简化大模型微调流程。用户在AI IDE中输入需求后,系统自动完成环境检测、数据上传和训练提交,无需编写代码。支持多种模型和数据格式,训练后可通过API调用模型,旨在提升用户体验,减少操作步骤。

cli-trainer Skill 上线,在 AI Agent 里一键微调大模型

百度大脑
百度大脑 · 2026-05-21T11:02:44Z
AI论文评审:通过生成预训练(GPT-1)提升语言理解

本文介绍了AI语言理解的进展,特别是生成预训练(GPT)模型的创新。通过在大量未标记文本上进行预训练,再利用小规模标记数据进行微调,模型能够适应多种任务。这种方法减少了对标记数据的依赖,提升了模型的通用性和性能,成为现代语言模型的基础。

AI论文评审:通过生成预训练(GPT-1)提升语言理解

freeCodeCamp.org
freeCodeCamp.org · 2026-05-06T18:13:01Z
LWD——大规模部署中训练VLA的RL框架:结合“分布隐式价值学习”与“基于QAM的策略提取”,先离线RL预训练,后在线RL微调中跑通“部署-数据收集-训练”的持续进化循环

本文讨论了在真实世界中部署通用机器人策略的挑战,提出了一种名为“部署中学习”(LWD)的框架,通过车队规模的离线到在线强化学习(RL)实现策略的持续改进。该方法结合离线数据和在线交互,利用多样化的部署经验,优化策略以适应新任务和环境。作者提出的分布式隐式价值学习(DIVL)和带有伴随匹配的Q学习(QAM)技术,旨在提高策略的稳定性和泛化能力,实现高效的后训练。

LWD——大规模部署中训练VLA的RL框架:结合“分布隐式价值学习”与“基于QAM的策略提取”,先离线RL预训练,后在线RL微调中跑通“部署-数据收集-训练”的持续进化循环

结构之法 算法之道
结构之法 算法之道 · 2026-04-30T14:53:08Z

自托管大型语言模型(LLM)面临硬件限制、延迟和模型行为不一致等挑战。运行7B参数模型至少需要16GB显存,量化虽然能节省资源,但会影响精度。自托管模型通常比API慢,影响开发效率。微调模型需要高质量数据,且过程复杂。总体而言,自托管LLM既可行又困难,需要耐心和反复试验。

现实世界中的自托管大型语言模型:限制、解决方案与深刻教训

KDnuggets
KDnuggets · 2026-04-29T12:00:48Z

大模型训练应视为流水线,分为数据工程、预训练、中训、微调和对齐等阶段。每个环节有不同的算力需求和挑战,数据质量至关重要。预训练需处理大量干净数据以确保模型稳定性,中训通过调整数据配比提升能力,微调教会模型理解指令,对齐阶段则使用多种算法优化模型表现。整体训练过程复杂,需关注数据、算力和工程细节。

【大模型基础设施工程】05:训练全景:Pre-train、SFT、RLHF、DPO、蒸馏

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-22T00:00:00Z
大语言模型微调实用指南

大语言模型(LLM)微调是通过在特定任务数据集上继续训练预训练模型,以提高其在特定领域的表现。微调比从头开始训练更高效,允许组织定制模型行为,缩短生产时间。选择合适的微调方法可以降低计算成本和过拟合风险,适用于需要深度行为改变的任务。

大语言模型微调实用指南

Databricks
Databricks · 2026-04-21T12:35:01Z

LoRA(低秩适应)是一种高效的微调方法,通过低秩分解减少大模型微调时的参数量和存储需求,仅更新少量参数,接近全参数微调效果。QLoRA 通过量化技术进一步提升了在单卡上微调大模型的能力。LoRA 在指令微调和风格迁移等任务中表现优异,但在需要大量新知识的场景中可能不如全参数微调。

【Transformer 与注意力机制】31|微调演进:从全参数到 LoRA

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-15T00:00:00Z

本文讨论了在Ollama v0.20.0上运行Gemma 4模型的体验,强调其低资源消耗和适合函数调用的微调特性。

近思录 2026-04-02

M-x Chris-An-Emacser
M-x Chris-An-Emacser · 2026-04-01T16:00:00Z
RLT——VLA引导的在线RL:极简MLP结构的Actor-Critic在“VLA浓缩Token感知与VLA参考动作先验”的双重加持下进行在线快速微调,最终从粗到细搞定拧螺丝和充电器插入

本文讨论了一种轻量级的在线强化学习方法,用于微调视觉-语言-动作模型。研究者通过引入“RL token”提高样本效率,使得模型能够快速适应真实世界任务。该方法结合冻结的VLA和小型actor-critic网络,优化关键任务阶段的表现,旨在实现高效的在线微调,同时保持泛化能力。

RLT——VLA引导的在线RL:极简MLP结构的Actor-Critic在“VLA浓缩Token感知与VLA参考动作先验”的双重加持下进行在线快速微调,最终从粗到细搞定拧螺丝和充电器插入

结构之法 算法之道
结构之法 算法之道 · 2026-03-26T03:44:34Z
在线教程丨低门槛部署英伟达最新Physical AI模型,覆盖人形机器人/人体运动生成/扩散模型微调等

在GTC 2026上,NVIDIA推出了Physical AI概念,强调AI与现实世界的深度结合。发布了Isaac GR00T、Kimodo和SOMA-X等开源项目,旨在提升机器人在复杂环境中的执行能力,使其更自然、高效地完成任务。

在线教程丨低门槛部署英伟达最新Physical AI模型,覆盖人形机器人/人体运动生成/扩散模型微调等

HyperAI超神经
HyperAI超神经 · 2026-03-25T05:49:56Z

2026年3月19日,AI领域取得重要进展:NVIDIA推出本地智能体硬件,Dell更新AI基础设施,Apple发布新硬件,Tether推出微调框架,Anthropic和Picsart推动企业应用市场,Qevlar AI融资3000万美元,Okta提出身份风险评分方法,AI在药物发现和数据收集中的应用不断深化。

AI Infra Brief|本地智能体与端侧微调(2026.03.19)

dotNET跨平台
dotNET跨平台 · 2026-03-19T23:26:00Z
推出AI Runtime:在Databricks上可扩展的无服务器NVIDIA GPU用于训练和微调

Databricks推出了AI Runtime(AIR),支持按需分布式GPU训练,简化深度学习模型的开发和调试。AIR集成了PyTorch和CUDA等关键依赖,优化了分布式训练流程,用户可快速启动训练,无需管理基础设施。该平台与Databricks Lakehouse无缝集成,确保数据安全和高效利用GPU资源,助力客户加速AI工作负载。

推出AI Runtime:在Databricks上可扩展的无服务器NVIDIA GPU用于训练和微调

Databricks
Databricks · 2026-03-19T18:00:03Z
产业级多模态模型训练工具:PaddleFormers微调打造定制化视觉定位能力

近年来,多模态大模型的发展使AI从“看懂图像”转向“理解现实”。视觉定位任务要求模型根据自然语言描述在图像中找到目标。PaddleFormers v1.0为开发者提供高效的训练与微调工具,支持多模态任务,通过领域数据微调提升模型在特定任务中的表现,满足行业需求。未来,PaddleFormers将进一步降低多模态模型的训练门槛,推动其在实际业务中的应用。

产业级多模态模型训练工具:PaddleFormers微调打造定制化视觉定位能力

百度大脑
百度大脑 · 2026-03-12T13:10:54Z
12小时掌握大型语言模型的微调技巧

该课程帮助学员定制大型语言模型(LLM),内容涵盖参数高效微调、强化学习、行业工具和多模态AI,适合希望深入了解AI系统的学习者。

12小时掌握大型语言模型的微调技巧

freeCodeCamp.org
freeCodeCamp.org · 2026-03-11T16:01:21Z
电子商务搜索中的稀疏嵌入微调 | 第二部分:在Modal上训练SPLADE

本文讨论了在电子商务搜索中微调稀疏嵌入的方法,重点介绍了使用亚马逊ESCI数据集训练SPLADE模型的过程。强调了数据格式化的重要性,以及通过SpladeLoss实现对比学习与稀疏性正则化的平衡。此外,使用Modal的持久存储解决了检查点管理问题,确保了训练过程的稳定性。

电子商务搜索中的稀疏嵌入微调 | 第二部分:在Modal上训练SPLADE

Qdrant - Vector Database
Qdrant - Vector Database · 2026-03-09T00:00:00Z
电子商务搜索中的稀疏嵌入微调 | 第5部分:从研究到产品

本文介绍了如何使用qdrant-sparse-finetune工具化稀疏嵌入微调,以改善电子商务搜索。该工具简化了数据处理、模型训练和评估流程,支持自动化操作,提升用户体验。最终,用户可将模型快速发布到HuggingFace,实现28%的性能提升。

电子商务搜索中的稀疏嵌入微调 | 第5部分:从研究到产品

Qdrant - Vector Database
Qdrant - Vector Database · 2026-03-09T00:00:00Z
电子商务搜索中的稀疏嵌入微调 | 第3部分:评估与困难负样本

本文讨论了电子商务搜索中的稀疏嵌入微调,重点评估了SPLADE模型及其困难负样本挖掘。经过微调的SPLADE模型在nDCG@10指标上比BM25提高了28%,强调了领域特定训练的重要性。文章还分析了稀疏与密集向量的混合搜索效果,以及困难负样本挖掘(ANCE)对模型性能的提升。总体而言,微调显著改善了查询扩展、术语加权和电商词汇的表现。

电子商务搜索中的稀疏嵌入微调 | 第3部分:评估与困难负样本

Qdrant - Vector Database
Qdrant - Vector Database · 2026-03-09T00:00:00Z
电子商务搜索中的稀疏嵌入微调 | 第1部分:稀疏嵌入为何优于BM25

本文讨论了稀疏嵌入在电子商务搜索中的优势,特别是相较于BM25的29%提升。稀疏嵌入通过保留单个词汇的信号,解决了密集嵌入模糊匹配的问题,确保了精确匹配。SPLADE模型通过学习相关词汇扩展查询,提升了搜索结果的准确性。后续文章将详细介绍训练和评估过程。

电子商务搜索中的稀疏嵌入微调 | 第1部分:稀疏嵌入为何优于BM25

Qdrant - Vector Database
Qdrant - Vector Database · 2026-03-09T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码