小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Sakana AI推出Doc-to-LoRa和Text-to-LoRa:能够即时理解长上下文并通过零样本自然语言调整LLM的超网络

Sakana AI 提出了两种方法:Text-to-LoRA (T2L) 和 Doc-to-LoRA (D2L),通过轻量级超网络实现大型语言模型的高效定制,显著降低内存和延迟,并支持零样本任务适应和跨模态知识迁移。

Sakana AI推出Doc-to-LoRa和Text-to-LoRa:能够即时理解长上下文并通过零样本自然语言调整LLM的超网络

实时互动网
实时互动网 · 2026-02-28T02:57:08Z

小米开源了全球首个自驾与具身智能统一模型MiMo-Embodied,成功解决了知识迁移难题。该模型通过高质量数据集和四阶段训练策略,打破了室内与户外操作的领域鸿沟,在29个基准测试中表现优异,展现了强大的跨领域能力。

小米打通智驾和具身大模型,然后开源了

量子位
量子位 · 2025-11-26T05:26:46Z

常博士提出了“预测大模型”概念,旨在通过统一学习海量数据,克服特定场景AI模型的局限性。该模型能够迁移至新场景,解决数据稀缺问题,实现高效应用。未来,AGI将具备灵活的知识迁移能力,推动智能进化。

预测大模型工业生存法则,华为博士告诉你什么是B端最需要的大模型

量子位
量子位 · 2025-06-24T07:25:32Z

清华大学、人民大学与字节跳动团队提出了跨分子种类的生成框架UniMoMo,通过统一表示分子片段展示了其在药物设计中的潜力。该框架在多类分子任务中表现优异,验证了跨模态知识迁移的有效性。

入选ICML 2025,清华/人大/字节提出首个跨分子种类统一生成框架UniMoMo,实现多类型药物分子设计

HyperAI超神经
HyperAI超神经 · 2025-05-28T05:41:31Z

本研究提出了一种基于最佳运输的图匹配方法(GM-OT),旨在解决从预训练语言模型向声学特征学习转移语言知识时的对齐挑战。该方法通过将语言和声学序列建模为结构化图,提升了知识迁移效率,显著提高了自动语音识别模型的性能。

Cross-modal Knowledge Transfer Learning for Automatic Speech Recognition Based on Optimal Transport Graph Matching

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-19T00:00:00Z

本研究提出了“潘多拉”框架,以解决现有统一结构知识推理方法在知识迁移和大型语言模型对齐方面的不足。通过使用Python的Pandas API构建知识表示,潘多拉在多个基准测试中表现优于现有框架,并能有效与任务特定方法竞争。

Pandora: A Code-Driven Large Language Model Agent for Unified Reasoning Across Diverse Structured Knowledge

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-17T00:00:00Z

本研究提出了一种名为DynamicVis的动态视觉感知基础模型,旨在提升遥感图像分析的泛化能力。该模型结合动态区域感知技术,增强了跨任务知识迁移能力,提高了高分辨率遥感图像的处理效率,并在多个任务中展现出良好的灵活性和效率。

DynamicVis: An Efficient and General Visual Foundation Model for Remote Sensing Image Understanding

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-20T00:00:00Z

本研究旨在提高无人机系统在大规模城市环境中的导航效率,并实现知识迁移。提出的元课程训练方案和增量自适应强化学习算法显著提升了导航的收敛速度和适应能力,展示了实际应用潜力。

UAS Visual Navigation in Large and Unseen Environments via a Meta Agent

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-20T00:00:00Z

本研究提出了一种跨模态知识迁移学习框架(CMKT),有效整合语言知识与语音增强模型,实验结果表明其在多种条件下表现优异。

语言知识迁移学习在语音增强中的应用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-10T00:00:00Z

本研究探讨开放世界持续学习中已知与未知样本的知识迁移问题,提出的HoliTrans框架结合非线性随机投影和分布感知原型,显著提升了增量学习中的模型表现,为开放世界学习提供了有效解决方案。

Exploring Knowledge Transfer between Known and Unknowns in Open-World Continual Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-27T00:00:00Z
模型参数作知识通用载体,MergeNet离真正的异构知识迁移更进一步

AIxiv专栏促进了学术交流,报道了2000多篇文章。研究团队提出MergeNet框架,解决了异构模型间的知识迁移问题,显著提升了跨结构、跨模态和跨任务的迁移效果。

模型参数作知识通用载体,MergeNet离真正的异构知识迁移更进一步

机器之心
机器之心 · 2025-01-28T05:08:15Z
好了,现在你的知识也是我的了.jpg

本文分享了作者对知识吸收的经验,强调心态和知识迁移的重要性。作者总结了知识消化的四个步骤:验证、平行迁移、增强和启发,鼓励读者以开放心态吸收外部知识,成为知识的搬运者。

好了,现在你的知识也是我的了.jpg

Manjusaka
Manjusaka · 2024-12-06T18:00:00Z

本研究提出了MM-Eval评估数据集,评估大型语言模型在低资源语言(如蒙古语)中的表现。结果表明,模型在句法任务上优于语义任务,知识任务表现适度下降,显示出模型能够将高资源知识迁移至低资源环境。该数据集为低资源语言的自然语言处理提供了重要支持。

MM-Eval:现代蒙古语评估的层次基准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-14T00:00:00Z

本研究探讨了神经网络在医学图像分割中的知识迁移,重点是从大规模“教师”网络向小型“学生”网络的迁移。通过多尺度特征蒸馏和监督对比学习,提升学生模型的性能,并评估不同损失对知识迁移的影响。

通过可迁移性指标提高医学图像分割的预训练效率

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-24T00:00:00Z

微软推出IGOR方法,通过图像目标表示让机器人模仿人类动作。IGOR利用互联网视频数据,创建统一动作表示空间,实现跨任务知识迁移。其框架包括潜在动作模型、策略模型和世界模型,能在不同任务中应用。

机器人轻松模仿人类,还能泛化到不同任务和智能体!微软新研究,学习人类和机器人统一动作表示

量子位
量子位 · 2024-10-22T06:56:52Z

研究探讨了自监督学习模型在跨语言语音情感识别中的应用。通过比较模型与人类在不同场景下的表现,并分析方言影响,发现适当的知识迁移能使模型在目标语言中达到母语者水平,为跨语言语音情感识别提供了新见解。

跨语言语音情感识别:人类与自监督模型的对比

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-25T00:00:00Z

本研究提出了局部注意力知识蒸馏框架(LAKD),解决了现有方法在蒸馏信息利用方面的不足。LAKD在多个数据集上表现出高可解释性和竞争力性能,具有模型压缩和知识迁移的潜力。

基于局部学习的LAKD激活映射蒸馏

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-21T00:00:00Z

本文讨论了人工智能系统中知识的表示和迁移的重要性,以及不同模态之间的相互关系,分析了转移出现或稀缺的原因。

通过集中式奖励代理进行多任务强化学习的知识共享与转移

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-20T00:00:00Z

本文介绍了一个解决数据异构性和隐私保护挑战的联邦迁移学习框架,利用多个异构源数据集的信息增强目标数据集上的学习能力。提出了“联邦差分隐私”的概念,为每个数据集提供隐私保证。研究了一维均值估计、低维线性回归和高维线性回归三个统计问题。展示了联邦差分隐私是介于本地和中央模型差分隐私之间的中间隐私模型。强调了数据异构性和隐私在联邦学习中的基本成本和跨数据集的知识迁移的好处。

隐私保护数据去重技术用于增强语言模型的联邦学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-11T00:00:00Z

本文介绍了一个解决数据异构性和隐私保护挑战的联邦迁移学习框架,利用多个异构源数据集的信息增强目标数据集上的学习能力。提出了“联邦差分隐私”的概念,为每个数据集提供隐私保证。研究了一维均值估计、低维线性回归和高维线性回归等统计问题。展示了联邦差分隐私是介于本地和中央模型差分隐私之间的中间隐私模型。强调了数据异构性和隐私的基本成本,以及跨数据集的知识迁移的好处。

差分隐私联邦学习:系统性综述

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-14T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码