小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
探索大型多模态模型在视频理解中的幻觉:基准、分析与缓解

香港城市大学的Gao等人研究了视频理解中的幻觉,分为三类:与先前知识冲突、上下文冲突和能力不足。提出了一种有效的微调数据集方法,通过思维链生成视频对和答案。

探索大型多模态模型在视频理解中的幻觉:基准、分析与缓解

DEV Community
DEV Community · 2025-05-25T00:57:49Z

本研究探讨了自动程序修复(APR)中修复输出与迭代的平衡,提出了一种新方法,限制每个错误生成最多10个补丁。结果表明,利用不到1%的微调数据集,生成的可行补丁数量提升了78%,强调了迭代策略在复杂基准测试中的优势,推动了APR领域的有效发展。

The Art of Repair: Optimizing Iterative Program Repair with Instruction-Tuned Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-05T00:00:00Z

这篇文章介绍了一个新任务:数据集大小恢复,通过模型权重确定训练样本数量。研究人员提出了DSiRe方法,用于恢复微调模型的图像数量,并发现LoRA矩阵的范数和频谱与微调数据集大小密切相关。通过发布新基准LoRA-WiSE,包含25000个权重快照,研究人员证明了最佳分类器可以预测微调图像数量,平均绝对误差为0.36个图像。

从 LoRA 权重中恢复数据集大小

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-27T00:00:00Z

研究人员通过微调开源大语言模型,提出了LLM4Causal,能够识别因果任务并解释结果。他们还提出了数据生成过程和两个微调数据集。通过案例研究,展示了LLM4Causal能够提供因果问题的解决方案和易于理解的答案。数值研究显示,它在查询时具有显著的能力。

用于因果决策的大型语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-28T00:00:00Z

该文介绍了一种量化感知的低秩自适应算法,用于将大型语言模型权重量化以减少时间和内存使用,并将 LLM 和辅助权重自然地集成到一个量化模型中,而不损失准确性。作者应用该算法于 LLaMA 和 LLaMA2 模型系列,并在不同的微调数据集和下游场景中验证了其有效性。

QA-LoRA:大型语言模型的量化感知低秩适应

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-26T00:00:00Z

本研究探讨了大型语言模型在故障模式分类中的有效性,并介绍了促使模型预测故障模式的方法。研究表明,在注释数据上进行微调的GPT-3.5模型在性能上优于当前可用的文本分类模型和开箱即用的GPT-3.5模型。

大型语言模型用于故障模式分类:一项调查

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-15T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码