标签

 大语言模型 

相关的文章:

BriefGPT - AI 论文速递 -

VIM:用于视觉嵌入式指令跟随的多模态大语言模型探测

我们介绍了 VISUAL EMBEDDED INSTRUCTION (VIM),这是一个新的框架,旨在评估多模态大语言模型 (MLLMs) 在视觉指令跟随能力方面的表现。通过将指令嵌入到视觉场景中,VIM 对 MLLMs 提出挑战,对指令跟随需要强大的视觉解释能力。我们将 VIM 应用于不同的基准测试,包括 VQAv2、MME、MM-Vet 和 RefCOCO 系列,并通过三个不同的上下文学习设置:零次尝试、一次尝试和对应尝试,探索不同的 MLLMs。我们观察到,开源的 MLLMs 与 GPT-4V 之间存在显著的性能差异,这意味着它们在视觉指令理解方面的熟练程度还不够好。我们的结果突出了提高 MLLMs 在指令跟随方面能力的有希望方向。我们的目标是通过 VIM 作为一个有用的规范来推动该领域的最新技术进展和推动进一步的发展。

AI生成摘要 本文介绍了一个新的框架VISUAL EMBEDDED INSTRUCTION (VIM),用于评估多模态大语言模型 (MLLMs) 在视觉指令跟随能力方面的表现。通过将指令嵌入到视觉场景中,VIM 对 MLLMs 提出挑战,对指令跟随需要强大的视觉解释能力。作者将 VIM 应用于不同的基准测试,并观察到开源的 MLLMs 与 GPT-4V 之间存在显著的性能差异。作者的目标是通过 VIM 推动该领域的技术进展和发展。

相关推荐 去reddit讨论

BriefGPT - AI 论文速递 -

OPERA: 通过过高信任惩罚和回顾分配减轻多模态大语言模型中的虚构问题

本文介绍了一种通过过度信任惩罚和反思分配策略的新型多模式大型语言模型解码方法 OPERA,用于应对幻觉问题,无需额外的数据、知识或训练,实验证明其有效性和普适性。

AI生成摘要 通过改进大型视觉语言模型的训练方法和引入新的评估基准,使其生成更精确的回答并减少幻觉。在新的评估基准下,该方法实现了8.4%的改进,并在其他模型上也取得了性能提升。

相关推荐 去reddit讨论

华为云官方博客 -

带你了解大语言模型的前世今生

大规模语言模型(Large Language Models,LLM),也称大型语言模型,是一种由包含数百亿以上参数的深度神经网络构建的语言模型,使用自监督学习方法通过大量无标注文本进行训练。

AI生成摘要 本文介绍了大规模语言模型(LLM)的基本概念和发展历程。LLM是由深度神经网络构建的语言模型,通过自监督学习方法进行训练。自2018年以来,LLM在自然语言处理任务中表现出色。文章还介绍了语言模型的基本概念和构建流程,包括预训练、有监督微调、奖励建模和强化学习。最后,文章提到了大规模语言模型研究的快速发展和挑战。

相关推荐 去reddit讨论

BriefGPT - AI 论文速递 -

面向更高参数效率的大语言模型微调:一篇立场论文

该研究论文从参数高效微调(PEFT)对大语言模型(LLMs)的迫切需求出发,强调了当前状态和进一步研究该主题的必要性,以及需要解决的重要挑战和开放问题,包括创新 PEFT 架构、不同学习设置的 PEFT、结合模型压缩技术的 PEFT 以及多模态 LLMs 的 PEFT 探索。通过提出该立场论文,我们旨在激发进一步的研究,并促进围绕 LLMs 的更高效和可访问的 PEFT 的讨论。

AI生成摘要 该研究论文强调了参数高效微调(PEFT)对大语言模型(LLMs)的迫切需求,并提出了创新 PEFT 架构、不同学习设置的 PEFT、结合模型压缩技术的 PEFT 以及多模态 LLMs 的 PEFT 探索。该论文旨在激发进一步的研究,并促进围绕 LLMs 的更高效和可访问的 PEFT 的讨论。

相关推荐 去reddit讨论

BriefGPT - AI 论文速递 -

LION:赋能双层视觉知识的多模态大语言模型

多模态大型语言模型(MLLMs)借助视觉知识的两个层面提升了理解和感知多模态信号的能力。通过逐步整合细粒度的空间感知视觉知识和软提示高级语义视觉证据的方法,我们的模型在多个多模态基准测试中展示了过人的优越性能。

AI生成摘要 MMICL是一种解决图像与文本交叉多模态提示问题的方法,通过考虑模型和数据的角度,适应用户真实应用中复杂的提示。在广泛的视觉-语言任务中,MMICL取得了新的最先进的零样本和少样本性能,并成功缓解了视觉-语言模型中的语言偏差问题。

相关推荐 去reddit讨论

解道jdon.com -

大语言模型和语言理论之争论

这篇文章讨论了大语言模型(LLM)和语言学领域之间的关系,大语言模型和语言学:探索联系并重新开启辩论。 大型语言模型的开发主要是工程的壮举,到目前为止很大程度上与语言学领域脱节。探索这两个方向之间的联系正在重新开启语言研究中长期存在的争论。 为了开始讨论这两个领域之间的联系,需要区分计算语言学和其他类型的语言学——理论语言学、认知语言学、发展语言学等。 计算语言学传统上使用计算模型来解决语言学中的问题,并与自然语言处理领域接壤, 而自然

AI生成摘要 这篇文章讨论了大语言模型(LLM)和语言学之间的关系。大型语言模型的开发与语言学领域脱节,但它们的成功重新引发了该领域的争论。有人认为大模型是有用的工具,但不是对科学的贡献;也有人认为大模型是语言学习的精确描述。大模型在语言生成方面有优势,但在世界知识和语用学方面存在局限性。目前大模型与语言学和人类认知关系不大,但语言学可能会受益于大模型作为语言习得和处理建模的工具。

相关推荐 去reddit讨论

解道jdon.com -

什么是大语言模型的检索增强生成 (RAG)?

RAG(Retrieval-Augmented Generation:检索增强生成) 是一个人工智能框架,用于减轻大模型的“幻觉”问题。 大语言模型的回答经常可能不一致。有时他们会确定问题的答案,有时他们会从训练数据中反省随机事实。如果他们有时听起来像是不知道自己在说什么,那是因为他们不知道。 大模型知道词语在统计上如何关联,但不知道它们的含义。 RAG可从外部知识库检索事实,以最准确、最新的信息为基础的大语言模型 (LLM),并让用户深入了解 LLM 的生成过程。它确保模型

AI生成摘要 RAG是一个人工智能框架,用于解决大模型的“幻觉”问题。它通过从外部知识库检索事实,为大语言模型提供准确、最新的信息。RAG有两个阶段:检索和生成。在检索阶段,算法搜索与用户提示相关的信息片段。在生成阶段,大模型从增强提示中提取信息,生成答案。RAG可以用于微调通用大语言模型,也可以构建基于语言模型的系统来访问外部知识源。RAG的优势是提高生成响应的可靠性,减轻“幻觉”问题。它可以适应事实的变化,并且不需要重新训练整个模型。RAG是解决知识密集型任务的一种方法。它可以帮助大模型了解最新的、可验证的信息,并降低重新培训和更新的成本。

相关推荐 去reddit讨论

BriefGPT - AI 论文速递 -

现代大语言模型中数据污染问题研究

我们通过检测数据污染并提出 “Testset Slot Guessing” 方法,发现商业化的 LLM 在评估基准中有明显的性能改进,并呼吁在该领域使用更强大的评估方法和基准。

AI生成摘要 该文章介绍了一种用于检测大型语言模型中数据污染的方法,通过构建多项选择问题并创建扰动版本的数据集实例,来评估模型的性能。通过词级扰动和同义词替换,确保扰动版本与原始实例的语义和句子结构相同。通过评估两种最先进的语言模型,结果表明该方法可以准确检测数据污染并提供估计。

相关推荐 去reddit讨论

BriefGPT - AI 论文速递 -

基于大语言模型的远程监督半自动文档级关系抽取数据增强

通过集成大型语言模型和自然语言推理模块,我们提出一种自动标注方法来生成关系三元组,从而增强文档级关系数据集,我们通过介绍增强的数据集 DocGNRE 展示了我们方法的有效性,该方法在重新注释众多长尾关系类型方面表现出色,并且在推进广义语言语义理解方面提供了实际好处。

AI生成摘要 本研究提出了GPT-RE方法,用于改善大型语言模型在关系提取任务中的表现,通过特定实体和黄金标签引导逻辑,该方法在四个数据集上超越GPT-3基线,在Semeval和SciERC上达到最佳状态。

相关推荐 去reddit讨论

爱范儿 -

早报|GPTs 功能正式上线 / 苹果正利用大语言模型改造 Siri / 华为智选车首款轿车智界 S7 亮相

·特斯拉 Model 3/Y 长续航版涨价 ·字节跳动 PICO 回应「裁员 80%」 ·微软计划将 Copilot AI 助手引入 Windows 10#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。 爱范儿 | 原文链接 · 查看评论 · 新浪微博

AI生成摘要 OpenAI的GPTs功能对所有ChatGPT+订阅用户开放,苹果正在用大型语言模型改造Siri,特斯拉Model 3/Y长续航版涨价,字节跳动PICO否认裁员80%的传闻,OpenAI回应ChatGPT服务中断,微软计划将Copilot AI助手引入Windows 10,理想汽车第三季度营收大增,英伟达可能推出三款AI芯片,华为智选车首款轿车智界S7亮相,vivo开源蓝心大模型7B,一加12将搭载新影像系统,南航确认系统异常期间售出的低价机票有效,王者荣耀10月收入增长,泰勒·斯威夫特成为Apple Music年度艺人,电影《旺卡》内地定档,美国演员工会结束罢工,电影《毒液3》推迟上映。

相关推荐 去reddit讨论

热榜 Top10
...
Dify.AI
...
ShowMeBug
...
LigaAI
...
eolink
...
天勤数据
...
观测云
...
白鲸技术栈
推荐或自荐