小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了新的基准KnowRecall和VisRecall,用于评估多模态大语言模型在不同语言间的一致性。KnowRecall关注全球地标的文化和历史知识一致性,VisRecall检验视觉记忆一致性。实验结果显示,现有模型在跨语言一致性方面仍存在困难,需要开发更具多语言和文化意识的模型。

Traveling Across Languages: Benchmarking Cross-Lingual Consistency in Multimodal Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-21T00:00:00Z

本研究探讨大型语言模型在生成多语言响应时的文化知识差异。提供文化上下文可提升模型的本地化能力,并发现可跨非英语语言使用的文化定制向量,从而增强多样性并减少刻板印象。

Retention and Controllability of Local Cultural Knowledge in Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-14T00:00:00Z

该论文评估了大型语言模型(LLMs)在多语言和多模态任务中的表现,发现现有模型在复杂问题上的准确率普遍低于50%,尤其在文化知识和跨语言理解方面有显著改进空间。新提出的评估工具和数据集旨在推动模型的发展和研究。

JMMMU:一个针对文化意识评估的日本大型多学科多模态理解基准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-22T00:00:00Z

本研究提出了CROPE,一个新的视觉问答基准,用于评估视觉和语言模型在文化知识和适应能力方面的表现。研究发现,现有模型在处理多模态信息和文化概念上有困难,显示了其在文化理解上的局限性。

CROPE:评估视觉和语言模型对文化特定概念的上下文适应能力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-20T00:00:00Z

该研究评估了大型语言模型(LLMs)在文化知识和多样性方面的表现,特别关注长尾文化概念和低资源语言。通过建立多元文化数据集,发现GPT-3.5和GPT-4在文化理解上存在显著差异,且LLMs的表现受不同文化背景的影响。研究提出了新的评估标准和框架,以促进文化敏感的语言模型开发。

文化基准:一个健壮、多样且具有挑战性的基准,用于衡量大型语言模型的(缺乏)文化知识

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-03T00:00:00Z

本文综述了文档级机器翻译的研究,比较了不同方法的表现,发现基于单语文档的回译方法效果显著。同时,提出了古汉语与现代汉语的对齐方法,创建了大规模双语语料库,并探讨了文化知识在机器翻译中的应用,提出了新的数据筛选和提示策略,显著提升了翻译质量。

古代韩国档案翻译:基于统计短语对齐、LLM 上下文学习和跨方法论方法的比较分析

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-16T00:00:00Z

本研究探讨了如何将文化知识融入大型语言模型(LLMs)的机器翻译中,提出了新的数据筛选和提示策略,构建文化相关的平行语料库。实验结果表明,CultureLLM在文化特定翻译上优于传统系统,并在多语言能力和文化适应性方面表现出色,强调了改进LLMs以应对文化差异的重要性。

跨文化翻译:针对语内文化适应的法学硕士

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-20T00:00:00Z

本文探讨了通过多元文化数据集(如CultureAtlas和CulturaX)提升语言模型在文化背景下的表现。研究表明,加入文化信息能显著提高模型性能,并提出了MANGO和CANDLE等方法来提取和整合文化知识。CultureLLM模型在多文化数据集上表现优异,提供了有效的增强方案。

CultureBank:朝向具有文化意识的语言技术的在线社区驱动式知识库

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-23T00:00:00Z

本文探讨了利用自动生成的敌对评估数据集来测试大型语言模型的安全性,并提出了AI辅助的数据生成方法,以提升数据质量和概念覆盖。同时,研究涉及文化知识在机器翻译中的应用,强调文化偏见的审核和缓解策略。通过案例研究,展示了大型语言模型在社会科学领域的定性分析能力,强调研究者的专业知识与技能的重要性。

文化协作:AI 辅助的互动式红色对抗测试,应对在低动态范围线性模型中文化多元知识的挑战

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-10T00:00:00Z

该研究探讨了机器学习在道德和伦理判断中的应用,特别是BERT模型的有效性。通过分析社交媒体文本,微调后的模型在道德分类任务中显著提高了性能。研究还提出结合文本特征和外部知识库的方法,以更准确地检测道德价值表达,并探讨文化知识在道德推断中的重要性。

MoralBERT:社会话语中道德价值的检测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-12T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码