小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究探讨了大型语言模型在波斯语文化适应性评估中的不足。通过引入PerCul数据集,采用故事驱动的多项选择题,旨在提高模型的文化敏感性。实验结果显示,现有模型与用户基准之间存在11.3%的差距,最佳模型的差距达到21.3%。

PerCul: A Story-Driven Cultural Evaluation of Large Language Models in Persian

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-11T00:00:00Z

本研究提出了新的基准SafeWorld,以解决大型语言模型在不同文化和法律标准下的安全性评估问题。结果表明,现有模型在文化敏感性和法律合规性方面存在困难,而SafeWorldLM表现优异,显示其在全球安全标准对齐中的潜力。

安全世界:地理多样化安全对齐

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-09T00:00:00Z

本研究提出CASA基准,以评估大型语言模型在在线购物和社交讨论中的文化敏感性。结果表明,现有模型的文化意识覆盖率不足10%,需通过提示和微调方法提升其文化适应能力。

评估大型语言模型网络代理的文化和社会意识

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-30T00:00:00Z

本文综述了大语言模型(LLMs)的评估方法,探讨了其在多语言和文化环境中的应用及挑战。研究强调文化考量的重要性,并提出新的评估基准CDEval,以提升模型的文化敏感性。通过对泰语及其他语言的评估,发现现有模型在多语言环境中的表现存在显著差距,呼吁改进评估机制以促进LLMs的实际应用和发展。

代表不足的群体:为开发泰国语言模型设定文化和核心能力基准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-07T00:00:00Z

本文回顾了视觉-语言模型(VLMs)的应用,探讨了其在文化偏见、训练方法和评估中的表现。研究发现,VLMs在处理文化特定图像时存在西方偏见,并提出了文化意识分数(CAS)作为新评估指标。通过创建适应不同文化的数据集,旨在提高AI系统的文化敏感性,促进全球多样性。

文化和包容性考虑下的视觉 - 语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-08T00:00:00Z

本文介绍了一种利用赫尔辛基变压器在自我抓取的纯文学阿拉伯语数据集上进行微调的先进英 - 阿拉伯语翻译器。该翻译器在文化敏感性和语境准确性方面表现出色,优于谷歌翻译。研究强调了赫尔辛基变压器在使用文学阿拉伯语数据集时在英 - 阿语翻译方面的优越性。

昊然:将翻译提升至超越字面意思的层次

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-20T00:00:00Z
庆祝解放日的风味

美国的“解放日”是庆祝和反思历史的时刻。艺术家O Koren强调黑人在美国饮食文化中的贡献,特别是他们的农业知识和技能。Koren呼吁品牌在庆祝这一节日时尊重其历史意义,避免商业化,并建议与社区专家合作,以确保文化的敏感性和准确性。

庆祝解放日的风味

Adobe Blog
Adobe Blog · 2022-06-20T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码