小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
介绍IndQA

我们致力于让AGI惠及全人类,特别是非英语国家。为此,我们创建了IndQA,这是一个评估印度语言和文化理解的新基准,涵盖2278个问题,涉及12种语言和10个文化领域,旨在评估AI的理解和推理能力,促进技术在印度的可及性和应用。

介绍IndQA

OpenAI
OpenAI · 2025-11-03T22:30:00Z

本研究评估了大型语言模型(LLMs)和谷歌翻译在印度语言翻译中的质量。结果表明,LLMs在翻译准确性上有所提升,但在情感和语义完整性方面仍面临挑战,尤其是在比喻和哲学内容的翻译中。GPT-4o和GPT-3.5在保留《博伽梵歌》翻译的情感方面优于谷歌翻译。

An Evaluation of LLMs and Google Translate Quality for Selected Indian Languages: Sentiment and Semantic Analysis

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-27T00:00:00Z

本研究推出IndicMMLU-Pro基准,评估大语言模型在印度语言上的表现,填补研究空白,强调设计原则,促进文化敏感的印度语言模型发展。

IndicMMLU-Pro:印度大语言模型的基准测试

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-27T00:00:00Z
释放大型语言模型的力量:提升印度语言理解

大型语言模型(LLMs)为印度语言的理解和交流带来了新机遇。尽管面临数据稀缺等挑战,LLMs在提升语言能力和文化理解方面展现出巨大潜力。通过透明的数据共享和多样化的数据集,未来有望实现更好的语言处理效果。

释放大型语言模型的力量:提升印度语言理解

DEV Community
DEV Community · 2025-01-26T00:07:47Z

本研究评估了大语言模型在理解和生成印度语言的表现,分析了28种模型,发现不同语言间存在显著差异,印地语表现最佳,为未来改进提供了方向。

大语言模型中印度语言能力的分析

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-23T00:00:00Z

本研究提出一个综合平台,旨在解决印度地区语言在自然语言处理中的不足,提供文本匿名化、摘要和拼写检查等功能,支持英语、印地语和马拉地语,具有重要的实用价值。

An Investigation of Anonymization, Abstract Summarization, and Spell Checking in Hindi and Marathi

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-24T00:00:00Z

本文提出了一种基于并行语料库和合成数据增强的策略,旨在提升印度36种语言的机器翻译质量,促进多语种交流。

巴沙语域:印度次大陆语言的翻译生态系统

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-05T00:00:00Z

本研究解决了多语言模型中分词效率不足的问题,特别是在印度语言应用中。SUTRA分词器在14种语言中表现优异,强调了开发针对性分词策略的重要性。

Evaluating Tokenizer Performance of Large Language Models in Official Indian Languages

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-19T00:00:00Z

本研究提出了BhasaAnuvaad数据集,涵盖14种印度官方语言,提供超过44,400小时的语音数据,旨在解决自动语音翻译(AST)数据集不足的问题,并评估现有AST系统的缺陷。

巴哈萨阿努瓦德:一个包含14种印度语言的语音翻译数据集

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-07T00:00:00Z

研究分析大型语言模型在多语言环境中的评估不足,特别是在印度患者使用医疗聊天机器人的情况下。评估24个模型后,提出了统一的检索增强生成框架。结果显示,模型在印度语言查询中表现差异大,并在文化和语言混合查询上遇到挑战,指出了改进健康聊天机器人的潜力。

健康评估:在真实多语言环境中评估RAG模型用于健康聊天机器人

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-17T00:00:00Z

本研究提出IndicSentEval基准数据集,分析了9个模型在6种印度语言中的编码能力和鲁棒性。结果显示,专为印度语言设计的模型更能捕捉语言特性,但通用模型在某些情况下表现更好。这些发现有助于优化印度语言的自然语言处理任务。

IndicSentEval:多语言变换模型在印度语言中有效编码语言特性的研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-03T00:00:00Z

该论文介绍了为11种印度语言引入神经信息检索资源的工作,包括使用机器翻译创建的数据集和神经信息检索模型集合。实验证明,该资源在多种印度语言上取得了显著改进。

横跨印度语言的文本图像生成偏见导航

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-01T00:00:00Z

OntoSenseNet是一个为印度语言量身定制的动词中心词汇资源,通过计算版本保留了Telugu词典的原汁原味,并由本地语言人士进行注释。验证结果表明该资源有效。

应用数据驱动方法获取和验证的有机残留物在新兴和发展中国家中的价值化的词典

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-02T00:00:00Z

本研究评估大型语言模型对自动无参考翻译评估的有效性,并通过模拟人类直接评估的实验来评估英语和印度语言译文的质量。发现基于大型语言模型的评估器在考虑的印度语言对上实现了相当或更高的整体相关性与人类判断。

面向大型语言模型驱动的无参考翻译评估方法:英语和印度语言

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-03T00:00:00Z

该论文介绍了为11种印度语言引入神经信息检索资源的工作,包括使用机器翻译创建的数据集和不同的神经信息检索模型集合。实验证明,这些资源在多种印度语言上的性能有显著改进。

Paramanu: 一系列新型高效的印度生成基础语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-31T00:00:00Z

本研究使用16,000个泰米尔语令牌增强了开源的LLaMA模型,解决了现有切尖模型中泰米尔语等语种的代表性不足导致的性能问题。通过LoRA方法高效训练模型,并引入了Alpaca和OpenOrca数据集。实验结果显示在泰米尔语文本生成方面有显著性能改进,对印度语言切尖模型的应用具有重要意义。通过公开模型、数据集和代码,促进语言建模领域的创新。

TeenyTinyLlama: 开源的巴西葡萄牙语小型语言模型训练

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-30T00:00:00Z

本文介绍了使用泰米尔语令牌增强开源的LLaMA模型来解决现有切尖模型中泰米尔语等语种的代表性不足所导致的性能不佳问题。通过LoRA方法进行高效的模型训练,并引入了Alpaca和OpenOrca数据集进行实验。结果显示在泰米尔语文本生成方面有显著的性能改进,对印度语言切尖模型的应用具有重要意义。通过公开模型、数据集和代码,促进语言建模领域的创新。

泰米尔语的形态与句法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-16T00:00:00Z

Indus OS是专为印度智能手机设计的操作系统,支持印度语言和本地功能。它提供了印度市场设计的界面和应用程序,包括文本转语音和Indus键盘。Indus OS的目标是提高印度智能手机用户的生产力和可扩展性。然而,Indus OS的市场供应有限,兼容性和应用程序支持可能存在问题。

Indus OS 是专为印度智能手机创建的移动操作系统

极道
极道 · 2024-01-06T00:05:00Z

本文介绍了使用泰米尔语令牌增强开源的LLaMA模型来解决现有切尖模型中泰米尔语等语种的代表性不足所导致的性能不佳问题。通过LoRA方法进行高效的模型训练,并引入了Alpaca数据集和OpenOrca数据集的子集进行微调。实验结果显示在泰米尔语文本生成方面有显著的性能改进,对印度语言切尖模型的应用具有重要意义。通过公开模型、数据集和代码,促进语言建模领域的创新。

TinyLlama:一种开源的小型语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-04T00:00:00Z

本文介绍了使用泰米尔语令牌增强开源的LLaMA模型来解决现有切尖模型中泰米尔语等语种的代表性不足所导致的性能不佳问题。通过LoRA方法进行高效的模型训练,并引入了Alpaca数据集和OpenOrca数据集的子集进行实验。实验结果显示在泰米尔语文本生成方面有显著的性能改进,对印度语言切尖模型的应用具有重要意义。通过公开模型、数据集和代码,促进语言建模领域的创新。

TigerBot:一个开放的多语言多任务 LLM

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-14T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码