小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
让技术变得更易获取

该项目通过使用Amazon Q Developer,旨在降低技术门槛,帮助英语水平有限的开发者。项目生成了印地语文档,以促进Amazon Q的普及和技术的包容性。

让技术变得更易获取

DEV Community
DEV Community · 2025-05-11T17:50:15Z
在Contra上被评选为2025年最佳印地语NestJS自由职业者之一

我很荣幸被评选为2025年最佳印地语NestJS自由职业者之一,拥有超过3年的NestJS开发经验,专注于高性能应用程序和可靠的后端解决方案。

在Contra上被评选为2025年最佳印地语NestJS自由职业者之一

DEV Community
DEV Community · 2025-04-17T18:39:19Z

本研究提出了COMI-LINGUA,一个大型手动标注的数据集,旨在捕捉印地语与英语代码混合的语言细微差别。通过对100,970个实例的专家评估,揭示了现有多语言建模策略的局限性,并强调了改进代码混合文本处理能力的必要性。

COMI-LINGUA: Expert Annotated Large-Scale Dataset for Hindi-English Code-Mixing

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-27T00:00:00Z
有人能推荐最佳的印地语YouTuber,以学习使用Expo的React Native吗?

文章讨论了如何找到最佳的印地语YouTuber,以学习使用Expo的React Native。

有人能推荐最佳的印地语YouTuber,以学习使用Expo的React Native吗?

DEV Community
DEV Community · 2025-02-20T05:02:40Z
利用Twilio和Groq的LLaMA模型构建印地语AI职业咨询助手

本文介绍了如何利用Twilio和Groq的LLaMA模型创建一个印地语AI职业咨询助手。该助手通过语音通话回答学生的职业问题,使用gTTS进行文本转语音,并通过ngrok将Flask服务器暴露到互联网。主要技术包括语音识别、自然语言处理和语音合成。

利用Twilio和Groq的LLaMA模型构建印地语AI职业咨询助手

DEV Community
DEV Community · 2025-02-10T17:53:32Z

本研究提出了一种多语言命名实体识别(NER)模型,专注于印地语、孟加拉语和马拉地语。经过训练和微调,该模型实现了92.11的F1分数,有效降低了三种语言之间的实体不一致性。

TriNER: A Series of Named Entity Recognition Models for Hindi, Bengali, and Marathi

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-06T00:00:00Z

本研究评估了大语言模型在理解和生成印度语言的表现,分析了28种模型,发现不同语言间存在显著差异,印地语表现最佳,为未来改进提供了方向。

大语言模型中印度语言能力的分析

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-23T00:00:00Z

本研究解决了印地语-英语混合对话中的情感识别问题,现有模型通常基于单语数据训练,未能有效处理混合数据。我们提出了一系列模型,考虑对话的前后文和顺序信息,并开发了Hinglish到英语的翻译管道以处理混合数据。最终模型在所有基线中表现领先,展现了该方法在情感识别任务中的有效性。

AIMA在SemEval-2024任务10中的应用:基于历史的情感识别于印地语-英语混合对话

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-19T00:00:00Z

本研究针对印地语和其他印度语言在大型语言模型(LLM)领域的不足进行探索。我们提出了一种新颖的两步预训练方法,首先创建高质量文本语料库进行无监督预训练,然后在不同任务上进行有监督微调,最终取得了在多项语言相关任务中的优越性能。该工作为印地语自然语言处理提供了重要的基准和工具,具有较大的应用潜力。

HindiLLM:用于印地语的大型语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-29T00:00:00Z

本研究针对开源大型语言模型在数学推理方面的不足,提出了课程学习和分解策略。实验结果显示,WizardMath 7B在英语数据集上超越Gemini,在印地语上表现相当,表明双语方法有效提升数学推理能力。

多语言数学推理:推动开源LLM在印地语和英语中的发展

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-24T00:00:00Z

本文探讨了在中等资源场景下,短语基础统计机器翻译(PBSMT)如何超越基于Transformer的神经机器翻译(NMT),尤其是对于结构相似的语言对,如波斯语和印地语。研究结果显示,PBSMT在同一数据集上的BLEU得分为66.32,显著高于NMT的53.7,强调了根据语言特征选择合适翻译架构的重要性,并支持在NMT主导的环境中PBSMT作为高效替代方案的有效性。

重新考虑对紧密相关语言进行统计机器翻译与神经机器翻译的研究:以波斯语-印地语对为例

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-22T00:00:00Z

本研究针对低资源印地语言的少样本学习能力面临的挑战,提出了一种新颖的示例选择方法PromptRefine,以改善在这些语言上的表现。该方法通过利用与高资源印地语言的辅助示例库,并采用多任务学习技术提高语言特定检索器的对齐能力,最终显著提升了多项文本生成任务的性能,减少了偏差并增强了模型的泛化能力。

PromptRefine:通过从相关示例库中选择示例来提升低资源印地语的少样本性能

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-07T00:00:00Z

本研究解决了印地语维基百科内容不完整的问题,尤其是在与英语维基百科的内容质量差距上。我们提出了一种轻量级框架,通过从外部资源提取信息并利用大语言模型的上下文学习能力,增强英语和印地语之间的知识公平性。实验表明,该框架能够显著提高印地语维基百科条目的内容质量,分别提升65%和62%。

有效地将知识从英语转移到印地语维基百科

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-07T00:00:00Z
印度医疗领袖引入NVIDIA NIM以支持印地语在大型语言模型应用中的使用

新推出的Nemotron-4 Hindi NIM微服务推动了印度生命科学研究中的生成AI应用。多个机构利用该技术提升医疗效果,特别是在抗生素抗药性和药物发现方面。IIT Madras和IIIT-Delhi等机构正在开发AI工具,以改善神经科学研究和抗药性监测。5C Network和Innoplexus也在利用AI优化医学影像和药物发现,提升医疗服务效率。

印度医疗领袖引入NVIDIA NIM以支持印地语在大型语言模型应用中的使用

NVIDIA Blog
NVIDIA Blog · 2024-10-24T06:16:23Z

本研究提出了NLIP Lab的多语言翻译系统,通过预训练和对齐一致性目标,结合双语词典和高质量种子数据微调语言模型,提升了印地语翻译效果。评测显示该模型具有竞争力。

NLIP_Lab-IITH 多语言机器翻译系统用于 WAT24 机器翻译共享任务

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-17T00:00:00Z

INDICVOICES数据集包含了来自16237名发言人的7348小时的语音数据,涵盖了145个印度地区和22种语言。作者分享了数据收集的标准化协议、工具、问题、提示和对话场景库,以及质量控制机制和转录指南。他们希望这个开源蓝图能成为其他多语言地区数据收集的指南。利用INDICVOICES,他们构建了IndicASR,这是第一个支持印度宪法第八版中列出的22种语言的ASR模型。所有数据、工具、指南、模型和其他资料都将公开提供。

LAHAJA:评估印地语自动语音识别系统的多口音基准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-21T00:00:00Z

本文回顾了尼泊尔自动语音识别系统的研究,探索了不同数据集和技术,并讨论了遇到的障碍。尼泊尔语的语言和声学模型研究还不够,但相关项目数量在增加。作者提供了一个框架和未来研究的方向。

自动语音识别系统 —— 印地语

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-26T00:00:00Z

该研究使用机器学习将英语翻译成形式化特征语言,并以印地语为示例数据进行训练。结果显示该方法能够灵活地满足不同语言需求和场景。

FAME-MT 数据集:机器翻译中简化形式意识的实现

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-20T00:00:00Z

本研究介绍了BEnQA数据集,包含孟加拉国中学和高中水平的平行孟加拉语和英语考试题目。观察到孟加拉语和英语中模型性能差异,发现思考链提示对推理问题有利,附加英语翻译有助于回答问题。指向改善孟加拉语和其他资源有限语言中大型语言模型性能的未来研究方向。

Suvach -- 生成的印地语 QA 基准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-30T00:00:00Z

在线性别基础骚扰是限制女性和边缘性别在数字空间中自由表达和参与的普遍问题。研究团队开发了一种结合CNN和BiLSTM网络的方法,用于识别带有性别偏见的滥用。该方法在英语数据集上表现出强大的性能。该方法在比赛中排名第一,有望在应对Indic语言互联网用户的网络骚扰方面发挥重要作用。

打破沉默:检测和减少印度在线空间中的性别虐待(印地语、泰米尔语和印度英语)

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-02T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码