小红花·文摘

本研究评估了九种大型语言模型在孟加拉语消费者健康查询摘要中的表现。结果显示，Mixtral-8x22b-Instruct模型在ROUGE指标上表现最佳，证明了这些模型在低资源语言医疗查询摘要中的潜力。

孟加拉消费者健康查询摘要的大型语言模型性能评估

BriefGPT - AI 论文速递 ·

从孟加拉茶歇到Python调试 — 我的编程与好奇之旅

DEV Community ·

本文提出了BdSLW401，一个包含401个手势和102,176个视频样本的孟加拉手语数据集，以解决手语识别中的说话者变异和视角变化问题。通过引入相对量化编码（RQE），显著提升了基于变换器的手语识别效果，增强了模型的解释性和识别率。

基于变换器的词级孟加拉手语识别：相对量化编码方法

BriefGPT - AI 论文速递 ·

本研究通过变换器模型解决孟加拉语数学文字问题的转化挑战，开发了包含10,000个问题的"PatiGonit"数据集，准确率达到97.30%。该研究为孟加拉自然语言处理和学生问题解决能力提供了新方法。

通过变换器模型解决孟加拉数学文字问题：赋能孟加拉教育

BriefGPT - AI 论文速递 ·

本研究针对孟加拉语情感分析的研究空白，提出了一种新的混合方法，结合基于规则的算法与预训练语言模型。研究表明，BSPS与BanglaBERT的混合方法在九个情感类别的分类准确性和精确性上优于单独使用BanglaBERT模型，进而强调了规则基础和预训练语言模型相结合的重要性和有效性。

提升孟加拉文本情感分析的混合方法：基于词典算法与预训练语言模型Bangla-BERT的结合

BriefGPT - AI 论文速递 ·

本研究提出了名为德霍罗尼的孟加拉气候变化和环境新闻数据集，包含2300篇带注释的新闻文章，旨在填补孟加拉在气候变化研究中的语言和资源缺口。同时引入了BanglaBERT-Dhoroni模型，以提升对气候和环境观点的检测能力。

Dhoroni: Exploring Climate Change and Environmental Perspectives in Bangladesh Using a Multi-Perspective News Dataset and Natural Language Processing

BriefGPT - AI 论文速递 ·

该论文评估了多种模型以减少对少数群体的偏见，提出了多任务学习和深度学习模型，并测试了模型的偏见。研究还探讨了有毒言论的检测方法及其在不同文化背景下的表现，强调了社交偏见的识别和缓解。

评估孟加拉社交媒体评论中对不同群体的毒性水平：一项全面调查

BriefGPT - AI 论文速递 ·

本研究提出了一种基于骨架的手势识别模型，结合路径签名和多种特征描述符，利用注意手的原则和“dyadic method”提取特征。实验结果表明，该方法在手势识别中表现优异，并强调混合特征对识别准确率的提升，推动了手语识别技术的发展。

基于多分支时空注意模型的孟加拉手语识别通过手势估计

BriefGPT - AI 论文速递 ·

本文介绍了一种全卷积循环网络（FCRN）框架，用于手写汉字文本识别。FCRN通过在线数据训练，学习笔尖轨迹与字符序列的关联，并采用优化的波束搜索方法集成语言模型，显著提高识别率。在CASIA-OLHWDB和ICDAR 2013数据集上，分别达到了96.40%和95.00%的正确率。

多通道注意力网络与集成迁移学习识别孟加拉手写字符

BriefGPT - AI 论文速递 ·

本文介绍了多个手语数据集及其相关研究，包括美国手语、土耳其手语和孟加拉手语。研究者们开发了基于深度学习的手语识别模型，提高了识别准确率，并提供了新的数据集以促进手语技术的发展。这些研究为手语识别领域提供了重要的基准和方法。

BAUST Lipi: 基于深度学习的孟加拉手语识别的BdSL数据集

BriefGPT - AI 论文速递 ·

本研究创建了一个包含33,605条孟加拉文社交媒体数据的情感分析数据集，并比较了多种语言模型的表现。结果表明，单语言变换器模型在零指导和少量指导下优于其他模型。此外，研究探讨了心理健康与社交媒体的关系，提出了DepGPT模型用于抑郁症检测，取得了高准确度和F1分数，为孟加拉语情感分析提供了重要见解和工具。

Motamot：一个用于揭示大型语言模型在孟加拉政治情感分析中的优势的数据集

BriefGPT - AI 论文速递 ·

本文介绍了多种知识图谱构建和应用的方法，如AutoKG、CKG和Math-KG，强调了知识图谱在自然语言处理中的重要性，提升了语义理解和信息检索的效果。同时，研究探讨了实体对齐和文本生成技术，展示了知识图谱在各领域的应用潜力。

BanglaAutoKG：语义神经图过滤在孟加拉自动知识图谱构建中的应用

BriefGPT - AI 论文速递 ·

提出了一种使用 AWD-LSTM 架构和有效的迁移学习方法来解决孟加拉文学领域的作者归属问题，通过分析不同的标记化方法，并介绍了一个包含 16966 份样本文本和 13.4 + 百万词汇的公开孟加拉作者归属数据集（BAAD16），此外还释放了六个预训练语言模型的变体。通过对 BAAD16 数据集及其他公开数据集的评估，实验证明所提出的模型优于目前的最先进模型，在 BAAD16 数据集上达到...

通过迁移学习使用 ULMFiT 对孟加拉文学进行作者归属

BriefGPT - AI 论文速递 ·

本研究提供了一个新的词级孟加拉手语数据集（BdSL40），包含 611 个单词的 40 个视频，以及两种不同的分类方法。研究揭示了 BdSL、西孟加拉手语和印度手语之间的词汇和语义相似性，以及对 BdSL 缺乏词级数据集的情况。数据集和源代码已发布以促进进一步研究。

BdSLW60: 一个词汇级别的孟加拉手语数据集

BriefGPT - AI 论文速递 ·

本文提出了一个框架来生成合成的3D空中签名，支持自动签名验证和决策制定。通过模拟真实数据库的合成3D签名数据库，证实了该技术的有效性，并对合成3D空中书写和手势进行了验证。

孟加拉和天城体字的静态和动态合成

BriefGPT - AI 论文速递 ·

决策行为在交通规划中很重要。本研究使用低收入家庭数据，采用多项式逻辑模型和机器学习分类器，解释决策行为。结果显示随机森林模型准确性最佳，旅行成本增加会降低公交出行概率，旅行时间减少则增加对地铁的偏好。这项研究扩展了机器学习技术在模式选择分析中的应用，并提高了对这些模型在真实数据方面的理解。

评估使用统计和机器学习技术确定出行方式选择的因素 —— 以印度孟加拉城市为例

BriefGPT - AI 论文速递 ·

介绍了手动注释的NC-SentNoB数据集，用于识别约15k个噪声孟加拉文本中的十种不同类型的噪声。实验结果显示现有的噪声降低方法不理想，强调了未来研究需要更合适的方法。

噪声孟加拉文本情感分析中噪声减少方法的比较分析

BriefGPT - AI 论文速递 ·

连接节点：利用时空图神经网络进行准确的孟加拉手语识别

BriefGPT - AI 论文速递 ·

在这篇论文中，我们探讨了社会技术系统（情感分析工具）中潜在的偏见，并对具有殖民主义影响的孟加拉社群中的性别、宗教和国籍等身份类别进行了分析。通过对所有孟加拉情感分析工具进行算法审计，我们发现这些工具不仅在输出上存在不一致性，而且在不同身份表达方式下存在偏见。我们将研究结果与孟加拉社群的殖民主义社会文化结构联系起来，并探讨了情感分析工具下游偏见的影响。

自然语言处理的 “殖民冲动”：孟加拉情感分析工具及其基于身份的偏见审计

BriefGPT - AI 论文速递 ·

我们提出了一个全面的数据集，用于在孟加拉国 9 个地区的各种驾驶环境中进行目标检测。该数据集仅从智能手机摄像头采集，以真实的方式展现了世界的情景，包括白天和夜晚条件。

BadODD: 孟加拉自主驾驶物体检测数据集

BriefGPT - AI 论文速递 ·