本研究评估了九种大型语言模型在孟加拉语消费者健康查询中的零-shot性能,结果显示Mixtral-8x22b-Instruct模型在摘要生成方面表现最佳,展现了其在低资源语言医疗查询中的潜力。
本文讲述了作者在印度的编程经历,逐渐对代码产生热情。通过学习Python和SQL,作者在项目中不断探索,决定攻读BCA(荣誉)学位以深入技术。作者还分享了对数据分析、云计算和区块链的兴趣,并希望通过博客与他人分享学习过程。
本文提出了BdSLW401数据集,包含401个手势和102,176个视频样本,旨在解决孟加拉手语识别中的变异和数据集限制。通过相对量化编码(RQE)显著提升了识别效果。
本研究开发了一种基于变换器的模型,针对孟加拉语数学文字问题的转化挑战,利用'PatiGonit'数据集实现了97.30%的准确率,验证了教育AI工具的有效性。
本研究提出了一种利用自然语言处理和机器学习算法识别社交媒体文本中抑郁情绪的方法。分析了983条文本,结果表明该方法有效,可为心理学家提供情感分析工具,改善抑郁患者的生活。
本研究针对孟加拉语情感分析的研究空白,提出了一种新的混合方法,结合基于规则的算法与预训练语言模型。研究表明,BSPS与BanglaBERT的混合方法在九个情感类别的分类准确性和精确性上优于单独使用BanglaBERT模型,进而强调了规则基础和预训练语言模型相结合的重要性和有效性。
'Moj Masti'团队在IIIT-D多语言恶性评论识别挑战中,使用ShareChat/Moj的数据,通过多语言Transformer模型处理混合代码分类任务,取得了平均F-1分数0.9的最佳成绩,并在排行榜上获得第一名。
本研究提出了一种基于手部关节骨架的时空注意模型,用于改善孟加拉手语(BSL)识别中的不足。该模型通过捕捉结构位移和短期依赖关系,在计算复杂度上降低,并在多个数据集上展示了优异的识别精度。
本研究通过卷积神经网络和集成迁移学习的创新方法,提高了孟加拉手写字符识别的准确率。模型在原始数据集上达到92%的准确率,在预处理数据集上达到98%的准确率。
本研究提出了一个包含18,000张图像的新BdSL数据集,解决了孟加拉手语识别中的数据集匮乏问题。通过混合卷积神经网络模型,该研究在该数据集上实现了97.92%的识别准确率,为孟加拉手语的研究提供了重要的基础与突破。
该研究使用GPT 3.5、GPT 4和DepGPT等模型,对Reddit和X数据集进行分类,创建了孟加拉社交媒体抑郁数据集(BSMDD)。DepGPT模型在零样本学习和少样本学习场景中表现优异,准确度和F1分数接近完美。该研究强调了LLM模型在不同语言环境中的有效性和灵活性,为抑郁症检测提供了深入信息。
研究证明,嵌入知识图谱可以提高实体和专有名词的翻译效果。提出了两种方法以增强神经模型的语义特征提取和对数据稀缺性和词汇表外的单词的挑战进行了探讨。KG-NMT 模型取得了很好的效果。
提出了一种使用 AWD-LSTM 架构和有效的迁移学习方法来解决孟加拉文学领域的作者归属问题,通过分析不同的标记化方法,并介绍了一个包含 16966 份样本文本和 13.4 + 百万词汇的公开孟加拉作者归属数据集(BAAD16),此外还释放了六个预训练语言模型的变体。通过对 BAAD16 数据集及其他公开数据集的评估,实验证明所提出的模型优于目前的最先进模型,在 BAAD16 数据集上达到...
本研究提供了一个新的词级孟加拉手语数据集(BdSL40),包含 611 个单词的 40 个视频,以及两种不同的分类方法。研究揭示了 BdSL、西孟加拉手语和印度手语之间的词汇和语义相似性,以及对 BdSL 缺乏词级数据集的情况。数据集和源代码已发布以促进进一步研究。
本文提出了一个框架来生成合成的3D空中签名,支持自动签名验证和决策制定。通过模拟真实数据库的合成3D签名数据库,证实了该技术的有效性,并对合成3D空中书写和手势进行了验证。
决策行为在交通规划中很重要。本研究使用低收入家庭数据,采用多项式逻辑模型和机器学习分类器,解释决策行为。结果显示随机森林模型准确性最佳,旅行成本增加会降低公交出行概率,旅行时间减少则增加对地铁的偏好。这项研究扩展了机器学习技术在模式选择分析中的应用,并提高了对这些模型在真实数据方面的理解。
介绍了手动注释的NC-SentNoB数据集,用于识别约15k个噪声孟加拉文本中的十种不同类型的噪声。实验结果显示现有的噪声降低方法不理想,强调了未来研究需要更合适的方法。
在这篇论文中,我们探讨了社会技术系统(情感分析工具)中潜在的偏见,并对具有殖民主义影响的孟加拉社群中的性别、宗教和国籍等身份类别进行了分析。通过对所有孟加拉情感分析工具进行算法审计,我们发现这些工具不仅在输出上存在不一致性,而且在不同身份表达方式下存在偏见。我们将研究结果与孟加拉社群的殖民主义社会文化结构联系起来,并探讨了情感分析工具下游偏见的影响。
我们提出了一个全面的数据集,用于在孟加拉国 9 个地区的各种驾驶环境中进行目标检测。该数据集仅从智能手机摄像头采集,以真实的方式展现了世界的情景,包括白天和夜晚条件。
完成下面两步后,将自动完成登录并继续当前操作。