本研究评估了九种大型语言模型在孟加拉语消费者健康查询摘要中的表现。结果显示,Mixtral-8x22b-Instruct模型在ROUGE指标上表现最佳,证明了这些模型在低资源语言医疗查询摘要中的潜力。
本文讲述了作者在印度的编程经历,逐渐对代码产生热情。通过学习Python和SQL,作者在项目中不断探索,决定攻读BCA(荣誉)学位以深入技术。作者还分享了对数据分析、云计算和区块链的兴趣,并希望通过博客与他人分享学习过程。
本文提出了BdSLW401,一个包含401个手势和102,176个视频样本的孟加拉手语数据集,以解决手语识别中的说话者变异和视角变化问题。通过引入相对量化编码(RQE),显著提升了基于变换器的手语识别效果,增强了模型的解释性和识别率。
本研究通过变换器模型解决孟加拉语数学文字问题的转化挑战,开发了包含10,000个问题的"PatiGonit"数据集,准确率达到97.30%。该研究为孟加拉自然语言处理和学生问题解决能力提供了新方法。
本研究针对孟加拉语情感分析的研究空白,提出了一种新的混合方法,结合基于规则的算法与预训练语言模型。研究表明,BSPS与BanglaBERT的混合方法在九个情感类别的分类准确性和精确性上优于单独使用BanglaBERT模型,进而强调了规则基础和预训练语言模型相结合的重要性和有效性。
本研究提出了名为德霍罗尼的孟加拉气候变化和环境新闻数据集,包含2300篇带注释的新闻文章,旨在填补孟加拉在气候变化研究中的语言和资源缺口。同时引入了BanglaBERT-Dhoroni模型,以提升对气候和环境观点的检测能力。
该论文评估了多种模型以减少对少数群体的偏见,提出了多任务学习和深度学习模型,并测试了模型的偏见。研究还探讨了有毒言论的检测方法及其在不同文化背景下的表现,强调了社交偏见的识别和缓解。
本研究提出了一种基于骨架的手势识别模型,结合路径签名和多种特征描述符,利用注意手的原则和“dyadic method”提取特征。实验结果表明,该方法在手势识别中表现优异,并强调混合特征对识别准确率的提升,推动了手语识别技术的发展。
本文介绍了一种全卷积循环网络(FCRN)框架,用于手写汉字文本识别。FCRN通过在线数据训练,学习笔尖轨迹与字符序列的关联,并采用优化的波束搜索方法集成语言模型,显著提高识别率。在CASIA-OLHWDB和ICDAR 2013数据集上,分别达到了96.40%和95.00%的正确率。
本文介绍了多个手语数据集及其相关研究,包括美国手语、土耳其手语和孟加拉手语。研究者们开发了基于深度学习的手语识别模型,提高了识别准确率,并提供了新的数据集以促进手语技术的发展。这些研究为手语识别领域提供了重要的基准和方法。
本研究创建了一个包含33,605条孟加拉文社交媒体数据的情感分析数据集,并比较了多种语言模型的表现。结果表明,单语言变换器模型在零指导和少量指导下优于其他模型。此外,研究探讨了心理健康与社交媒体的关系,提出了DepGPT模型用于抑郁症检测,取得了高准确度和F1分数,为孟加拉语情感分析提供了重要见解和工具。
本文介绍了多种知识图谱构建和应用的方法,如AutoKG、CKG和Math-KG,强调了知识图谱在自然语言处理中的重要性,提升了语义理解和信息检索的效果。同时,研究探讨了实体对齐和文本生成技术,展示了知识图谱在各领域的应用潜力。
提出了一种使用 AWD-LSTM 架构和有效的迁移学习方法来解决孟加拉文学领域的作者归属问题,通过分析不同的标记化方法,并介绍了一个包含 16966 份样本文本和 13.4 + 百万词汇的公开孟加拉作者归属数据集(BAAD16),此外还释放了六个预训练语言模型的变体。通过对 BAAD16 数据集及其他公开数据集的评估,实验证明所提出的模型优于目前的最先进模型,在 BAAD16 数据集上达到...
本研究提供了一个新的词级孟加拉手语数据集(BdSL40),包含 611 个单词的 40 个视频,以及两种不同的分类方法。研究揭示了 BdSL、西孟加拉手语和印度手语之间的词汇和语义相似性,以及对 BdSL 缺乏词级数据集的情况。数据集和源代码已发布以促进进一步研究。
本文提出了一个框架来生成合成的3D空中签名,支持自动签名验证和决策制定。通过模拟真实数据库的合成3D签名数据库,证实了该技术的有效性,并对合成3D空中书写和手势进行了验证。
决策行为在交通规划中很重要。本研究使用低收入家庭数据,采用多项式逻辑模型和机器学习分类器,解释决策行为。结果显示随机森林模型准确性最佳,旅行成本增加会降低公交出行概率,旅行时间减少则增加对地铁的偏好。这项研究扩展了机器学习技术在模式选择分析中的应用,并提高了对这些模型在真实数据方面的理解。
介绍了手动注释的NC-SentNoB数据集,用于识别约15k个噪声孟加拉文本中的十种不同类型的噪声。实验结果显示现有的噪声降低方法不理想,强调了未来研究需要更合适的方法。
在这篇论文中,我们探讨了社会技术系统(情感分析工具)中潜在的偏见,并对具有殖民主义影响的孟加拉社群中的性别、宗教和国籍等身份类别进行了分析。通过对所有孟加拉情感分析工具进行算法审计,我们发现这些工具不仅在输出上存在不一致性,而且在不同身份表达方式下存在偏见。我们将研究结果与孟加拉社群的殖民主义社会文化结构联系起来,并探讨了情感分析工具下游偏见的影响。
我们提出了一个全面的数据集,用于在孟加拉国 9 个地区的各种驾驶环境中进行目标检测。该数据集仅从智能手机摄像头采集,以真实的方式展现了世界的情景,包括白天和夜晚条件。
完成下面两步后,将自动完成登录并继续当前操作。