我是伊朗独立开发者Shahab Nazari,创建了免费的波斯语AI聊天机器人AI Shahab,使用我自己的语言模型“cas”。该项目旨在为全球波斯语用户提供AI工具。欢迎访问并反馈!
本研究提出FarsEval-PKBETS基准,包含4000个多样化问题,旨在评估波斯语大型语言模型的性能。测试结果显示,现有模型的平均正确率低于50%,表明其在复杂波斯语任务中存在显著能力缺陷。
本研究提出了一种评估框架,旨在将波斯语大型语言模型(LLMs)与安全性、公平性和社会规范等伦理维度对齐。通过创建多种波斯语数据集,为评估波斯语LLMs提供新的方法和数据基础,促进本土文化的合规性。
电影《波斯语课》讲述了一名犹太人在二战中为生存而虚构波斯语的故事。他通过教授德国军官这种虚构语言,成功隐藏了自己的身份。影片引发了对语言学习和生存压力的思考,反映了文化和环境对人类行为的影响。
本研究建立了波斯语文本嵌入的全面基准,涵盖63个数据集和七种任务,首次引入聊天机器人评价数据集和新摘要检索任务,推动波斯语自然语言处理的发展。
本研究推出了Matina语料库,包含72.9B标记,解决了波斯语数据集稀缺问题。该语料库经过预处理和去重,确保数据质量,为波斯语自然语言处理模型的发展奠定基础。
本研究探讨了大型语言模型在波斯语文化适应性评估中的不足。通过引入PerCul数据集,采用故事驱动的多项选择题,旨在提高模型的文化敏感性。实验结果显示,现有模型与用户基准之间存在11.3%的差距,最佳模型的差距达到21.3%。
本研究解决了在低资源语言中构建检索增强生成(RAG)系统的特定障碍,特别是波斯语复杂的形态学和多样的句法。通过引入波斯语特定模型和全面的基准框架,研究显示MatinaSRoberta在上下文相关性和检索准确性上优于之前的嵌入方法,这为波斯语的RAG系统发展和自然语言处理应用如搜索引擎和法律文件分析提供了重要的潜力。
本研究针对波斯语问答系统资源匮乏的问题,提出了一个全面的开放域数据集NextQuAD,包含7515个上下文及23918个问答。研究中应用了基于BERT的问答模型,并通过与其他波斯语数据集的比较,显示出NextQuAD在提高准确率方面的显著贡献。
本文探讨了在中等资源场景下,短语基础统计机器翻译(PBSMT)如何超越基于Transformer的神经机器翻译(NMT),尤其是对于结构相似的语言对,如波斯语和印地语。研究结果显示,PBSMT在同一数据集上的BLEU得分为66.32,显著高于NMT的53.7,强调了根据语言特征选择合适翻译架构的重要性,并支持在NMT主导的环境中PBSMT作为高效替代方案的有效性。
本研究介绍了FarExStance,一个用于波斯语可解释立场检测的新数据集。微调的RoBERTa模型在立场检测中表现最佳,而Claude-3.5-Sonnet在解释质量上表现突出,对波斯语立场检测具有重要意义。
本研究提出了一种多阶段的参数高效微调方法,旨在将波斯语融入Llama模型,提高其在波斯语分类任务中的准确性,同时对英语任务无负面影响,甚至有所改善。
本研究解决了不同提示方法和大型语言模型(LLMs)与神经机器翻译(NMT)组合在成语翻译中的影响尚未深入研究的空白。通过引入包含成语的双语数据集并评估多种模型,研究发现Claude-3.5-Sonnet在翻译中表现出色,而结合较弱的LLMs与谷歌翻译可以改善英语到波斯语的翻译结果,这为未来的翻译系统提供了重要的见解。
RAG(检索增强生成)结合检索与深度学习,旨在通过整合外部信息提升大型语言模型的准确性和可靠性。研究将RAG分为四类,探讨其演进、评估方法及未来挑战,强调其在扩展大型语言模型应用中的潜力。
研究发现,GPT-4在波斯语的推理和知识任务中表现良好,但在特定任务上不如小型模型。将波斯语测试集翻译成英语后,GPT-3.5的性能提升,显示提升波斯语中大型语言模型性能的潜力。
该研究评估了基于Transformer的语音表示模型在跨多种语言的语音情感识别中的性能。结果显示,仅使用语音模型最优层的特征平均降低了7个数据集上的错误率32%。此外,德语和波斯语的语音情感识别方面取得了最新的成果。
研究发现,大型语言模型在波斯语中的有效性仍存在问题。尽管在英语中表现出色,但在资源稀缺的语言上效率较低。LLMs在推理能力和对一般知识的广泛理解任务中表现出色,但在特定任务上落后于细化调整的预训练模型。将测试集翻译成英语后输入GPT-3.5可以改善其性能。研究突显了提升波斯语中LLM性能的潜力。
EasyInstruct是一个易于使用的LLM指导处理框架,用于增强大型语言模型功能的关键技术。
本研究评估了连续手语识别技术在不同数据集和手语中的表现,并建立了新的基准。研究结果提供了对具有挑战性场景下技术的稳健性和泛化性的见解。
该研究评估了基于Transformer的语音情感识别模型在八种语音表示模型和六种不同语言上的性能。结果显示,仅使用语音模型最优层的特征可以降低错误率32%。此外,研究还在德语和波斯语的语音情感识别方面取得了最新成果。
完成下面两步后,将自动完成登录并继续当前操作。