PaddleOCR 3.2版本发布,英文文本识别精度提升近11%,新增泰语和希腊语支持。全面升级C++本地部署能力,提供高稳定性服务化部署方案,并支持细粒度性能基准测试,帮助用户优化部署。
“Fantastic”一词源于拉丁语“fantasticus”和希腊语“phantastikos”,最初意为“不真实的”或“富有想象力的”。该词在16世纪出现,现代用法演变为“极其好的”,常用于表扬和描述幻想故事。
本文提出了PhiloBERTA,这是一种跨语言的变换器模型,用于测量古希腊语和拉丁语词汇之间的语义关系。研究发现,词源相关的词对在抽象哲学概念上的语义相似度显著提高,并建立了一个定量框架以探讨哲学概念在两种语言之间的流动,为经典语言学研究提供了新方法。
本研究提出GLaM-Sign,旨在改善聋人及听障人士的沟通,提升希腊旅游行业的包容性。该项目结合音频、视频、文本转录和手语翻译,未来将扩展至更多语言,展示多模态资源在沟通与创新中的潜力。
本论文开发了希腊自然语言处理评估套件,包含四个专家验证的任务,涉及自然语言推理、词义消歧和隐喻检测。我们首次提供了标注所有推理标签的数据集,并利用ChatGPT高效获取资源不足语言的数据,强调希腊NLP需加速进展以跟上主流研究。
研究人员使用最大的古希腊数据集训练了BERT模型,成功纠正了文本传承中的错误,并证明了该模型填补古代手稿材料损伤的能力。同时,研究人员发现模型的注意力头编码了古代希腊语的某些语法特征。
该论文提出了一个基于语言学动机和技术相关的希腊自然语言处理评估套件,引入了四个专家验证的评估任务,特别针对自然语言推理、词义消歧和隐喻检测。同时,确认了任务的挑战性,并强调希腊 NLP 生态系统需要加速进展以与当代主流研究保持同步的需求。
完成下面两步后,将自动完成登录并继续当前操作。