本文提出多种无界和有界线性化方法,解决了现有序列标注无法处理复杂图形表示的问题。实验结果表明,优选编码下的序列标注在效率和准确性上接近最先进技术。
本研究探讨了跨语言文本分类中的上下文学习,提出了X-InSTA提示构建策略,表现优异。同时,研究提出了无监督提示方法和CLASP方法,利用合成数据改善低资源语言的处理效果。通过微调和PPCL方法提升序列标注任务性能,展示了大型语言模型在新任务中的显著性能提升。
本文提出了一种基于序列标注的分解策略,将实体和关系抽取任务分为头实体抽取和尾实体及关系抽取两个子任务。实验结果表明,该方法在多个数据集上实现了最佳F1分数,验证了其有效性。
本文提出了一种新框架,将手势检测视为多阶段序列标注问题,结合Transformer编码器和条件随机场进行处理。研究表明,该方法在手势笔划检测上优于现有模型,显著提高了手势单元检测的准确性,并能够捕捉共话手势的微观动态,为更精确的手势分析奠定基础。
本文提出了一种结合指代消解的序列标注方法,利用BERT模型和指代消解算法提高人名识别的准确率。研究表明,该方法在数据预处理、动态词向量获取和子串识别方面优于传统方法,未来可扩展至机构名、地名等实体识别,提升京东小程序的文本识别效果。
本研究介绍了一种灵活可扩展的合成数据生成流程,应用于土耳其语,生成了13万句高质量平行句子。使用神经机器翻译、序列标注和前缀调参等三种基线模型,取得了良好的结果,并对领域外数据集进行了详尽实验,获得了有关所提方法的可迁移性和鲁棒性的深入见解。通过发布数据集、基线模型和合成数据生成流程,鼓励进一步研究土耳其语错误检测和纠正。
该研究提出了一种新的简历信息提取方法,建立了多语言简历解析语料库,实验结果表明该模型优于之前的方法。研究还对模型进行了消融研究和性能分析,并描述了在生产环境中部署模型的权衡。
完成下面两步后,将自动完成登录并继续当前操作。