本文提出了一种统一关系预测方法UniHDSA,填补了层次文档结构分析的研究空白。该方法将多个子任务整合为一个框架,实验结果表明其在Comp-HRDoc和DocLayNet标准数据集上表现优异。
全景场景图生成(PSG)旨在分割图像中的对象并识别其关系。传统方法仅适用于封闭集,无法处理开放集关系。本文提出OpenPSG,结合预训练模型,实现开放集关系预测。通过引入关系查询变换器,提取对象对特征并判断关系,显著提升预测效率。实验结果表明,OpenPSG在开放集关系预测和全景场景图生成方面表现优异。
本研究探讨了利用大型语言模型(LLM)构建知识图的关键问题,提出了知识图LLM(KG-LLM)框架。实验结果表明,该方法在三元组分类和关系预测任务中表现优异,微调小模型(如LLaMA-7B)优于ChatGPT和GPT-4。
GraIL是一种基于图神经网络的关系预测框架,具有强的归纳偏差和推理本地子图结构的能力。与基于嵌入的模型不同,GraIL可以在训练后推广到未见实体和图形,并在归纳设置中优于规则归纳基线。
该研究使用KG-LLM框架对三元组进行建模,达到了最先进的性能水平。微调相对较小的模型优于最新的ChatGPT和GPT-4。
本研究利用大型语言模型(LLM)解决知识图的关键问题,通过KG-LLM框架对三元组进行建模,实验表明该方法在三元组分类和关系预测等任务中达到最先进的性能水平。微调相对较小的模型优于最新的ChatGPT和GPT-4。
完成下面两步后,将自动完成登录并继续当前操作。