小红花·文摘

研究人员提出了一种名为Separate and Locate (SaL)的新方法，通过探索文本的上下文线索和设计空间位置嵌入来构建OCR文本之间的空间关系，从而在TextVQA和ST-VQA数据集上获得了较好的准确性改进，并且无需任何预训练任务。