本研究提出了CityEQA任务,旨在通过主动探索城市环境回答开放性问题。引入的PMA智能体模型实现了长期规划,实验结果显示问答准确率达到60.7%。
本研究通过知识图谱增强大语言模型,成功解决软件仓库信息提取问题,问答准确率从65%提升至84%,显著改善技术与非技术利益相关者的数据访问。
AIxiv专栏促进学术交流,报道超过2000篇内容。马里兰大学研究团队提出AutoHallusion框架,自动生成视觉大模型的幻觉案例,以解决数据集不足的问题。实验结果显示,GPT-4V等模型在新基准数据集上的问答准确率最高为66%。该研究已发表于EMNLP 2024。
本研究提出了一种新型BAM嵌入,针对金融领域文本嵌入的不足,经过14.3M数据集调整,Recall@1达到62.8%,显著优于OpenAI的通用嵌入,问答准确率提高8%。
完成下面两步后,将自动完成登录并继续当前操作。