大型语言模型(LLMs)在招聘和招生等资源有限的环境中被广泛应用,但可能反映和加剧社会偏见。研究扩展了单轴公平评估,关注交叉偏见,创建了WinoIdentity基准,评估245,700个提示中的50种偏见模式。结果显示,LLMs在某些身份群体上的信心差异可达40%,尤其在反刻板印象的情境中,对双重弱势身份的信心最低。这表明LLMs的表现可能更多依赖于记忆而非逻辑推理。
机器之心数据服务现已上线,提供高效稳定的数据获取服务,帮助用户轻松获取所需数据。
本研究提出了一种新框架TEO,解决了现有不完整发言重写方法忽视指代和省略的问题。TEO通过生成编辑操作和重写发言,显著提升了重写效果,实验结果表明其在多个数据集上优于现有模型。
Event Coreference Resolution (ECR) is addressed through the development of EasyECR, an open-source library that standardizes data structures, abstracts ECR pipelines, integrates representative...
本文提出了一种新方法,通过大型多模态模型和无类别分割模型,实现视觉实体的密集连接和实体级分割。该方法利用颜色映射编码分割蒙版,提升细粒度预测的分辨率。同时,研究介绍了基于3D大型多模型的Grounded 3D-LLM模型,探索3D场景理解,结合视觉与语言模型,在多个基准测试中表现出领先性能。
本文介绍了新的孟加拉语数据集BenCoref,评估了多种模型在指代消解任务中的表现,强调了特定语言资源的需求,并探讨了跨语言和多语种指代解析的挑战与进展。
该论文旨在探讨语言模型的词汇是否具有指向性,认为语言模型的输入和输出都可以追溯到它们所指代的对象,因此认为语言模型也属于人类语言社群的一部分。
该文章介绍了一种融合指代消解的序列标注方法来改进人名识别的技术,并使用爬虫技术获取舆情公告文本数据。通过分词工具进行文本抽取和数据增强,使用BERT语言预处理模型和指代消解算法提高人名识别准确率。该算法可应用于机构名和地名等实体的识别。
本文提出了一种结合指代消解的序列标注方法,利用BERT模型和指代消解算法提高人名识别的准确率。研究表明,该方法在数据预处理、动态词向量获取和子串识别方面优于传统方法,未来可扩展至机构名、地名等实体识别,提升京东小程序的文本识别效果。
Ferret是一种新型多模态大型语言模型,能够理解图像中的空间引用并进行准确描述。该模型在移动用户界面理解、视觉语言解析和对象检测等任务中表现出色。研究还提出了基于Transformer的视觉定位方法,显著提高了视觉理解能力,并展示了在细粒度视觉分类中的潜力。
本文介绍了多个新数据集,涵盖指代消解和命名实体识别等任务,特别是包含大量文学文本的注释数据集。这些数据集旨在评估跨领域性能,分析指代特征,推动自然语言理解研究的发展。
本文介绍了一个新的基准测试 Generalized Referring Expression Segmentation (GRES),它允许表达式引用任意数量的目标对象。通过构建大规模数据集 gRefCOCO,并提出基于区域的 GRES 基线 ReLA,成功划分具有子实例线索的区域,并建模区域 - 区域和区域 - 语言之间的依赖关系。实验结果表明,GRES的一个重要挑战是复杂的关系建模,而基于区域的方法ReLA在新提出的GRES和经典的RES任务上取得了最新的性能水平。
本文介绍了一种新的弱监督引用图像分割框架,通过利用引用文本提供的信息来定位目标物体。该框架具有三个创新点,包括协调视觉和语言特征之间的域差异、减少噪声背景信息并提高响应图的正确性、生成高质量的伪标签用于训练分割网络。实验证明该框架在性能上优于最新的弱监督方法。
该研究提出了一种基于句法树的语法引导生成模式,通过两个部分的解码过程来预测填充文本和生成自然语言文本。实验结果表明,该方法在有效性和可解释性方面优于自回归基线。
通过网络修剪的角度,研究了一种特征注入的注意头选择和操作策略,并在对话摘要中进行了案例研究,结果表明通过注意头操作注入指代关系信息可以提高对话摘要的性能。
通过在希尔伯特空间中学习单词的意义并通过将语法结构转化为参数化量子电路的翻译,我们评估了 Quantum Natural Language Processing (QNLP) 对 Winograd 风格的代词消解任务的翻译,并训练了一个用于二元分类的 Variational Quantum Classifier (VQC),在 IBMQ 软件上执行的模拟获得了 87.20% 的 F1...
完成下面两步后,将自动完成登录并继续当前操作。