小红花·文摘

基于标记训练，基于概念校准：大型语言模型中语义校准的出现

Apple Machine Learning Research ·

mRAKL：面向低资源语言的多语言检索增强知识图谱构建

Apple Machine Learning Research ·

阿里通义实验室推出了ZeroSearch，这是一个基于强化学习的框架，无需真实搜索引擎。通过模拟搜索环境和轻量微调，该框架提升了大模型的检索能力，降低了API成本。实验结果显示，ZeroSearch在多种问答任务中表现优异，兼容多种强化学习算法，具备良好的训练稳定性和灵活性，为智能检索提供了新思路。

通义实验室新研究：大模型自己「扮演」搜索引擎，提升推理能力无需搜索API

量子位 ·

本研究提出了一种知识驱动的多代理框架m-KAILIN，旨在解决生物医学领域开放式注释科学语料数量和质量不足的问题。该框架通过合作多代理架构提取和合成高质量文本数据，显著提升生物医学问答任务的表现，生成的数据集在一定程度上超越了现有模型。

m-KAILIN：面向生物医学大语言模型训练的知识驱动代理科学语料提取框架

BriefGPT - AI 论文速递 ·

本研究提出了一种上下文增强层（CaLE）的方法，旨在提高大型语言模型在生成时的上下文一致性，特别是在问答任务中对未知或冲突信息的处理能力。

A Method for Enhancing the Utilization of Contextual Knowledge through an Information Availability Base Layer

BriefGPT - AI 论文速递 ·

对DistilBERT进行微调以实现问答

MachineLearningMastery.com ·

本研究针对视频理解中的数据不平衡问题，指出传统方法难以适应多样化情况。通过因果建模，提升视频关系检测和问答任务的鲁棒性与性能。

Causal Model-Based Video Semantic Understanding

BriefGPT - AI 论文速递 ·

本研究提出了AttackSeqBench基准，用于评估大型语言模型对网络攻击序列的理解能力，简化了问答任务的构建，并分析了不同模型的优缺点。

AttackSeqBench：大规模语言模型对网络攻击序列模式理解的基准测试

BriefGPT - AI 论文速递 ·

本研究提出了一种无监督方法，利用语用学原理提升检索增强生成（RAG）模型的效果。通过识别与问题相关的重要句子并强化其地位，问答任务的表现显著提高，尤其在PubHealth任务中准确率提升了19.7%。

少说多意：在检索增强生成中利用语用学

BriefGPT - AI 论文速递 ·

本研究提出了一种新方法EpMAN，旨在提升大型语言模型处理长上下文的效率。实验结果显示，EpMAN训练的模型在长上下文回忆和问答任务中表现更佳。

EpMAN: A Plot Memory Attention Mechanism for Scaling to Longer Contexts

BriefGPT - AI 论文速递 ·

本研究提出了MAT-Steer框架，通过针对性干预多个属性，解决了现有推理干预方法在多属性冲突中的不足，显著提升了语言模型在问答和生成任务中的表现。

Multi-Attribute Steering of Language Models via Targeted Intervention

BriefGPT - AI 论文速递 ·

本研究提出了SMI指标，解决了封闭书籍问答任务中大型语言模型表现的预测问题，强调了数据构建和知识保持的挑战。实验证明SMI与模型准确性之间存在强线性相关性，为资源优化和数据对齐提供了重要见解。

Predicting the Performance of Large Language Models on Closed Book Question Answering Tasks Using Pre-training Available Information

BriefGPT - AI 论文速递 ·

本研究提出了一种针对低资源语言（如斯瓦希里语）的无训练数据语义网络生成算法，能够将主谓宾结构映射为三元组，并在问答任务中实现最高78.6%的准确率。

基于标记训练，基于概念校准：大型语言模型中语义校准的出现

mRAKL：面向低资源语言的多语言检索增强知识图谱构建

通义实验室新研究：大模型自己「扮演」搜索引擎，提升推理能力无需搜索API

m-KAILIN：面向生物医学大语言模型训练的知识驱动代理科学语料提取框架

A Method for Enhancing the Utilization of Contextual Knowledge through an Information Availability Base Layer

对DistilBERT进行微调以实现问答

Causal Model-Based Video Semantic Understanding

AttackSeqBench：大规模语言模型对网络攻击序列模式理解的基准测试

少说多意：在检索增强生成中利用语用学

EpMAN: A Plot Memory Attention Mechanism for Scaling to Longer Contexts

Multi-Attribute Steering of Language Models via Targeted Intervention

Predicting the Performance of Large Language Models on Closed Book Question Answering Tasks Using Pre-training Available Information

Semantic Network Generation Algorithm for Low-Resource Languages (e.g., Swahili)

SUGAR: Achieving Smarter Retrieval through Contextual Confidence

Multi-Level Optimal Transport Method for Universal Cross-Tokenizer Knowledge Distillation

A Study on the Performance of Large Language Models in Question-Answering Tasks

Context Filtering in Question Answering Based on Reward Modeling

Uniform Discretized Integrated Gradients: An Effective Attribution-Based Method for Explaining Large Language Models

Unlocking the Potential of Large Language Models as Multimodal Encoders for Text and Graph-Structured Data

Unleashing Multi-Hop Reasoning Potential in Large Language Models through Repetition of Misordered Context