小红花·文摘

本研究探讨了合成数据生成在数学推理中的有效性，提出了一种迭代自动形式化的方法，利用定理证明器作为评判者，显著提高了大型语言模型的准确性，最高提升达6.00%。

Theorem Prover as a Judge for Synthetic Data Generation

BriefGPT - AI 论文速递 ·

本研究提出了一种新剪枝指标LLM-BIP，旨在提高现有结构化剪枝方法在评估连接重要性时的准确性。通过精确评估连接对变换器块输出的影响，该方法显著提升了剪枝效果，实验证明在多个推理任务中平均提高了3.26%的准确性。

LLM-BIP: Structured Pruning for Large Language Models with Block-Wise Importance Propagation

BriefGPT - AI 论文速递 ·

该研究提出了一种新方法，通过对比学习和语义嵌入技术，减少内容泄漏对作者身份识别的影响。研究表明，分离内容和风格嵌入空间显著提高了作者身份识别的准确性，尤其在挑战性评估中提升了多达10%。

Isolating Authorship from Content Using Semantic Embeddings and Contrastive Learning

BriefGPT - AI 论文速递 ·

本研究提出了一种新颖的卸载决策优化方法，旨在解决嵌入式设备在物体检测中的局部精度不足问题。通过引入奖励指标来量化卸载图像的准确性提升，实验结果表明该方法在小比例卸载情况下优于现有方案。

Optimizing Edge Offloading Decisions for Object Detection

BriefGPT - AI 论文速递 ·

本文介绍了多种基于时间模型适应的人员再识别方法，如图形更新探针、时空解耦和主动样本选择等。这些方法在多个数据集上显著提高了准确性，展示了在无监督和半监督领域的优势。

基于测试时间相似性修正的人员再识别方法研究

BriefGPT - AI 论文速递 ·

研究人员发现大型语言模型（LLMs）在处理推理步骤时存在一致性问题。通过引入“规划标记”作为指南并微调模型参数，解决了这个问题，并在三个数学问题数据集上取得了显著的准确性提升。

通过轨迹收集和过程奖励合成学习基于规划的推理

BriefGPT - AI 论文速递 ·

该研究提出了一种弱监督辅助任务学习网络模型(WAL-Net)，通过斑块分割任务为斑块分类任务提供有价值的信息，提升了颈动脉斑块分类准确性约1.3%。

WAL-Net：弱监督辅助任务学习网络用于颈动脉斑块分类

BriefGPT - AI 论文速递 ·

研究人员发现大型语言模型（LLMs）在处理个别推理步骤时表现良好，但在整个推理链上保持一致性方面存在困难。为了解决这个问题，他们引入了“规划标记”作为模型的指南，并通过微调模型的参数来实现。他们的方法在三个数学问题数据集上进行了评估，相对于基准方法，取得了显著的准确性提升。

StrategyLLM：作为问题解决的策略生成器，执行器，优化器和评估器的大型语言模型

BriefGPT - AI 论文速递 ·

研究发现大型语言模型在整个推理链上保持一致性方面存在困难，通过引入“规划标记”作为指南并微调模型参数来解决问题。该方法在三种不同的LLMs上评估，相对于原始的链式思维微调基准，取得了显著的准确性提升。

释放创造力的思维：语言模型作为层次策略在挑战性问题求解中的改进探索

BriefGPT - AI 论文速递 ·

研究发现大型语言模型在整个推理链上保持一致性方面存在困难，引入了“规划标记”作为指南，并通过微调模型参数来实现。该方法在三种不同的LLMs上进行了评估，相对于原始的链式思维微调基准，取得了显著的准确性提升。

逐步奖励：作为推理导航器的步骤级奖励模型

BriefGPT - AI 论文速递 ·

该文提出了一种新方案，使用编码向量空间的自动生成机制减少新数据生成的人工成本，对原始训练数据的一小部分进行注释即可获得明显的准确性改进。实验证明，该方法对情感分类有效，并在使用 IMDb 数据进行训练和 Amazon、SemEval 和 Yelp 等其他数据集进行 OOD 测试时，仅添加 1％手动反事实数据即可获得 + 3％的准确性提升。

释放反事实增强数据在超出分布的泛化中的潜力

BriefGPT - AI 论文速递 ·

研究发现，大型语言模型在整个推理链上保持一致性方面存在困难。为了解决这个问题，研究人员引入了“规划标记”作为模型的指南，并将其嵌入到模型的参数中进行微调。该方法可实现显著的准确性提升，且已在三种不同的LLMs上进行了评估。

用计划标记引导语言模型推理

BriefGPT - AI 论文速递 ·