小红花·文摘

本研究提出了一种名为PC-SubQ的提示策略，旨在提升大型语言模型（LLMs）在因果推理中的表现。通过将任务拆分为子问题，LLMs能够更有效地应用因果发现算法，从而增强其鲁棒性。

Prompting Strategy for Large Language Models to Infer Causal Relationships

BriefGPT - AI 论文速递 ·

本文探讨了多种提示策略在大型语言模型中的应用，包括动态提示、问题重新阅读和元提示技术。这些方法通过优化提示信息和任务分解，提高了模型的性能和推理能力，尤其在复杂任务中表现出色。研究表明，模型规模、提示结构和任务设计对性能有显著影响。

动态提示中介：理解任务的上下文提示优化控制

BriefGPT - AI 论文速递 ·

如何通过提示工程为AI代理添加推理能力

The New Stack ·

突破：语言人工智能模型可以从自身输出中学习，增强长文本推理能力

DEV Community ·

本研究探讨了SAM系列模型在CT扫描骨骼分割中的零-shot能力，分析了不同提示策略对医学图像分割的优化影响。结果显示，最佳提示设置依赖于模型类型和数据集特征，并提供了指导原则以支持决策。

Zero-shot Capability of SAM Family Models for Bone Segmentation in CT Scans

BriefGPT - AI 论文速递 ·

本研究提出了一种基于辩证行为疗法的提示策略，旨在应对大型语言模型在复杂推理任务中的挑战。该方法显著提高了小型模型的准确性，平均提升7%至16.2%，展现出良好的应用前景。

Application of Dialectical Behavior Therapy in Prompting Large Language Models

BriefGPT - AI 论文速递 ·

本研究分析了大型语言模型（LLMs）在仇恨言论生成解释中的表现，发现其解释在流畅性和逻辑性上评价较高，但不同提示策略会影响说服力，可能导致错误判断。同时，研究探讨了LLMs中的社会偏见，强调在内容审核中需谨慎使用这些模型，以避免强化刻板印象。

仇恨具象化：探讨大型语言模型在内容审查中的角色

BriefGPT - AI 论文速递 ·

该研究探讨了大型语言模型在零样本推理中的应用，提出了零样本CoT和Active-Prompt等新方法，显著提升了推理性能。通过改进提示策略和引入跨语言提示，研究展示了模型在复杂推理任务中的优越性，尤其在GPT-4上表现突出。

实例自适应零-shot思维链提示

BriefGPT - AI 论文速递 ·

本文评估了基于Segment Anything Model (SAM) 的医学图像分割能力，结果表明SAM在CT数据上表现良好，适合半自动分割。研究提出了all-in-SAM流程和AI-SAM模型，优化了提示策略，显著提升了分割性能，并通过SAM-REF框架解决了提示与图像结合的低效问题，展示了在复杂场景中的优越性。

自我提示使SAM重新焕发光彩

BriefGPT - AI 论文速递 ·

本文介绍了多种基于大型语言模型的日志解析方法，如USTEP、LogPrompt和RAPID，强调了它们在效率和准确性上的优势。研究表明，合适的提示策略能显著提升解析效果，并探讨了日志解析中的挑战与机遇。LogEval基准套件用于评估不同模型在日志分析中的表现，揭示了大语言模型的优势与局限性，为未来研究提供指导。

HELP：基于层次嵌入的日志解析

BriefGPT - AI 论文速递 ·

Eval4NLP 2023 共享任务探讨了机器翻译和摘要评估中的提示和分数提取。研究表明，基于大型语言模型（LLMs）的评估方法在自然语言生成中表现出色，尤其在总结任务中与人类评估的相关性高达0.477。实验提出了新颖的提示策略，展示了LLMs在多语言和鲁棒性评估中的潜力，推动了机器翻译的进步。

PrExMe！大规模探索开源 LLM 用于机器翻译和摘要评估

BriefGPT - AI 论文速递 ·

这篇研究探讨了大型语言模型（LLMs）在遵循指令生成文本方面的评估，提出了新的评估基准和提示策略，以缩小LLM与人类评估者之间的差距。研究发现现有模型在指令遵循能力上明显落后于人类，并指出了改进的空间。

评估大型语言模型在故事结局生成中的指令遵循能力

BriefGPT - AI 论文速递 ·

本研究探讨大型语言模型在推荐系统中的排名能力，发现其在零样本排名上表现良好，但历史互动顺序等因素会影响效果。不同提示策略显著影响分类准确性，提出了一种新颖的 Setwise 提示方法以提高效率，并评估了多种提示类型在临床自然语言处理任务中的表现，为提示设计提供了新见解。

基于零样本 LLM 排名器的提示变体研究

BriefGPT - AI 论文速递 ·

本文探讨了大型语言模型（LLM）在文化符号生成和社会偏见识别方面的表现，发现LLM在不同文化生成中存在不平衡，社会人口背景显著影响模型输出。通过评估多种提示策略，提出了改进模型文化一致性和减少偏见的方法，强调多语言预训练数据集的重要性。

文化影响还是安慰剂？关于社会人口统计提示的有效性

BriefGPT - AI 论文速递 ·

在Databricks上轻松提升Text2SQL性能

Databricks ·

提示工程的基本理念以及如何将这些理念应用于提升大语言模型的性能 [译]

宝玉的分享 ·

本文探讨了零样本学习在文本分类中的应用，比较了大型语言模型与微调小型模型的性能。研究表明，提示策略显著影响分类准确性，小型模型在某些任务上可与大型模型相媲美。提出的新方法适用于多种语言任务，具有高效训练和部署的优势，实验结果显示其在多个基准测试中表现优异。

小型语言模型也很不错：一项零样本分类的实证研究

BriefGPT - AI 论文速递 ·

本文介绍了一种新颖的微调框架，旨在提升Segment Anything Model（SAM）在医学图像分割中的性能。通过批量提示策略和自我提示，研究发现适当的提示能显著改善SAM在不同数据集上的表现。提出的PromptUNet模型结合多种提示类型，实验结果表明其在医学图像分割中的精度优于现有主流方法。

SAMCT: 无需劳动的任务指示器提示下，对任何 CT 进行分割

BriefGPT - AI 论文速递 ·

本文介绍了一种基于语言生成的移动趋势预测方法SHIFT，利用语言模型提高预测准确性。研究提出的PromptCast模型结合历史和上下文信息，展示了大型语言模型在移动性预测中的潜力，并强调了提示策略的重要性。

基于预测的自然语言人类移动挖掘

BriefGPT - AI 论文速递 ·

LLM-Rec是一种提高大型语言模型在个性化内容推荐中性能的方法，使用四种不同的提示策略，结合原始内容描述和LLM生成的增强输入文本，可以改善推荐性能。这一发现强调了多样的提示和输入增强技术与大型语言模型相结合的重要性。

(动态) 提示可能足以修复压缩的 LLM 模型

BriefGPT - AI 论文速递 ·