小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了一种名为PC-SubQ的提示策略,旨在提升大型语言模型(LLMs)在因果推理中的表现。通过将任务拆分为子问题,LLMs能够更有效地应用因果发现算法,从而增强其鲁棒性。

Prompting Strategy for Large Language Models to Infer Causal Relationships

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-18T00:00:00Z

本文探讨了多种提示策略在大型语言模型中的应用,包括动态提示、问题重新阅读和元提示技术。这些方法通过优化提示信息和任务分解,提高了模型的性能和推理能力,尤其在复杂任务中表现出色。研究表明,模型规模、提示结构和任务设计对性能有显著影响。

动态提示中介:理解任务的上下文提示优化控制

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-03T00:00:00Z
如何通过提示工程为AI代理添加推理能力

本文探讨了AI代理架构中的提示策略如何提升推理能力。有效的提示工程技术包括逐步分解、明确格式指令、自我反思提示和上下文框架。这些策略帮助大型语言模型更系统地处理复杂任务,确保逻辑一致性和透明性。通过不同的推理策略(如ReAct、Chain of Thought和Reflection),代理能够更好地解决问题并进行自我审查,增强了问题解决的灵活性和透明度。

如何通过提示工程为AI代理添加推理能力

The New Stack
The New Stack · 2024-11-20T15:08:02Z
突破:语言人工智能模型可以从自身输出中学习,增强长文本推理能力

大型语言模型(LLMs)在长文本推理中表现优异。研究表明,适当的提示策略可以提升LLMs的自我推理能力,从而增强其长文本推理能力。

突破:语言人工智能模型可以从自身输出中学习,增强长文本推理能力

DEV Community
DEV Community · 2024-11-16T06:55:23Z

本研究探讨了SAM系列模型在CT扫描骨骼分割中的零-shot能力,分析了不同提示策略对医学图像分割的优化影响。结果显示,最佳提示设置依赖于模型类型和数据集特征,并提供了指导原则以支持决策。

Zero-shot Capability of SAM Family Models for Bone Segmentation in CT Scans

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-13T00:00:00Z

本研究提出了一种基于辩证行为疗法的提示策略,旨在应对大型语言模型在复杂推理任务中的挑战。该方法显著提高了小型模型的准确性,平均提升7%至16.2%,展现出良好的应用前景。

Application of Dialectical Behavior Therapy in Prompting Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-10T00:00:00Z

本研究分析了大型语言模型(LLMs)在仇恨言论生成解释中的表现,发现其解释在流畅性和逻辑性上评价较高,但不同提示策略会影响说服力,可能导致错误判断。同时,研究探讨了LLMs中的社会偏见,强调在内容审核中需谨慎使用这些模型,以避免强化刻板印象。

仇恨具象化:探讨大型语言模型在内容审查中的角色

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-03T00:00:00Z

该研究探讨了大型语言模型在零样本推理中的应用,提出了零样本CoT和Active-Prompt等新方法,显著提升了推理性能。通过改进提示策略和引入跨语言提示,研究展示了模型在复杂推理任务中的优越性,尤其在GPT-4上表现突出。

实例自适应零-shot思维链提示

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-30T00:00:00Z

本文评估了基于Segment Anything Model (SAM) 的医学图像分割能力,结果表明SAM在CT数据上表现良好,适合半自动分割。研究提出了all-in-SAM流程和AI-SAM模型,优化了提示策略,显著提升了分割性能,并通过SAM-REF框架解决了提示与图像结合的低效问题,展示了在复杂场景中的优越性。

自我提示使SAM重新焕发光彩

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-22T00:00:00Z

本文介绍了多种基于大型语言模型的日志解析方法,如USTEP、LogPrompt和RAPID,强调了它们在效率和准确性上的优势。研究表明,合适的提示策略能显著提升解析效果,并探讨了日志解析中的挑战与机遇。LogEval基准套件用于评估不同模型在日志分析中的表现,揭示了大语言模型的优势与局限性,为未来研究提供指导。

HELP:基于层次嵌入的日志解析

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-15T00:00:00Z

Eval4NLP 2023 共享任务探讨了机器翻译和摘要评估中的提示和分数提取。研究表明,基于大型语言模型(LLMs)的评估方法在自然语言生成中表现出色,尤其在总结任务中与人类评估的相关性高达0.477。实验提出了新颖的提示策略,展示了LLMs在多语言和鲁棒性评估中的潜力,推动了机器翻译的进步。

PrExMe!大规模探索开源 LLM 用于机器翻译和摘要评估

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-26T00:00:00Z

这篇研究探讨了大型语言模型(LLMs)在遵循指令生成文本方面的评估,提出了新的评估基准和提示策略,以缩小LLM与人类评估者之间的差距。研究发现现有模型在指令遵循能力上明显落后于人类,并指出了改进的空间。

评估大型语言模型在故事结局生成中的指令遵循能力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-24T00:00:00Z

本研究探讨大型语言模型在推荐系统中的排名能力,发现其在零样本排名上表现良好,但历史互动顺序等因素会影响效果。不同提示策略显著影响分类准确性,提出了一种新颖的 Setwise 提示方法以提高效率,并评估了多种提示类型在临床自然语言处理任务中的表现,为提示设计提供了新见解。

基于零样本 LLM 排名器的提示变体研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-20T00:00:00Z

本文探讨了大型语言模型(LLM)在文化符号生成和社会偏见识别方面的表现,发现LLM在不同文化生成中存在不平衡,社会人口背景显著影响模型输出。通过评估多种提示策略,提出了改进模型文化一致性和减少偏见的方法,强调多语言预训练数据集的重要性。

文化影响还是安慰剂?关于社会人口统计提示的有效性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-17T00:00:00Z
在Databricks上轻松提升Text2SQL性能

该文章介绍了使用开源的Llama3 8B Instruct模型在Spider开发数据集上获得79.9%得分的方法,比基准提高了19个百分点。通过不同的提示策略和LoRA微调,可以进一步提高模型性能。最终,该模型在Spider测试数据集上获得了78.9%得分,超过了Llama3 70B Instruct模型。

在Databricks上轻松提升Text2SQL性能

Databricks
Databricks · 2024-05-13T06:00:00Z
提示工程的基本理念以及如何将这些理念应用于提升大语言模型的性能 [译]

本文介绍了提示工程的基本理念和应用于大语言模型的方法,通过实验不同的提示来优化大语言模型的性能。提示词的组成部分包括输入数据、示例、指令、标签和上下文。大语言模型的上下文窗口长度决定了模型能处理的最长序列,可以通过一些方法扩展。提示工程的策略包括建立评估体系、从简单的提示开始、明确具体的描述、利用示例和避免不必要的复杂性。

提示工程的基本理念以及如何将这些理念应用于提升大语言模型的性能 [译]

宝玉的分享
宝玉的分享 · 2024-05-02T17:47:00Z

本文探讨了零样本学习在文本分类中的应用,比较了大型语言模型与微调小型模型的性能。研究表明,提示策略显著影响分类准确性,小型模型在某些任务上可与大型模型相媲美。提出的新方法适用于多种语言任务,具有高效训练和部署的优势,实验结果显示其在多个基准测试中表现优异。

小型语言模型也很不错:一项零样本分类的实证研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-17T00:00:00Z

本文介绍了一种新颖的微调框架,旨在提升Segment Anything Model(SAM)在医学图像分割中的性能。通过批量提示策略和自我提示,研究发现适当的提示能显著改善SAM在不同数据集上的表现。提出的PromptUNet模型结合多种提示类型,实验结果表明其在医学图像分割中的精度优于现有主流方法。

SAMCT: 无需劳动的任务指示器提示下,对任何 CT 进行分割

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-20T00:00:00Z

本文介绍了一种基于语言生成的移动趋势预测方法SHIFT,利用语言模型提高预测准确性。研究提出的PromptCast模型结合历史和上下文信息,展示了大型语言模型在移动性预测中的潜力,并强调了提示策略的重要性。

基于预测的自然语言人类移动挖掘

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-06T00:00:00Z

LLM-Rec是一种提高大型语言模型在个性化内容推荐中性能的方法,使用四种不同的提示策略,结合原始内容描述和LLM生成的增强输入文本,可以改善推荐性能。这一发现强调了多样的提示和输入增强技术与大型语言模型相结合的重要性。

(动态) 提示可能足以修复压缩的 LLM 模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-02T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码