小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
大型语言模型的上下文工程指南

本文探讨了上下文工程在大型语言模型中的重要性。研究表明,过多的输入信息会降低模型性能,尤其是当相关信息位于输入中间时。上下文窗口的设计及信息选择与压缩策略至关重要,有效的上下文工程能够提升模型响应质量,避免信息丢失和注意力稀释。

大型语言模型的上下文工程指南

ByteByteGo Newsletter
ByteByteGo Newsletter · 2026-04-06T15:30:52Z
ChatGPT因用户怀念4o而重新提供该选项

OpenAI推出GPT-5后,允许付费用户切换回GPT-4o,因用户对新模型的不满。用户认为GPT-4o更具个性,理解更好。GPT-5的响应被批评为慢、短且不准确,OpenAI承诺改善这些问题。

ChatGPT因用户怀念4o而重新提供该选项

The Verge
The Verge · 2025-08-08T19:30:15Z

提示词诱导是提升AI模型响应质量的关键技术。通过设计有效的提示词,用户可以改善AI输出的实用性和准确性,适用于内容创作和人机交互。掌握此技巧将释放AI潜力,推动其在各领域的应用。

提示词诱导(Prompt Priming)

dotNET跨平台
dotNET跨平台 · 2025-06-24T00:00:39Z
解决OpenAI对相同提示返回相同响应的问题

我正在开发一个测验应用,以复习软件工程概念。通过随机选择主题和调整提示,成功减少了重复问题并提高了响应质量。

解决OpenAI对相同提示返回相同响应的问题

DEV Community
DEV Community · 2025-04-29T23:47:58Z
大型语言模型是否在内部知道何时遵循指令?

指令遵循对大型语言模型(LLMs)的AI代理至关重要,但LLMs常常难以遵循简单指令。研究发现,LLMs的内部状态与指令遵循的成功率相关,提出了“内部知识”概念。分析表明,输入嵌入空间中的“指令遵循维度”可以预测响应是否符合指令,调整该维度可提高遵循成功率而不影响响应质量。这项研究为LLMs的指令遵循提供了新的见解。

大型语言模型是否在内部知道何时遵循指令?

Apple Machine Learning Research
Apple Machine Learning Research · 2025-04-10T00:00:00Z
RAG实践:使用Claude Desktop的高级检索技术

本文介绍了如何通过RAG系统提升技术文档的检索和使用效率。使用基本查询、两步法和三步法等技术,Claude能更准确地回答关于Angular,特别是独立组件的默认设置。这些方法提高了响应质量,适用于多种结构化知识领域。

RAG实践:使用Claude Desktop的高级检索技术

DEV Community
DEV Community · 2025-04-01T07:26:00Z

本文提出了一种新的适应性精确布尔评估框架,以提高大型语言模型在医疗领域的响应质量评估。该框架通过最小化目标性问题集,增强评估的一致性和效率,尤其在自动化评估和非专家参与方面,显著节省评估时间,促进LLMs在医疗评估中的应用。

A Scalable Framework for Evaluating Health Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-30T00:00:00Z
LLM测试的演变:最佳实践与挑战

近年来,LLM测试从人工评审转向自动化方法,结合其他AI模型和合成测试数据。现代测试框架评估响应质量和资源效率,模型中心测试依赖标准基准,应用中心测试关注实际表现。有效的LLM测试需平衡这两种方法,解决输出变异和领域专业性等挑战。

LLM测试的演变:最佳实践与挑战

DEV Community
DEV Community · 2025-03-05T15:44:50Z

本研究提出FaIRMaker框架,旨在解决大型语言模型中的性别偏见问题。该框架通过自动生成和优化Fairwords,减少性别偏见并提高响应质量,适用于多种模型。

自动搜索与优化:一种针对大型语言模型性别偏见缓解的自动化框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-17T00:00:00Z
掌握文本生成与OpenAI:参数和设置的实用指南

OpenAI API提供多个可调参数,影响模型响应质量,包括温度(控制随机性)、最大令牌数(限制长度)、TopP(控制多样性)、频率惩罚(减少重复)、存在惩罚(控制特定词出现)和停止序列(限制生成文本)。调整这些参数可优化应用需求。

掌握文本生成与OpenAI:参数和设置的实用指南

DEV Community
DEV Community · 2025-01-16T14:10:57Z

本研究提出了一种新方法,通过结合二次长度差异的位置编码(LDPE)在输入嵌入中,解决大语言模型生成结构化输出时的响应长度控制问题。实验结果表明,该方法能够在不影响响应质量的前提下,实现精确的长度控制。

Precise Length Control in Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-16T00:00:00Z

该研究提出了一种个性化方法,利用双塔模型和对比学习显著提升大语言模型的响应质量,具有重要应用潜力。

Personalized Large Language Model for Generating Customized Responses for Different Users

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-16T00:00:00Z
Meta AI推出思维偏好优化,助力AI模型在回应前进行思考

Meta FAIR、加州大学伯克利分校和纽约大学的研究人员提出了一种思维偏好优化(TPO)方法,旨在提高大语言模型(LLM)在指令微调中的响应质量。与传统模型不同,TPO鼓励模型在回应前进行内部思考,从而生成更准确的答案。该方法结合了改进的思维链推理,优化了模型的思维过程,提升了响应的相关性和质量,适用于多种复杂任务。

Meta AI推出思维偏好优化,助力AI模型在回应前进行思考

InfoQ
InfoQ · 2024-11-04T07:03:00Z

本研究提出了PopAlign方法,旨在解决大型语言模型对齐过程中的全面性不足和易受攻击问题。实验结果表明,该方法显著提高了模型的对齐度和对人类偏好的响应质量。

PopAlign: Achieving More Comprehensive Alignment through Diversified Contrasting Patterns

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-17T00:00:00Z

该研究探讨了大型语言模型(LLMs)在自然语言生成中的不确定性计量,提出了多个统计度量标准。研究发现,语义分散的平均值是评估响应质量的可靠指标。通过校准和自我评估,提升了生成内容的准确性,并强调了透明传达模型可信度的重要性。研究还提出了改进LLMs校准能力的方法,展示了集成不同模型响应以提高事实准确性的有效性。

长文本生成中的大型语言模型原子校准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-17T00:00:00Z

该研究探讨了大型语言模型(LLMs)在自然语言生成中的不确定性计量,提出了多种统计度量标准。研究发现,语义分散的平均值是评估响应质量的可靠指标,并强调了不确定性在模型评估中的重要性。通过新方法Luq和Luq-Ensemble,研究提高了LLMs响应的事实准确性,解决了数据不确定性下的错误响应问题。

大语言模型评估中的黑箱不确定性量化方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-15T00:00:00Z

在AI领域,与大型语言模型如ChatGPT的互动非常重要。一篇论文提出了一种结构化的提示工程方法,通过16种提示模式帮助用户优化互动。这些模式分为输入语义、输出定制、错误识别、提示改进和互动五类,旨在提升LLM的响应质量。用户可以通过这些模式改善输入、定制输出、识别错误、改进提示和控制上下文,更有效地利用AI。

通过提示模式目录提升与ChatGPT的提示工程

DEV Community
DEV Community · 2024-10-06T11:50:33Z

本文概述了指令调优(IT)在大型语言模型(LLMs)中的应用,探讨了IT方法、数据集构建和模型训练的效果。研究指出IT的局限性,如无法增强知识和可能导致响应质量下降,并提出顺序指令调整以提升模型在复杂任务中的表现。同时介绍了监督精准调优(SPT)方法,旨在减少模型的谄媚行为,保持其能力。

响应调优:在没有指令的情况下对大型语言模型进行对齐

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-03T00:00:00Z

本文介绍了一种段落排名器方法,提升开放域问答系统的性能,平均提高7.8%。研究提出了REAR方法,通过引入排名头和优化训练,显著提高检索效果,改善了大型语言模型的响应质量,解决了信息陈旧等问题。

通过排名模型提升问答文本检索:重标定、微调与重排器的部署

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-12T00:00:00Z
从RAG到丰富:初创公司提升企业级检索增强生成技术

Contextual AI推出了RAG 2.0,这是其检索增强生成架构的先进版本。RAG 2.0相比竞争产品具有10倍更高的参数准确性和性能。该平台集成了检索器和语言模型架构,提高了精确度和响应质量。Contextual AI采用了“混合检索器”方法来识别存储在不同格式中的相关信息。RAG 2.0可以在云端、本地或完全断开连接的情况下运行,适用于各个行业。

从RAG到丰富:初创公司提升企业级检索增强生成技术

NVIDIA Blog
NVIDIA Blog · 2024-08-29T16:00:27Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码