小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
本地大模型API开发指南|Ollama API教程:generate与chat区别详解,全端点实操指南

本文介绍了Ollama HTTP API的使用,重点区分了generate和chat两个核心端点。generate用于单次补全,而chat适合多轮对话。文章详细解析了各API端点的参数和示例,建议新手从/chat端点开始,逐步掌握API的使用。

本地大模型API开发指南|Ollama API教程:generate与chat区别详解,全端点实操指南

人言兑
人言兑 · 2026-04-26T09:01:24Z
AI记忆系统全解析:从无状态模型到长期认知架构的技术跃迁路径

AI记忆系统通过外部存储与检索机制,使无状态大模型具备跨会话学习能力,解决了AI缺乏记忆的问题。记忆层的引入使AI能够记住用户偏好和历史对话,提升多轮对话效果。完整的记忆系统包括信息存储、检索和清理,确保AI持续理解用户需求,成为更智能的助手。

AI记忆系统全解析:从无状态模型到长期认知架构的技术跃迁路径

极道
极道 · 2026-04-16T00:47:00Z
Claude中提示词自动缓存机制

缓存对AI应用尤其是多轮对话至关重要。大语言模型无状态,需要每轮发送相同上下文,导致高成本。使用缓存可以降低费用,仅为新上下文付费。Claude的API支持自动缓存,提高效率,但需注意提示词设计以确保缓存命中率。选择合适的LLM对开发智能体至关重要。

Claude中提示词自动缓存机制

Teach Talk
Teach Talk · 2026-03-11T02:56:06Z
构建Slack代理变得简单

Slack代理技能使团队能够快速创建和部署Slack代理。用户通过向导选择代理类型,系统自动生成实施计划并引导完成项目设置、Slack应用创建、环境配置、测试和生产部署。代理支持多轮对话、实时响应,并可与外部系统交互。通过AI Gateway,用户可以轻松切换模型,确保代理稳定运行。

构建Slack代理变得简单

Vercel News
Vercel News · 2026-03-03T13:00:00Z
使用GitHub Copilot的Agentic Coding SDK为您的应用程序赋能

本文介绍了如何使用GitHub Copilot的Agentic Coding SDK构建和嵌入智能Python助手。与传统自动化工具不同,该助手能够自主规划和执行任务。文章涵盖了SDK的安装、基本工具使用、文件访问权限处理及多轮对话记忆,展示了创建能够理解上下文并完成复杂任务的应用程序的方法。

使用GitHub Copilot的Agentic Coding SDK为您的应用程序赋能

MachineLearningMastery.com
MachineLearningMastery.com · 2026-02-18T11:00:23Z

千问C端应用团队的四篇论文入选2026国际学习表征会议,重点研究扩散模型、多轮对话决策和信息验证等关键问题,推动AI助手在复杂场景中的应用,提高其稳定性和可靠性。

千问C端应用团队一口气四篇论文入选ICLR 2026国际顶会!

量子位
量子位 · 2026-01-30T08:53:50Z

Agent模型通过将思考内容引入上下文,增强了多轮对话的稳定性和推理效果。不同模型采用不同方式处理思考内容,以防篡改。这一机制在复杂任务中尤为重要,有效降低了模型的理解难度。

Agent 模型的思维链是什么

bang's blog
bang's blog · 2026-01-12T08:45:08Z
搜索增强的大型语言模型中的过度搜索

搜索增强的大型语言模型(LLMs)在知识密集型任务中表现优异,但常出现过度搜索现象,导致计算效率低下和引入不相关信息。研究表明,搜索通常提高可回答查询的准确性,但对不可回答的查询则有害。过度搜索在复杂推理模型中更为明显,且在多轮对话中加剧。为量化过度搜索,提出了“每个正确性代币”(TPC)评估指标,并探讨了减轻过度搜索的方法。

搜索增强的大型语言模型中的过度搜索

Apple Machine Learning Research
Apple Machine Learning Research · 2026-01-12T00:00:00Z
Gemini Chat Completion API 申请及使用

Google Gemini 是一款强大的 AI 对话系统,用户可通过输入提示词快速生成自然回复。本文介绍了 Gemini Chat Completion API 的申请流程、基本使用方法及多轮对话功能,帮助用户轻松实现对话功能。

Gemini Chat Completion API 申请及使用

静觅
静觅 · 2026-01-04T10:06:16Z
BED-LLM:基于贝叶斯实验设计的大型语言模型智能信息收集

本文提出了一种名为BED-LLM的方法,通过贝叶斯实验设计提升大型语言模型(LLMs)在信息收集中的能力。该方法通过选择最大化预期信息增益的问题,使LLMs能够有效进行多轮对话并与外部环境互动。研究表明,BED-LLM在多项测试中表现优异,显著提高了性能。

BED-LLM:基于贝叶斯实验设计的大型语言模型智能信息收集

Apple Machine Learning Research
Apple Machine Learning Research · 2025-12-19T00:00:00Z
.NET+AI | Agent | 启用工具调用(6)

MAF 函数调用技术使 .NET Agent 能实时查询数据和执行操作,突破 AI 知识限制。通过定义函数、添加描述和注册工具,Agent 能智能判断何时调用工具,支持多轮对话和多工具组合,提升交互能力。

.NET+AI | Agent | 启用工具调用(6)

dotNET跨平台
dotNET跨平台 · 2025-11-21T00:01:34Z
.NET+AI | Agent | 会话压缩(5)

MAF通过IChatReducer和InMemoryChatMessageStore实现了Agent级别的自动历史裁剪,支持多轮对话的上下文管理,适用于本地存储模式。其核心功能包括自动裁剪、无缝集成和持久化支持,特别适合短对话和客服场景。

.NET+AI | Agent | 会话压缩(5)

dotNET跨平台
dotNET跨平台 · 2025-11-20T00:02:07Z

微软开源的agent-framework可构建具备多轮对话能力的智能Agent,结合Azure OpenAI服务实现上下文记忆,适用于聊天助手和客服等场景。

使用AgentThread实现同一Agent的多轮回话

dotNET跨平台
dotNET跨平台 · 2025-11-18T23:54:23Z
.NET+AI | Agent | 从 ChatClient 到 AIAgent (1)

MAF(Microsoft Agent Framework)是微软的企业级AI代理开发框架,支持状态管理、身份定义和工具管理。与IChatClient相比,MAF的AIAgent具备多轮对话和记忆功能。创建Agent需经过三步,支持同步和流式调用。核心概念包括Agent、Thread和Run。目前的限制是单次调用不具备历史记忆,需通过AgentThread解决。

.NET+AI | Agent | 从 ChatClient 到 AIAgent (1)

dotNET跨平台
dotNET跨平台 · 2025-11-15T00:03:18Z

自2020年以来,OpenAI的文字生成API从单次文字生成演变为支持多轮对话的架构。/v1/completions用于单次生成,而/v1/chat/completions则支持多轮对话、角色理解和多模态输入。随着GPT-4o和GPT-5的推出,Chat API成为主流,未来将统一所有生成和工具应用。

一篇看懂 Chat API 與 Completion API 差在哪

1010Code
1010Code · 2025-10-31T16:00:00Z

Soul App开源了播客语音合成模型SoulX-Podcast,支持多轮对话和多方言,生成自然流畅的语音,尤其在语音克隆和长对话中表现优异,具备丰富的韵律和情感表达,推动AI与社交结合,提升用户体验。

Soul App开源播客语音合成模型,可流畅自然多轮语音对话,支持川粤豫等多方言与副语言风格

量子位
量子位 · 2025-10-29T08:35:27Z
Microsoft Agent Framework - Agent 多轮对话

Microsoft Agent Framework 通过 AgentThread 实现多轮对话,能够理解上下文并进行自然交流。开发者可以创建独立的对话线程,确保不同用户的对话互不干扰,从而构建更智能的 AI 应用。

Microsoft Agent Framework - Agent 多轮对话

dotNET跨平台
dotNET跨平台 · 2025-10-23T00:02:28Z

OpenAI首次详细解析了ChatGPT Agent的原理,结合Deep Research和Operator,通过强化学习使模型自主探索工具组合。该智能体能够高效处理多种任务,未来将增强多轮对话和个性化记忆,提升复杂任务的完成度。

官方揭秘ChatGPT Agent背后原理!通过强化学习让模型自主探索最佳工具组合

量子位
量子位 · 2025-07-24T07:43:15Z

腾讯的7B模型通过RLVER框架解决了AI情商的三大困境,得分从13.3提升至79.2,表现与顶级模型相当。RLVER利用用户模拟器优化多轮对话,增强模型的情感理解和共情能力,避免了灾难性遗忘。

7B模型“情商”比肩GPT-4o,腾讯突破开放域RL难题,得分直翻5倍

量子位
量子位 · 2025-07-18T08:32:19Z
NVIDIA 发布 Audio Flamingo 3:推动音频通用智能发展的开源模型

NVIDIA推出的Audio Flamingo 3(AF3)是一个开源的大型音频语言模型,具备理解和推理音频的能力,支持最长10分钟的音频输入,能够进行多轮对话和思维链推理,显著提升音频处理的准确性和效率,表现优异,推动通用音频智能的发展。

NVIDIA 发布 Audio Flamingo 3:推动音频通用智能发展的开源模型

实时互动网
实时互动网 · 2025-07-17T02:05:58Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码