小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
本地大模型API开发指南|Ollama API教程:generate与chat区别详解,全端点实操指南

本文介绍了Ollama HTTP API的使用,重点区分了generate和chat两个核心端点。generate用于单次补全,而chat适合多轮对话。文章详细解析了各API端点的参数和示例,建议新手从/chat端点开始,逐步掌握API的使用。

本地大模型API开发指南|Ollama API教程:generate与chat区别详解,全端点实操指南

人言兑
人言兑 · 2026-04-26T09:01:24Z
AI记忆系统全解析:从无状态模型到长期认知架构的技术跃迁路径

AI记忆系统通过外部存储与检索机制,使无状态大模型具备跨会话学习能力,解决了AI缺乏记忆的问题。记忆层的引入使AI能够记住用户偏好和历史对话,提升多轮对话效果。完整的记忆系统包括信息存储、检索和清理,确保AI持续理解用户需求,成为更智能的助手。

AI记忆系统全解析:从无状态模型到长期认知架构的技术跃迁路径

极道
极道 · 2026-04-16T00:47:00Z
Claude中提示词自动缓存机制

缓存对AI应用尤其是多轮对话至关重要。大语言模型无状态,需要每轮发送相同上下文,导致高成本。使用缓存可以降低费用,仅为新上下文付费。Claude的API支持自动缓存,提高效率,但需注意提示词设计以确保缓存命中率。选择合适的LLM对开发智能体至关重要。

Claude中提示词自动缓存机制

Teach Talk
Teach Talk · 2026-03-11T02:56:06Z
构建Slack代理变得简单

Slack代理技能使团队能够快速创建和部署Slack代理。用户通过向导选择代理类型,系统自动生成实施计划并引导完成项目设置、Slack应用创建、环境配置、测试和生产部署。代理支持多轮对话、实时响应,并可与外部系统交互。通过AI Gateway,用户可以轻松切换模型,确保代理稳定运行。

构建Slack代理变得简单

Vercel News
Vercel News · 2026-03-03T13:00:00Z
使用GitHub Copilot的Agentic Coding SDK为您的应用程序赋能

本文介绍了如何使用GitHub Copilot的Agentic Coding SDK构建和嵌入智能Python助手。与传统自动化工具不同,该助手能够自主规划和执行任务。文章涵盖了SDK的安装、基本工具使用、文件访问权限处理及多轮对话记忆,展示了创建能够理解上下文并完成复杂任务的应用程序的方法。

使用GitHub Copilot的Agentic Coding SDK为您的应用程序赋能

MachineLearningMastery.com
MachineLearningMastery.com · 2026-02-18T11:00:23Z

千问C端应用团队的四篇论文入选2026国际学习表征会议,重点研究扩散模型、多轮对话决策和信息验证等关键问题,推动AI助手在复杂场景中的应用,提高其稳定性和可靠性。

千问C端应用团队一口气四篇论文入选ICLR 2026国际顶会!

量子位
量子位 · 2026-01-30T08:53:50Z

Agent模型通过将思考内容引入上下文,增强了多轮对话的稳定性和推理效果。不同模型采用不同方式处理思考内容,以防篡改。这一机制在复杂任务中尤为重要,有效降低了模型的理解难度。

Agent 模型的思维链是什么

bang's blog
bang's blog · 2026-01-12T08:45:08Z
搜索增强的大型语言模型中的过度搜索

搜索增强的大型语言模型(LLMs)在知识密集型任务中表现优异,但常出现过度搜索现象,导致计算效率低下和引入不相关信息。研究表明,搜索通常提高可回答查询的准确性,但对不可回答的查询则有害。过度搜索在复杂推理模型中更为明显,且在多轮对话中加剧。为量化过度搜索,提出了“每个正确性代币”(TPC)评估指标,并探讨了减轻过度搜索的方法。

搜索增强的大型语言模型中的过度搜索

Apple Machine Learning Research
Apple Machine Learning Research · 2026-01-12T00:00:00Z
Gemini Chat Completion API 申请及使用

Google Gemini 是一款强大的 AI 对话系统,用户可通过输入提示词快速生成自然回复。本文介绍了 Gemini Chat Completion API 的申请流程、基本使用方法及多轮对话功能,帮助用户轻松实现对话功能。

Gemini Chat Completion API 申请及使用

静觅
静觅 · 2026-01-04T10:06:16Z
BED-LLM:基于贝叶斯实验设计的大型语言模型智能信息收集

本文提出了一种名为BED-LLM的方法,通过贝叶斯实验设计提升大型语言模型(LLMs)在信息收集中的能力。该方法通过选择最大化预期信息增益的问题,使LLMs能够有效进行多轮对话并与外部环境互动。研究表明,BED-LLM在多项测试中表现优异,显著提高了性能。

BED-LLM:基于贝叶斯实验设计的大型语言模型智能信息收集

Apple Machine Learning Research
Apple Machine Learning Research · 2025-12-19T00:00:00Z
.NET+AI | Agent | 启用工具调用(6)

MAF 函数调用技术使 .NET Agent 能实时查询数据和执行操作,突破 AI 知识限制。通过定义函数、添加描述和注册工具,Agent 能智能判断何时调用工具,支持多轮对话和多工具组合,提升交互能力。

.NET+AI | Agent | 启用工具调用(6)

dotNET跨平台
dotNET跨平台 · 2025-11-21T00:01:34Z
.NET+AI | Agent | 会话压缩(5)

MAF通过IChatReducer和InMemoryChatMessageStore实现了Agent级别的自动历史裁剪,支持多轮对话的上下文管理,适用于本地存储模式。其核心功能包括自动裁剪、无缝集成和持久化支持,特别适合短对话和客服场景。

.NET+AI | Agent | 会话压缩(5)

dotNET跨平台
dotNET跨平台 · 2025-11-20T00:02:07Z

微软开源的agent-framework可构建具备多轮对话能力的智能Agent,结合Azure OpenAI服务实现上下文记忆,适用于聊天助手和客服等场景。

使用AgentThread实现同一Agent的多轮回话

dotNET跨平台
dotNET跨平台 · 2025-11-18T23:54:23Z
.NET+AI | Agent | 从 ChatClient 到 AIAgent (1)

MAF(Microsoft Agent Framework)是微软的企业级AI代理开发框架,支持状态管理、身份定义和工具管理。与IChatClient相比,MAF的AIAgent具备多轮对话和记忆功能。创建Agent需经过三步,支持同步和流式调用。核心概念包括Agent、Thread和Run。目前的限制是单次调用不具备历史记忆,需通过AgentThread解决。

.NET+AI | Agent | 从 ChatClient 到 AIAgent (1)

dotNET跨平台
dotNET跨平台 · 2025-11-15T00:03:18Z

自2020年以来,OpenAI的文字生成API从单次文字生成演变为支持多轮对话的架构。/v1/completions用于单次生成,而/v1/chat/completions则支持多轮对话、角色理解和多模态输入。随着GPT-4o和GPT-5的推出,Chat API成为主流,未来将统一所有生成和工具应用。

一篇看懂 Chat API 與 Completion API 差在哪

1010Code
1010Code · 2025-10-31T16:00:00Z

Soul App开源了播客语音合成模型SoulX-Podcast,支持多轮对话和多方言,生成自然流畅的语音,尤其在语音克隆和长对话中表现优异,具备丰富的韵律和情感表达,推动AI与社交结合,提升用户体验。

Soul App开源播客语音合成模型,可流畅自然多轮语音对话,支持川粤豫等多方言与副语言风格

量子位
量子位 · 2025-10-29T08:35:27Z
Microsoft Agent Framework - Agent 多轮对话

Microsoft Agent Framework 通过 AgentThread 实现多轮对话,能够理解上下文并进行自然交流。开发者可以创建独立的对话线程,确保不同用户的对话互不干扰,从而构建更智能的 AI 应用。

Microsoft Agent Framework - Agent 多轮对话

dotNET跨平台
dotNET跨平台 · 2025-10-23T00:02:28Z

OpenAI首次详细解析了ChatGPT Agent的原理,结合Deep Research和Operator,通过强化学习使模型自主探索工具组合。该智能体能够高效处理多种任务,未来将增强多轮对话和个性化记忆,提升复杂任务的完成度。

官方揭秘ChatGPT Agent背后原理!通过强化学习让模型自主探索最佳工具组合

量子位
量子位 · 2025-07-24T07:43:15Z

腾讯的7B模型通过RLVER框架解决了AI情商的三大困境,得分从13.3提升至79.2,表现与顶级模型相当。RLVER利用用户模拟器优化多轮对话,增强模型的情感理解和共情能力,避免了灾难性遗忘。

7B模型“情商”比肩GPT-4o,腾讯突破开放域RL难题,得分直翻5倍

量子位
量子位 · 2025-07-18T08:32:19Z
NVIDIA 发布 Audio Flamingo 3:推动音频通用智能发展的开源模型

NVIDIA推出的Audio Flamingo 3(AF3)是一个开源的大型音频语言模型,具备理解和推理音频的能力,支持最长10分钟的音频输入,能够进行多轮对话和思维链推理,显著提升音频处理的准确性和效率,表现优异,推动通用音频智能的发展。

NVIDIA 发布 Audio Flamingo 3:推动音频通用智能发展的开源模型

实时互动网
实时互动网 · 2025-07-17T02:05:58Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码