小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
AI智能体的演进之路:从聊天机器人到智能决策系统

AI智能体从基础对话模型发展到复杂决策系统,展示了技术能力的提升和应用场景的变化。未来,AI将成为更智能的伙伴,具备更强的自主性和协作能力。

AI智能体的演进之路:从聊天机器人到智能决策系统

SagaSu的博客
SagaSu的博客 · 2025-08-01T06:43:09Z
DeepSeek-R1 API接口:开启智能对话的新篇章

DeepSeek-R1是一款高性能的自然语言处理对话模型,兼容OpenAI API,支持流式输出和灵活参数配置,适用于学术、办公和教育等场景,提升工作效率和用户体验。

DeepSeek-R1 API接口:开启智能对话的新篇章

APISpace
APISpace · 2025-04-01T02:19:03Z

GAEA是一种针对图像地理定位的对话模型,旨在解决信息交流缺失的问题。该模型基于80万张图像和160万问答对的数据集,展现了卓越的对话能力,显著超越现有模型,具有广泛的应用潜力。

GAEA: A Geolocation-Aware Conversational Model

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-20T00:00:00Z

Deepseek是一个对话和推理模型系列,包括最新的Deepseek V3和以推理能力著称的Deepseek R1。R1的训练分为两个阶段,利用高质量数据和强化学习来提升推理能力。研究表明,知识蒸馏在小模型上效果更佳,结合蒸馏与强化学习能显著增强推理能力。

DeepSeek-R1原理解析及项目实践(含小白向概念解读)

京东科技开发者
京东科技开发者 · 2025-02-13T03:07:50Z

Deepseek是一个对话和推理模型,分为V3和R1。V3是基础对话模型,R1通过强化学习提升推理能力,训练分为两个阶段,旨在生成高质量推理数据并优化模型。研究表明,知识蒸馏在小模型上效果更佳,而强化学习能增强推理能力。

DeepSeek-R1原理解析及项目实践(含小白向概念解读)

京东科技开发者
京东科技开发者 · 2025-02-13T02:55:39Z

RadVLM是一种多任务对话视觉语言模型,专注于胸部X光片分析。它通过超过100万个图像-指令对进行训练,展现出卓越的对话能力和视觉定位,旨在为放射科医生提供AI助手,以改善诊断工作流程。

RadVLM: A Multitask Conversational Vision-Language Model for Radiology

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-05T00:00:00Z

本研究通过微调高质量合成对话数据集,提升了荷兰语对话模型的性能,扩展了GEITje模型的能力,研究成果和数据集已公开,具有重要价值。

GEITje 7B Ultra: A Dutch Dialogue Model

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-05T00:00:00Z

本研究提出了ClarQ-LLM评估框架,用于对话模型澄清能力评估。该框架包含31种不同任务类型的对话场景,提高了模型在对话中询问澄清问题的测试。现有的寻求者代理在测试中表现不佳,为未来研究提供了挑战。

ClarQ-LLM:任务导向对话中模型澄清和请求信息的基准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-09T00:00:00Z

本文介绍了在SemanticKernel/C#中使用Ollama的对话模型与嵌入模型用于本地离线场景的方法。对话模型是gemma2:2b,嵌入模型是all-minilm:latest。使用方法见https://github.com/BLaZeKiLL/Codeblaze.SemanticKernel/tree/main/dotnet/Codeblaze.SemanticKernel.Connectors.Ollama。

SemanticKernel/C#:使用Ollama中的对话模型与嵌入模型用于本地离线场景

dotNET跨平台
dotNET跨平台 · 2024-08-03T00:19:32Z
奇趣周刊 - 第 59 期

这篇文章介绍了一些有趣的软件和开源项目,包括基于自然声音的音乐创作工具、自定义对话模型、Cloudflare工具和图标库。此外,还提到一个汇集最佳开源项目的网站,方便用户发现有趣的资源。

奇趣周刊 - 第 59 期

子舒的博客
子舒的博客 · 2024-07-18T00:00:00Z

哔哩哔哩技术团队开源了Index-1.9B系列模型的轻量版本,包括角色扮演和对话模型等。这些模型已在GitHub和HuggingFace上开源,并提供在线Demo。用户可以通过预设提示词来体验角色扮演模型。

哔哩哔哩技术团队开源Index-1.9B轻量模型 提供角色扮演版可以模仿B站老哥

蓝点网
蓝点网 · 2024-06-20T08:14:01Z

本文讨论了与基础模型及其实际应用相关的几个研究问题。这些问题包括如何在语言模型中表示和操作风格,何时使用不同的训练技术,如何将视觉设计元素融入模型,如何使对话模型更加自然,以及如何使用户能够导航和理解潜在空间特征。作者强调了在这些领域进行进一步的研究和开发的必要性,以构建基于基础模型的有价值的工具。

机器学习中的一些应用研究问题

thesephist
thesephist · 2024-06-10T03:42:07Z

本文介绍了Conversation Chronicles数据集和ReBot对话模型,用于实现长期对话设置。数据集包含时间间隔和细粒度的发言者关系,模型具有高人类参与度的长期上下文理解能力。该模型由仅约630M个参数的按时间顺序总结和对话生成模块组成。

提升长期对话生成中对话之间的差距

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-24T00:00:00Z

Meta宣布开源大语言模型Llama2,包含不同尺寸的模型,并在对话场景中进行了优化。Llama-2-Chat在评测指标上超过了其他开源对话模型,并与一些热门闭源模型相差不大。阿里云机器学习平台PAI第一时间适配了Llama2系列模型,并推出了全量微调、Lora微调和推理服务等最佳实践。本文介绍了Llama2全参数微调训练的最佳实践步骤,包括运行环境要求、准备工作、微调模型、试玩模型和模型上传至OSS并在线部署等。

快速玩转 Llama2!机器学习 PAI 最佳实践(二)—全参数微调训练

阿里云云栖号
阿里云云栖号 · 2023-08-01T02:55:23Z
使用StarCoder创建编程助手

本文介绍了使用开源语言模型StarCoder创建个性化编程助手的方法,包括训练对话模型的数据集和屏蔽用户标签以提高模型效果。同时,探讨了评估编程助手的方法和实验结果。作者感谢Nicolas Patry、Olivier Dehaene、Omar Sanseviero和Abubakar Abid等人的帮助和支持。

使用StarCoder创建编程助手

Hugging Face - Blog
Hugging Face - Blog · 2023-05-09T00:00:00Z
介绍ChatGPT

我们训练了一个名为ChatGPT的对话模型,能够回答问题、承认错误、挑战不正确的前提并拒绝不当请求。ChatGPT是InstructGPT的兄弟模型,旨在根据提示提供详细响应。我们期待用户反馈,以了解其优缺点,目前免费使用。

介绍ChatGPT

OpenAI
OpenAI · 2022-11-30T08:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码