小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
什么是AI语音开发?从技术链路到落地场景的完整拆解

AI语音开发是构建实时语音交互系统的过程,涉及语音识别、语言模型和语音合成等技术。核心链路包括用户语音输入、ASR识别、LLM理解与生成、TTS合成和实时传输。开发的难点在于降低端到端延迟,确保对话流畅。可选择全自研或使用一体化平台,以适应不同场景需求。评估方案时需关注延迟、准确率、灵活性和成本等维度。

什么是AI语音开发?从技术链路到落地场景的完整拆解

实时互动网
实时互动网 · 2026-06-11T06:57:24Z
OpenCV 5.0 发布,重写了 DNN 引擎,并内置了 LLM 和 VLM 支持

OpenCV 5.0于2026年6月6日发布,新增深度神经网络引擎重写、80% ONNX覆盖率和内置大型语言模型支持等功能,并针对多种硬件进行了优化,计划实现原生GPU支持。

OpenCV 5.0 发布,重写了 DNN 引擎,并内置了 LLM 和 VLM 支持

实时互动网
实时互动网 · 2026-06-08T02:02:17Z
语言模型动摇认知根基:世界模型一开始就命名错了

大语言模型的成功挑战了传统世界模型理论,认为智能系统通过学习数据中的规律性表现智能,而非重建现实世界。这一观点改变了对知识的理解,强调知识是一种生成能力而非静态存储。同时,人类对外部世界的信念可能受到语言结构的影响,语言塑造了我们对现实的理解。

语言模型动摇认知根基:世界模型一开始就命名错了

极道
极道 · 2026-06-06T00:08:00Z

大型语言模型(LLMs)普遍存在误校准问题,导致信心分数与实际正确率不符。传统的后处理校准方法包括温度缩放、Platt缩放和等距回归,但由于LLMs的复杂性,这些方法需谨慎应用。研究表明,适应性温度缩放(ATS)能有效改善校准,而Platt缩放适合小数据集,等距回归在数据充足时表现最佳。选择合适的校准方法需考虑任务的“信心”定义。

深入探讨语言模型的校准:Platt缩放、等距回归与温度缩放

KDnuggets
KDnuggets · 2026-06-05T14:00:11Z
使用Scikit-LLM与开源语言模型

本文介绍如何使用Ollama本地托管的开源语言模型(如Llama 3、Mistral和Gemma)进行文本分类,避免支付API费用。内容包括Ollama的安装、Scikit-LLM库的配置,以及构建零样本文本分类器的步骤。通过简单的Python代码,用户可以实现模型的训练和预测,展示如何高效使用大型语言模型。

使用Scikit-LLM与开源语言模型

MachineLearningMastery.com
MachineLearningMastery.com · 2026-06-04T12:55:34Z
人工智能论文评审:通过人类反馈训练语言模型以遵循指令(InstructGPT)

GPT-3在自然语言处理上取得了重大突破,但未能有效转化为助手。为此,OpenAI推出了InstructGPT,通过人类反馈训练模型更好地遵循指令,强调模型的对齐和实用性比规模更重要,推动了现代AI的发展,最终形成了更具人性化的对话系统如ChatGPT。

人工智能论文评审:通过人类反馈训练语言模型以遵循指令(InstructGPT)

freeCodeCamp.org
freeCodeCamp.org · 2026-06-03T18:01:27Z
在国际人工智能竞争中成为参与者所需的条件

文章讨论了国际人工智能发展的关键因素,包括适应当地语言和文化的模型需求、全球半导体供应链的挑战,以及风险投资对国际AI公司的关注。PVP支持早期AI公司,推动未来生活和工作的变革。

在国际人工智能竞争中成为参与者所需的条件

Stack Overflow Blog
Stack Overflow Blog · 2026-06-02T07:40:00Z

这篇文章讨论了监督微调(SFT)在语言模型训练中的重要性,强调数据质量、模板设计和损失函数的影响。SFT通过指令与回答对训练模型,确保模型能够有效生成助手回答。此外,SFT是后续强化学习(RLHF)的基础,强调样本去重、数据来源和模板一致性的重要性,以避免模型学习错误的行为模式。

【强化学习与大模型后训练】07|监督微调(SFT):指令数据、模板与训练细节

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-05-29T00:00:00Z

本文介绍了如何优化本地语言模型Ollama的配置,以提升AI应用的性能和准确性。通过调整模型参数、服务器环境变量和使用Go模板语法,用户可以实现更高效的文本生成,避免重复输出,并扩展上下文窗口,从而设计出高性能、私密的本地智能系统。

调整Ollama本地语言模型设置

KDnuggets
KDnuggets · 2026-05-28T14:00:17Z
世界模型接棒语言模型,这家公司全球首创物理AGI“双金字塔”体系,通用机器人进入“家庭时代”

极佳视界推出了具身智能机器人拾光S1,计划在家庭场景中部署100台。该机器人采用轮臂设计,专注于家庭日常任务。公司展示了“双金字塔”技术体系,解决了数据和算法瓶颈,预计在12个月内实现物理AGI突破。团队背景强大,融资成功,未来将关注家庭数据闭环和模型迭代进展。

世界模型接棒语言模型,这家公司全球首创物理AGI“双金字塔”体系,通用机器人进入“家庭时代”

量子位
量子位 · 2026-05-28T13:01:16Z
大模型是发动机,Claude Code 是车

大模型如同汽车的发动机,而Claude Code则将其转化为可用的车辆。自ChatGPT问世以来,模型不断演进,真正的突破在于如何利用这些模型。Claude Code标志着驾驭层的诞生,释放了大语言模型的潜力。未来的重点在于更好地应用这些技术,而不仅仅是开发模型。

大模型是发动机,Claude Code 是车

王建硕的博客
王建硕的博客 · 2026-05-24T01:04:00Z
语言模型揭穿最大谎言:语言不需要指向现实就能产生连贯内容

大型语言模型表明,语言的本质在于其生成能力,而非对现实的描述。人类语言的使用类似于预测,语言的意义在于引发的后续行动,而非固定的事实。

语言模型揭穿最大谎言:语言不需要指向现实就能产生连贯内容

极道
极道 · 2026-05-19T12:36:00Z
人工智能论文评审:语言模型是少量学习者(GPT-3)

GPT-3的论文展示了大型语言模型如何通过上下文学习新任务,而无需特定的微调。它能够通过示例直接从提示中学习,标志着AI系统交互方式的重大转变。这种“少量学习”方法使模型能够根据指令和示例动态适应,推动了现代AI研究的发展。尽管GPT-3在许多任务上表现出色,但在逻辑推理和一致性方面仍存在局限性。

人工智能论文评审:语言模型是少量学习者(GPT-3)

freeCodeCamp.org
freeCodeCamp.org · 2026-05-18T20:29:20Z

本文探讨了在本地运行语言模型的优势,如保护敏感数据、避免云服务的限制和费用。作者分享了五个项目实例,包括私人文档助手、代码审查工具、离线AI助手、个性化思维伙伴和本地AI代理。这些项目帮助用户更高效地处理文档、代码和思维任务,同时确保数据安全和隐私。

我在本地语言模型上做的五个酷炫项目

KDnuggets
KDnuggets · 2026-05-18T12:46:24Z
何恺明首个语言模型:不走GPT老路,105M参数干翻主流

何恺明团队推出了首个扩散语言模型ELF,采用105M参数和45B训练token,成功超越主流模型。ELF通过在连续空间中去噪生成离散token,显著提高生成速度和质量,展示了小规模模型的高效输出,降低了训练成本,未来有望推动AI生成速度提升。

何恺明首个语言模型:不走GPT老路,105M参数干翻主流

dotNET跨平台
dotNET跨平台 · 2026-05-14T23:58:43Z
何恺明首个语言模型:105M参数,不走GPT自回归老路

何恺明团队推出了新的扩散语言模型ELF,该模型采用连续的embedding空间进行文本生成,显著降低了生成困惑度。ELF在训练和采样效率上表现优异,仅用105M参数和45B训练token,生成质量超过主流模型。该模型首次实现了连续与离散的有效结合,推动了扩散语言模型的发展。

何恺明首个语言模型:105M参数,不走GPT自回归老路

量子位
量子位 · 2026-05-13T01:23:32Z
人工智能论文评审:语言模型是无监督的多任务学习者(GPT-2)

GPT-2模型通过在大量文本上训练,仅预测下一个单词,展现出多任务能力,无需特定任务训练。这一方法标志着从监督学习向零-shot学习的转变,使模型能够在不同任务中进行泛化。研究表明,模型规模和数据量的增加有助于提升性能,推动了现代语言模型的发展。

人工智能论文评审:语言模型是无监督的多任务学习者(GPT-2)

freeCodeCamp.org
freeCodeCamp.org · 2026-05-11T15:55:27Z
Token使用量降低30%,以「阿凡达」为灵感的异构智能体框架Eywa,高效结合语言模型与领域专用基础模型

智能体 AI 正在从语言中心化系统转变为具备自主推理与协作能力的智能体。伊利诺伊大学的研究团队提出 Eywa 框架,结合语言模型与领域专用基础模型,提升科学研究中的推理效率。EywaAgent 在多个科学领域的任务中表现优异,效用提升约 7%,Token 消耗减少 30%。此外,EywaBench 评测框架也被提出,以评估多模态科学推理能力,推动 AI 在科学领域的应用。

Token使用量降低30%,以「阿凡达」为灵感的异构智能体框架Eywa,高效结合语言模型与领域专用基础模型

HyperAI超神经
HyperAI超神经 · 2026-05-11T11:01:11Z
BalCapRL:一种基于强化学习的多模态大语言模型图像描述的平衡框架

本文介绍了一种名为BalCapRL的平衡强化学习框架,旨在优化多模态大语言模型的图像描述。该框架通过奖励解耦归一化和长度条件奖励掩蔽,显著提升了描述的实用性、覆盖率和语言质量,克服了现有方法在描述质量上的局限性,多个模型的性能均有显著提高。

BalCapRL:一种基于强化学习的多模态大语言模型图像描述的平衡框架

Apple Machine Learning Research
Apple Machine Learning Research · 2026-05-11T00:00:00Z
《GPT 图解》笔记:N-Gram、NPLM、LSTM

本文介绍了语言模型的发展历程,包括N-Gram、NPLM、RNN和LSTM等。N-Gram通过统计前n-1个词的概率进行预测,但缺乏泛化能力;NPLM引入词向量,具备一定的泛化能力;RNN和LSTM通过递归状态支持变长序列,解决了长期依赖问题。总结了N-Gram和Bag-of-Words的基本原理及应用。

《GPT 图解》笔记:N-Gram、NPLM、LSTM

Ying’s Blog
Ying’s Blog · 2026-05-10T08:00:35Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码