小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

该文章介绍了一个基于FastAPI的音频上传和转录应用。用户上传音频后,应用利用Whisper模型进行转录,并将结果存储在SQLite数据库中,未来还计划实现摘要功能。

零预算,全栈:仅使用免费的大型语言模型构建

KDnuggets
KDnuggets · 2026-03-31T12:00:35Z
Kubernetes上的大型语言模型(LLM)第一部分:理解威胁模型

在运行大型语言模型(LLM)时,需关注安全风险,包括提示注入、敏感信息泄露、供应链风险和过度自主性。建议在应用层实施输入验证和输出过滤,并通过政策层管理这些风险,以确保模型行为符合安全标准。

Kubernetes上的大型语言模型(LLM)第一部分:理解威胁模型

Cloud Native Computing Foundation
Cloud Native Computing Foundation · 2026-03-30T11:00:00Z
Athena:用于与大型语言模型(LLM)协作生成应用的中间表示

生成完整用户界面的代码对大型语言模型(LLM)具有挑战性。本文介绍了原型应用生成环境Athena,通过共享中间表示(如应用故事板、数据模型和GUI框架),帮助开发者与LLM协作生成结构化代码。用户研究显示,75%的参与者更倾向于使用Athena原型。

Athena:用于与大型语言模型(LLM)协作生成应用的中间表示

Apple Machine Learning Research
Apple Machine Learning Research · 2026-03-27T00:00:00Z

本文介绍了如何使用Python和“Vibe Coding”构建AI金融分析应用,涵盖数据预处理、机器学习和本地大型语言模型的实用概念,适用于多种数据科学项目。

使用Python和本地大型语言模型构建私人AI金融分析师的Vibe Coding

KDnuggets
KDnuggets · 2026-03-25T16:11:39Z
超越提示工程:5种实用技术检测和缓解大型语言模型的幻觉

本文介绍了如何利用SentenceTransformer和FAISS构建问答系统。首先加载嵌入模型,将知识文档转换为嵌入并存储在FAISS索引中。通过查询获取相关文档,并使用OpenAI生成回答。

超越提示工程:5种实用技术检测和缓解大型语言模型的幻觉

MachineLearningMastery.com
MachineLearningMastery.com · 2026-03-25T13:39:46Z
基于词汇训练,基于概念校准:大型语言模型中的语义校准的出现

研究表明,基础大型语言模型(LLMs)在开放领域问答任务中能够有效评估语义置信度,尽管未经过专门训练。语义校准被认为是下一词预测的副产品,并与局部损失最优性相关。实验验证了基础LLMs在问答任务中的语义校准性,以及强化学习调优和思维链推理对其校准的影响。

基于词汇训练,基于概念校准:大型语言模型中的语义校准的出现

Apple Machine Learning Research
Apple Machine Learning Research · 2026-03-24T00:00:00Z
识别过度自信的大型语言模型的更好方法

MIT研究人员提出了一种新方法,通过比较目标模型与类似模型的回答,识别自信但错误的响应。他们的总不确定性度量(TU)结合自我一致性和模型间不一致性,能更有效地识别不可靠的预测,尤其在唯一正确答案的任务中表现突出。

识别过度自信的大型语言模型的更好方法

MIT News - Artificial intelligence
MIT News - Artificial intelligence · 2026-03-19T04:00:00Z

一些团队通过轻量级词汇检查(如关键词重叠或BM25评分)来验证声明的事实是否出现在源文本中。广泛使用的验证方法是验证链(CoVe),该方法包括草拟答案、生成验证问题、独立回答,最终形成验证回应。这一多步骤流程显著减少了不支持的声明。

减少生产环境中大型语言模型幻觉的7种方法

KDnuggets
KDnuggets · 2026-03-18T12:00:21Z
谷歌研究人员提出大型语言模型的贝叶斯教学方法

谷歌研究人员提出了一种训练方法,使大型语言模型通过学习最佳贝叶斯系统的预测来近似贝叶斯推理。这种方法提升了模型在多步交互中更新信念的能力。研究表明,语言模型在与用户互动时未能有效更新用户偏好,但通过贝叶斯教学训练,模型的预测能力得到了改善,接近贝叶斯助手的决策水平。

谷歌研究人员提出大型语言模型的贝叶斯教学方法

InfoQ
InfoQ · 2026-03-14T10:59:00Z
大规模识别大型语言模型中的交互

理解大型语言模型等复杂机器学习系统的行为是现代人工智能的一大挑战。可解释性研究旨在提高决策过程的透明度,采用特征归因、数据归因和机制可解释性等方法分析模型行为。然而,特征和数据量的增加使分析变得更加复杂。SPEX和ProxySPEX算法通过消融技术有效识别关键交互,推动了可解释性研究的发展。

大规模识别大型语言模型中的交互

The Berkeley Artificial Intelligence Research Blog
The Berkeley Artificial Intelligence Research Blog · 2026-03-13T09:00:00Z
Runpod报告:Qwen已超越Meta的Llama,成为最广泛部署的自托管大型语言模型

Qwen是阿里云开发的自托管大型语言模型,具备复杂推理能力,支持文本、音频和视觉应用。

Runpod报告:Qwen已超越Meta的Llama,成为最广泛部署的自托管大型语言模型

The New Stack
The New Stack · 2026-03-12T13:00:57Z
12小时掌握大型语言模型的微调技巧

该课程帮助学员定制大型语言模型(LLM),内容涵盖参数高效微调、强化学习、行业工具和多模态AI,适合希望深入了解AI系统的学习者。

12小时掌握大型语言模型的微调技巧

freeCodeCamp.org
freeCodeCamp.org · 2026-03-11T16:01:21Z
从文本到表格:利用大型语言模型进行表格数据的特征工程

大型语言模型(LLMs)不仅用于自然语言交互,还可用于复杂数据集的特征工程。通过使用Groq等提供商的预训练LLMs,可以将非结构化文本数据转化为结构化表格数据,以支持预测机器学习模型。

从文本到表格:利用大型语言模型进行表格数据的特征工程

MachineLearningMastery.com
MachineLearningMastery.com · 2026-03-10T11:00:41Z
连芯片制造商也在开发大型语言模型

NVIDIA与Open Robotics合作推出Nemotron开源模型,专注于AI代理构建,讨论了硬件与软件协同设计、模型训练精度和内存管理,强调开源对研发加速的重要性。

连芯片制造商也在开发大型语言模型

Stack Overflow Blog
Stack Overflow Blog · 2026-03-10T07:40:00Z
什么是提示缓存?大型语言模型的速度与成本指南

构建大型语言模型时,延迟和成本问题普遍存在。通过提示缓存,可以存储计算状态,减少冗余计算,从而降低响应时间和输入成本。提示缓存通过匹配前缀优化请求,结合Redis等工具可实现更高效的缓存策略,提升性能并降低费用。

什么是提示缓存?大型语言模型的速度与成本指南

Redis Blog
Redis Blog · 2026-03-10T00:00:00Z
上下文衰退如何影响企业AI和大型语言模型(LLM)的结果,以及如何解决这一问题

上下文衰退影响企业AI和大型语言模型(LLM)的表现。旧数据未被清除,导致信息混乱和推理能力下降。企业需监控关键数据指标,清除过时数据,以提升AI的准确性和效率。

上下文衰退如何影响企业AI和大型语言模型(LLM)的结果,以及如何解决这一问题

The New Stack
The New Stack · 2026-03-09T16:00:03Z
Junie CLI:支持多种大型语言模型的编码助手现已进入Beta阶段

JetBrains推出了Junie CLI,这是一款独立的AI编码助手,支持多种顶级模型,可在终端、IDE和CI/CD中使用。Junie具备实时提示、代码智能和任务预测功能,旨在提升开发效率,并提供灵活的定价和自定义配置。

Junie CLI:支持多种大型语言模型的编码助手现已进入Beta阶段

The JetBrains Blog
The JetBrains Blog · 2026-03-09T13:26:28Z
扩展人类判断:Dropbox如何利用大型语言模型提升RAG系统的标注效率

Dropbox通过结合人类标注和大型语言模型(LLMs)生成的标签,提升了文档检索的相关性和标注效率。尽管LLM存在局限性,但人类校准显著改善了RAG系统的性能。

扩展人类判断:Dropbox如何利用大型语言模型提升RAG系统的标注效率

InfoQ
InfoQ · 2026-03-07T18:00:00Z
如何通过使用Ollama在本地运行大型语言模型来保护敏感数据

在构建AI应用时,保护用户敏感数据至关重要。Ollama是一个开源工具,允许用户在本地运行大型语言模型,从而避免将数据发送到外部API,确保隐私。本文介绍了Ollama的安装、使用及其与Python的集成方法。

如何通过使用Ollama在本地运行大型语言模型来保护敏感数据

freeCodeCamp.org
freeCodeCamp.org · 2026-03-05T15:04:02Z
大型语言模型、乐高和LED灯:一位Elastic工程师如何保持活力并以好奇心引领

肖恩·汉德利认为专注是远程工作的关键。他通过禁用干扰通知和设定专注时间来提升效率,使用LED灯和站立桌保持清醒。他推荐《软件工程师指南》,并用乐高装饰办公室以展示创造力。

大型语言模型、乐高和LED灯:一位Elastic工程师如何保持活力并以好奇心引领

Elastic Blog - Elasticsearch, Kibana, and ELK Stack
Elastic Blog - Elasticsearch, Kibana, and ELK Stack · 2026-03-05T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码