小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
沉浸式翻译 immersive translate
Dify.AI
NVIDIA Dynamo Planner为多节点大语言模型推理带来基于SLO的自动化

微软与NVIDIA推出Dynamo第二部分,旨在提升Azure Kubernetes Service上大语言模型的推理效率。新功能包括自动资源规划和动态扩展,帮助开发者快速配置GPU资源。Dynamo Planner Profiler与基于SLO的Dynamo Planner协同优化GPU分配,以满足流量变化下的服务水平目标。

NVIDIA Dynamo Planner为多节点大语言模型推理带来基于SLO的自动化

InfoQ
InfoQ · 2026-01-31T09:00:00Z
介绍Kthena:云原生时代的大语言模型推理

Kthena是Volcano社区推出的子项目,旨在为全球开发者和MLOps工程师提供高效的云原生大语言模型推理调度解决方案。它通过拓扑感知调度和智能路由优化GPU/NPU资源利用,降低延迟,简化Kubernetes上大语言模型的部署。Kthena支持多模型管理和动态扩展,提高AI生命周期的整体效率。

介绍Kthena:云原生时代的大语言模型推理

Cloud Native Computing Foundation
Cloud Native Computing Foundation · 2026-01-28T15:00:00Z
AI入门系列 如何使用大语言模型?

本文探讨了大语言模型(LLM)的演变,强调了从传统聊天机器人到Vibe Coding范式的转变。尽管聊天机器人易于使用,但面临上下文限制和任务复杂度的挑战。Vibe Coding通过与AI对话简化编程,提高效率,支持复杂任务的执行。文章还介绍了Cursor和Claude Code等工具,展示了Vibe Coding生态的迅速发展及其未来影响。

AI入门系列 如何使用大语言模型?

浮云翩迁之间
浮云翩迁之间 · 2026-01-24T13:46:49Z
AI入门系列 介绍大语言模型

大语言模型(LLM)经历了从统计模型到神经网络的演变,2017年Transformer架构的出现推动了其发展。GPT系列模型展现了强大的生成能力,2023-2024年多模态与智能体的崛起标志着AI的进一步进化。未来,编程将向人机协作转变,AI将在任务执行中扮演更重要的角色。

AI入门系列 介绍大语言模型

浮云翩迁之间
浮云翩迁之间 · 2026-01-24T05:40:56Z
AI入门系列 介绍大语言模型

大语言模型(LLM)经历了从统计模型到神经网络的演变,2017年Transformer架构的出现推动了其发展。GPT系列模型展示了理解与生成的能力,2023-2024年多模态与智能体的兴起标志着AI的进一步进化。未来编程将转向人机协作,大模型技术虽有局限,但仍是通向AGI的重要路径。

AI入门系列 介绍大语言模型

浮云翩迁之间
浮云翩迁之间 · 2026-01-24T05:40:56Z
大语言模型操作:最佳实践与指南

LLM在生产中面临响应时间不可预测和成本波动等挑战。LLMOps与传统MLOps不同,需关注实时令牌消耗和多层缓存等优化策略,以提升性能和降低成本。通过智能路由和语义缓存,团队可以加速开发、控制成本并提高可靠性。

大语言模型操作:最佳实践与指南

Redis Blog
Redis Blog · 2026-01-23T00:00:00Z

通过系统化的提示词设计方法和优化技巧,开发者能够充分发挥大语言模型的潜力,构建出更加智能、可靠的AI应用系统。提示词工程是一门需要持续实践和优化的艺术。在下一章中,我们将探讨Semantic...

提示词工程与模板优化——释放大语言模型真正潜力

dotNET跨平台
dotNET跨平台 · 2026-01-22T23:55:30Z

大语言模型的训练包括三个阶段:预训练、监督微调和强化学习。预训练通过大量文本学习语言规律,监督微调利用高质量问答对提升回答能力,强化学习则帮助模型建立符合人类期望的价值观。

用通俗的方式介绍大语言模型训练过程

安志合的学习博客
安志合的学习博客 · 2026-01-18T07:14:10Z

跳出「黑盒」,人大刘勇团队最新大语言模型理论与机理综述

机器之心
机器之心 · 2026-01-14T02:15:03Z
2025 大语言模型年度回顾

2025年,大语言模型(LLM)迅速发展,推理能力成为主流,AI辅助搜索和编码Agent表现突出。中国开源模型崛起,市场竞争加剧,同时安全风险引发关注,公众对新建数据中心的反对声音上升。

2025 大语言模型年度回顾

Tw93 的博客
Tw93 的博客 · 2026-01-14T00:00:00Z

智元机器人推出开源仿真平台Genie Sim 3.0,结合大语言模型与三维重建技术,提供高保真仿真环境,支持自然语言生成场景,拥有丰富的仿真数据集,提升研发效率,推动智能应用创新。

重塑虚实边界:智元机器人发布首个大语言模型驱动的开源仿真平台Genie Sim 3.0

量子位
量子位 · 2026-01-07T07:44:52Z
Meta利用大语言模型(LLM)进行变异测试以提升合规覆盖率

Meta利用大语言模型(LLM)改进变异测试,提升合规覆盖率。该系统生成上下文相关的变异体和测试,解决传统变异测试的局限性,帮助团队更高效地满足全球监管要求。通过自动化合规强化系统(ACH),Meta显著减少操作开销,并在多个平台成功部署,生成大量可操作的测试。未来,Meta将继续扩展ACH,优化变异体生成,并研究开发者与LLM生成测试的互动。

Meta利用大语言模型(LLM)进行变异测试以提升合规覆盖率

InfoQ
InfoQ · 2026-01-06T15:00:00Z

通过赋予 LLM 特定角色和回答范围(如仅限法律领域),可以帮助其理解具体需求的场景上下文,从而提供更优质的输出。

生成式大语言模型(LLM:eg:deepseek)用法技巧

Peijie's Wiki
Peijie's Wiki · 2026-01-05T00:00:00Z

撰写高质量输入的一些技巧LLM 的本质是一个输入输出程序软件体,这意味着:

1-AiLearning:生成式大语言模型(LLM:eg:deepseek)的用法技巧

Peijie's Wiki
Peijie's Wiki · 2026-01-05T00:00:00Z
Chitu - 一个面向生产的大语言模型推理框架,提供…

Chitu是一个高性能、低延迟的大语言模型推理引擎,适用于企业问答和实时推理,具备良好的稳定性和扩展性。

Chitu - 一个面向生产的大语言模型推理框架,提供…

云原生
云原生 · 2025-12-27T07:44:12Z

文章回顾了人工智能的发展,比较了符号主义与连接主义。符号主义重视知识与推理,而连接主义通过神经网络进行学习。尽管符号主义曾主导,但其局限性逐渐显现,连接主义因适应商业需求而迅速发展,尤其是大语言模型的崛起。作者认为连接主义并非最佳AI范式,但在商业竞争中表现突出。

大语言模型,资本的狂欢

Teach Talk
Teach Talk · 2025-12-25T06:58:23Z
多模态大语言模型基础:大语言模型如何处理文本、图像、音频和视频

静态训练数据无法适应快速变化的信息,导致模型只能进行猜测。本文介绍了多模态大语言模型(LLM)的原理,通过将文本、图像和音频转化为统一的数学表示,模型实现了跨模态推理,能够实时理解和响应。

多模态大语言模型基础:大语言模型如何处理文本、图像、音频和视频

ByteByteGo Newsletter
ByteByteGo Newsletter · 2025-12-22T16:30:45Z

AAAI 2026|视频大语言模型到底可不可信?23款主流模型全面测评来了

机器之心
机器之心 · 2025-12-15T10:36:08Z
qqqa – 终端中的大语言模型:快问快答、运行命令

qqqa 是一款终端工具,允许用户在终端内提问 AI,快速获取答案并执行命令。它提供两个命令:qq(只读)和 qa(可执行),支持 macOS、Linux 和 Windows,用户需初始化配置 API Key。

qqqa – 终端中的大语言模型:快问快答、运行命令

小众软件
小众软件 · 2025-12-10T07:25:23Z
五大智能助手AI大语言模型

2025年,智能助手时代到来,AI的应用超越聊天。OpenAI的o1、Google的Gemini 2.0和Kimi的K2等模型在推理、速度和工具使用方面表现优异,推动个人与企业智能化进程。

五大智能助手AI大语言模型

MachineLearningMastery.com
MachineLearningMastery.com · 2025-12-08T13:21:34Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码