小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
沉浸式翻译 immersive translate
Dify.AI

大语言模型的训练包括三个阶段:预训练、监督微调和强化学习。预训练通过大量文本学习语言规律,监督微调利用高质量问答对提升回答能力,强化学习则帮助模型建立符合人类期望的价值观。

用通俗的方式介绍大语言模型训练过程

安志合的学习博客
安志合的学习博客 · 2026-01-18T07:14:10Z

跳出「黑盒」,人大刘勇团队最新大语言模型理论与机理综述

机器之心
机器之心 · 2026-01-14T02:15:03Z
2025 大语言模型年度回顾

2025年,大语言模型(LLM)迅速发展,推理能力成为主流,AI辅助搜索和编码Agent表现突出。中国开源模型崛起,市场竞争加剧,同时安全风险引发关注,公众对新建数据中心的反对声音上升。

2025 大语言模型年度回顾

Tw93 的博客
Tw93 的博客 · 2026-01-14T00:00:00Z

智元机器人推出开源仿真平台Genie Sim 3.0,结合大语言模型与三维重建技术,提供高保真仿真环境,支持自然语言生成场景,拥有丰富的仿真数据集,提升研发效率,推动智能应用创新。

重塑虚实边界:智元机器人发布首个大语言模型驱动的开源仿真平台Genie Sim 3.0

量子位
量子位 · 2026-01-07T07:44:52Z
Meta利用大语言模型(LLM)进行变异测试以提升合规覆盖率

Meta利用大语言模型(LLM)改进变异测试,提升合规覆盖率。该系统生成上下文相关的变异体和测试,解决传统变异测试的局限性,帮助团队更高效地满足全球监管要求。通过自动化合规强化系统(ACH),Meta显著减少操作开销,并在多个平台成功部署,生成大量可操作的测试。未来,Meta将继续扩展ACH,优化变异体生成,并研究开发者与LLM生成测试的互动。

Meta利用大语言模型(LLM)进行变异测试以提升合规覆盖率

InfoQ
InfoQ · 2026-01-06T15:00:00Z

通过赋予 LLM 特定角色和回答范围(如仅限法律领域),可以帮助其理解具体需求的场景上下文,从而提供更优质的输出。

生成式大语言模型(LLM:eg:deepseek)用法技巧

Peijie's Wiki
Peijie's Wiki · 2026-01-05T00:00:00Z

撰写高质量输入的一些技巧LLM 的本质是一个输入输出程序软件体,这意味着:

1-AiLearning:生成式大语言模型(LLM:eg:deepseek)的用法技巧

Peijie's Wiki
Peijie's Wiki · 2026-01-05T00:00:00Z
Chitu - 一个面向生产的大语言模型推理框架,提供…

Chitu是一个高性能、低延迟的大语言模型推理引擎,适用于企业问答和实时推理,具备良好的稳定性和扩展性。

Chitu - 一个面向生产的大语言模型推理框架,提供…

云原生
云原生 · 2025-12-27T07:44:12Z

文章回顾了人工智能的发展,比较了符号主义与连接主义。符号主义重视知识与推理,而连接主义通过神经网络进行学习。尽管符号主义曾主导,但其局限性逐渐显现,连接主义因适应商业需求而迅速发展,尤其是大语言模型的崛起。作者认为连接主义并非最佳AI范式,但在商业竞争中表现突出。

大语言模型,资本的狂欢

Teach Talk
Teach Talk · 2025-12-25T06:58:23Z
多模态大语言模型基础:大语言模型如何处理文本、图像、音频和视频

静态训练数据无法适应快速变化的信息,导致模型只能进行猜测。本文介绍了多模态大语言模型(LLM)的原理,通过将文本、图像和音频转化为统一的数学表示,模型实现了跨模态推理,能够实时理解和响应。

多模态大语言模型基础:大语言模型如何处理文本、图像、音频和视频

ByteByteGo Newsletter
ByteByteGo Newsletter · 2025-12-22T16:30:45Z

AAAI 2026|视频大语言模型到底可不可信?23款主流模型全面测评来了

机器之心
机器之心 · 2025-12-15T10:36:08Z
qqqa – 终端中的大语言模型:快问快答、运行命令

qqqa 是一款终端工具,允许用户在终端内提问 AI,快速获取答案并执行命令。它提供两个命令:qq(只读)和 qa(可执行),支持 macOS、Linux 和 Windows,用户需初始化配置 API Key。

qqqa – 终端中的大语言模型:快问快答、运行命令

小众软件
小众软件 · 2025-12-10T07:25:23Z
五大智能助手AI大语言模型

2025年,智能助手时代到来,AI的应用超越聊天。OpenAI的o1、Google的Gemini 2.0和Kimi的K2等模型在推理、速度和工具使用方面表现优异,推动个人与企业智能化进程。

五大智能助手AI大语言模型

MachineLearningMastery.com
MachineLearningMastery.com · 2025-12-08T13:21:34Z
SuperSonic - 一个统一了大语言模型驱动的对话式BI和语义层分析的企业AI+BI平台

SuperSonic是一个企业AI+BI平台,结合对话式BI和无头BI,利用大语言模型处理自然语言查询,提供精准的商业智能。其特点包括自然语言问答、标准化数据源、自动化数据处理和多租户支持,适合非技术用户进行自助分析和智能报告。

SuperSonic - 一个统一了大语言模型驱动的对话式BI和语义层分析的企业AI+BI平台

云原生
云原生 · 2025-12-06T03:23:43Z
SO-Bench:多模态大语言模型的结构输出评估

本文通过SO-Bench基准测试评估多模态大语言模型(MLLMs)在视觉结构输出能力上的表现,涵盖UI界面、自然图像、文档和图表等领域。研究发现,现有模型在准确预测符合预定义数据模式的输出方面存在不足,强调了改进多模态结构推理的必要性。

SO-Bench:多模态大语言模型的结构输出评估

Apple Machine Learning Research
Apple Machine Learning Research · 2025-12-05T00:00:00Z
NVIDIA Dynamo 解决多节点大语言模型推理挑战

Dynamo是一个开源框架,旨在高效管理大语言模型(LLM)的分布式推理。它将推理过程分为预填充和解码阶段,动态调配GPU资源,以应对需求波动,支持多种推理引擎,并能在Kubernetes上运行高性能AI工作负载,优化资源使用,降低延迟。

NVIDIA Dynamo 解决多节点大语言模型推理挑战

InfoQ
InfoQ · 2025-12-04T13:00:00Z
小猫都能懂的大模型原理 4 - 大语言模型架构

文章介绍了大语言模型的结构与训练过程。模型利用注意力机制和前馈神经网络处理数据,通过归一化和残差连接提升稳定性。训练时,模型通过反向传播调整参数,采用梯度下降算法和批量训练优化性能。尽管不同模型实现各异,但均表明语言可用数学方法处理。

小猫都能懂的大模型原理 4 - 大语言模型架构

UsubeniFantasy
UsubeniFantasy · 2025-12-04T02:16:52Z
使用Pydantic验证大语言模型输出的完整指南

本文介绍如何使用Pydantic将自由格式的大语言模型(LLM)文本转换为可靠的Python对象,涵盖Pydantic模型设计、解析不规范LLM输出、与OpenAI等API集成及重试策略,并通过示例展示如何验证和处理嵌套数据,以确保数据结构的完整性和准确性。

使用Pydantic验证大语言模型输出的完整指南

MachineLearningMastery.com
MachineLearningMastery.com · 2025-12-03T16:59:32Z
小猫都能懂的大模型原理 2 - 初见大语言模型

人们越来越倾向于使用ChatGPT而非搜索引擎。GPT是生成式预训练Transformer,基于自注意力机制的深度学习架构。通过大量文本数据训练,模型能够流畅生成语言并理解多种语言的翻译。输入输出基于Token,模型通过神经网络预测下一个Token的概率,最终生成完整句子。

小猫都能懂的大模型原理 2 - 初见大语言模型

UsubeniFantasy
UsubeniFantasy · 2025-12-01T02:11:25Z
SkyRL - 一个模块化的全栈强化学习(RL)库,专为大语言模型设计

SkyRL是一个专注于大语言模型训练与评估的模块化强化学习库,提供环境构建、训练和部署功能,旨在实现可重复的研究与工程。其主要特点包括模块化组件、高性能训练管道和丰富的环境套件,适用于多轮对话任务和算法评估。

SkyRL - 一个模块化的全栈强化学习(RL)库,专为大语言模型设计

云原生
云原生 · 2025-11-30T12:03:09Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码