小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
读完 DeepSeek-V4 技术报告:这次最值得看的,不是“更大”,而是“更省”

DeepSeek-V4技术报告强调通过改进注意力机制和优化器,提高超长上下文处理效率,能够高效处理1M上下文,降低计算和缓存成本。模型在中文写作和白领任务中表现良好,但在复杂任务上仍需提升。整体目标是解决长上下文的成本问题,提供完整的技术方案。

读完 DeepSeek-V4 技术报告:这次最值得看的,不是“更大”,而是“更省”

清竹茶馆博客
清竹茶馆博客 · 2026-04-24T00:01:21Z

本文介绍了机器学习中自动微分的实现方法,通过将复杂函数拆解为基本运算构建计算图,以精确高效地计算导数。文章还展示了反向传播、梯度更新及优化器的实现,并提供了一个类似PyTorch的开源框架。

自動微分 | DIY 實現自己的 PyTorch

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-04-12T23:45:09Z
如何开启mysql的optimizer trace

在MySQL中,可以通过开启优化器跟踪来分析索引使用情况,从而了解优化器如何处理查询以及未使用预期索引的原因。

如何开启mysql的optimizer trace

Nicksxs's Blog
Nicksxs's Blog · 2026-02-15T14:51:13Z

PostgreSQL 18引入了多列B树索引的跳过扫描功能,显著增强了优化器。在低基数情况下,跳过扫描能显著提升查询速度,而在高基数情况下,全索引扫描仍然更优。

罗宾斯·塔拉坎:你在v18之前就已经拥有的“跳过扫描”

Planet PostgreSQL
Planet PostgreSQL · 2026-02-04T13:05:00Z

最近笔者刷到论文《Why Adam Works Better with β1=β2: The Missing Gradient Scale Invariance Principle》,顾名思义,...

Adam优化器的最优超参数是β1=β2 ?

科学空间|Scientific Spaces
科学空间|Scientific Spaces · 2026-02-04T07:47:00Z

文章讨论了客户在批处理后首次执行查询时速度缓慢的问题。分析显示,查询计划在两次执行中不同,主要由于连接策略变化:首次使用合并连接,第二次使用嵌套循环连接。尽管表未清理或分析,优化器行为仍不同,导致执行时间差异。最后,作者提供了重现此现象的脚本。

弗雷德里克·尤埃尔:被低估的合并连接节点的奇怪案例

Planet PostgreSQL
Planet PostgreSQL · 2026-01-19T07:15:25Z

谷歌新论文《嵌套学习:深度学习架构的幻象》指出,大型语言模型存在“数字失忆症”,无法有效记忆新知识。研究强调优化器不仅是训练工具,更是记忆系统,提出“嵌套学习”新范式,强调模型深度与更新频率的平衡。新架构HOPE模仿人脑记忆机制,展现了解决持续学习问题的潜力,可能改变AI设计逻辑。

为什么这篇谷歌论文被称为「Attention is all you need」V2

量子位
量子位 · 2025-12-21T11:09:33Z

自去年提出的Muon优化器已在多个训练框架中应用,表现优异。本文介绍了从Adam切换到Muon的技术细节,包括不同版本的参数设置和注意事项。Muon专注于矩阵参数优化,用户需了解输入输出维度的定义以确保正确使用。

Muon优化器指南:快速上手与关键细节

科学空间|Scientific Spaces
科学空间|Scientific Spaces · 2025-11-19T15:08:00Z
Kimi的K2开源语言模型支持动态资源可用性和新优化器

Kimi发布了K2,一个拥有320亿参数的大型语言模型,采用新优化器MuonClip,解决了训练不稳定性。K2在推理和编程基准测试中表现优异,支持动态资源利用,具备高效推理能力,并在商业使用上有特定要求。

Kimi的K2开源语言模型支持动态资源可用性和新优化器

InfoQ
InfoQ · 2025-11-17T08:35:00Z
在MySQL中,一条SQL语句的执行全流程是怎样的?

本文详细介绍了MySQL中SQL语句的执行过程,包括客户端发送请求、连接器验证权限、分析器解析语句、优化器生成执行计划以及执行器从存储引擎获取数据并返回结果的各个步骤。

在MySQL中,一条SQL语句的执行全流程是怎样的?

程序新视界
程序新视界 · 2025-10-23T12:44:29Z

在MySQL的连表查询中,驱动表和被驱动表的选择会影响查询性能。驱动表通常数据量小且能有效利用索引,优化器会根据数据量、索引和过滤条件来决定驱动表。使用EXPLAIN可以帮助分析和优化查询。

什么是MySQL JOIN查询的驱动表和被驱动表?

程序新视界
程序新视界 · 2025-10-19T05:57:41Z

本文分析了MySQL中IS NULL和IS NOT NULL查询条件的索引使用情况。通过实例发现,索引的使用与数据量和分布有关,优化器根据执行成本决定是否使用索引,而非仅依据查询条件。总结指出,尽管理论上这两种条件都可能使用索引,但实际情况需结合具体数据分析。

MySQL中,IS NULL和IS NOT NULL不会走索引?错!

程序新视界
程序新视界 · 2025-10-09T12:47:07Z
为语音识别启用差分隐私的联邦学习:基准测试、自适应优化器与梯度裁剪

联邦学习(FL)与差分隐私(DP)在自动语音识别(ASR)中的应用尚待深入。本文通过逐层裁剪和梯度归一化技术,缓解了大模型在FL中面临的梯度异质性问题。实验结果表明,在强隐私保护下,FL与DP在用户规模达到数百万时是可行的,并且在不同规模下的字错误率有所改善。这为大模型的隐私保护FL算法设计提供了指导。

为语音识别启用差分隐私的联邦学习:基准测试、自适应优化器与梯度裁剪

Apple Machine Learning Research
Apple Machine Learning Research · 2025-09-29T00:00:00Z

本文探讨了动量机制对优化器(如SignSGD和Adam)学习率与Batch Size关系的影响。动量通过对梯度的滑动平均,等效于放大Batch Size,从而影响学习率的调整。研究表明,动量的引入使学习率与Batch Size之间的关系更加复杂,尤其在Adam中表现出新的特性。

重新思考学习率与Batch Size(四):EMA

科学空间|Scientific Spaces
科学空间|Scientific Spaces · 2025-09-22T06:37:00Z

机器之心数据服务现已上线,提供高效稳定的数据获取服务,简化数据爬取流程。

斯坦福:优化器「诸神之战」?AdamW 凭「稳定」胜出

机器之心
机器之心 · 2025-09-07T08:23:13Z
欢迎来到《优化器》,我们不懈追求更聪明、更健康的生活

《优化器》是每周通讯,探讨科技如何改善生活。作者Victoria Song分析各种科技产品,评估其对生活质量的提升。订阅者将获得个人随笔、实验室笔记及对健康和AI骗局的深度剖析。

欢迎来到《优化器》,我们不懈追求更聪明、更健康的生活

The Verge
The Verge · 2025-09-04T15:00:00Z

本文探讨了学习率与Batch Size的关系,尤其是在非SGD优化器中的复杂性。作者回顾了以往的分析方法,简化了推导步骤,并研究了Muon优化器的潜力。通过对SGD的分析,得出了学习率的理论最优解,指出Batch Size与训练数据量和步数的关系,并强调了噪声强度对学习率的影响。

重新思考学习率与Batch Size(一):现状

科学空间|Scientific Spaces
科学空间|Scientific Spaces · 2025-09-01T03:10:00Z
迈克尔·克里斯托菲德斯:Postgres 18中的“enable”参数将以不同的方式工作

PostgreSQL 18改进了对“enable”参数的处理,取消了禁用节点的成本增加,改为统计每个计划路径中的禁用节点数量。优化器将优先选择禁用节点最少的路径,从而提升查询性能。

迈克尔·克里斯托菲德斯:Postgres 18中的“enable”参数将以不同的方式工作

Planet PostgreSQL
Planet PostgreSQL · 2025-08-07T15:53:16Z
安德烈·列皮霍夫:RTABench Q0 优化的额外方法

文章探讨了Postgres中索引的效率,提出了一种新索引,其性能显著优于传统索引。尽管EXPLAIN输出未能清晰显示其优势,但新索引在选择性和过滤效率上表现更佳。分析指出,优化器未能充分利用索引扫描中的信息,导致低效索引难以识别。建议改进优化器以提升索引选择的有效性。

安德烈·列皮霍夫:RTABench Q0 优化的额外方法

Planet PostgreSQL
Planet PostgreSQL · 2025-08-07T14:19:40Z

机器之心数据服务已上线,提供高效稳定的数据获取,简化爬取流程。

当提示词优化器学会进化,竟能胜过强化学习

机器之心
机器之心 · 2025-07-31T09:59:49Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码