小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
从未升温的投影仪 — 稳固的融合

开发者在河床上放置平坦的石头,形成了版本比较功能。通过简单的参数更新,用户可以查看历史版本差异,提升了功能的可用性,最终使代码库更简洁且功能更强大。

从未升温的投影仪 — 稳固的融合

Lifelog — A Mythology-Driven Devlog
Lifelog — A Mythology-Driven Devlog · 2026-04-10T07:10:44Z

Meta的研究揭示了强化学习(RL)训练中参数更新稀疏的现象,并提出了三种理论来解释其机制。尽管RL训练显著提升性能,但仅有少量参数被修改,主要由于KL锚定、模型几何和精度过滤等因素。研究表明,RL与监督微调(SFT)在参数优化区域存在显著差异,为RL训练算法设计提供了新思路。

这些大神在Meta的论文看一篇少一篇了

量子位
量子位 · 2025-11-17T05:57:25Z
研究可能导致大型语言模型在复杂推理方面表现更佳

麻省理工学院的研究人员提出了一种“测试时训练”方法,通过临时更新大型语言模型(LLMs)的参数,显著提高其在复杂推理任务中的准确性,最多可提升六倍。这种方法结合上下文学习,使模型在医疗诊断等需要逻辑推理的应用中更具灵活性。研究表明,更新模型参数能有效提升性能,未来目标是开发能够自动选择最佳学习策略的LLM。

研究可能导致大型语言模型在复杂推理方面表现更佳

MIT News - Artificial intelligence
MIT News - Artificial intelligence · 2025-07-08T04:00:00Z

本研究提出了一种名为KO的神经网络优化器,基于动力学理论和偏微分方程模拟。KO通过粒子系统演化重新构思参数更新,增强参数多样性,有效减缓参数凝聚现象。实验结果显示,KO在图像和文本分类任务中的表现优于传统优化器,如Adam和SGD,准确率更高。

KO:基于动力学的神经网络优化器与偏微分方程模拟方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-20T00:00:00Z

本研究提出了InfiniteICL框架,解决了大型语言模型在超长上下文中窗口有限的问题。该方法通过将临时知识转化为持久参数更新,显著降低了内存使用,并提升了模型在不同输入长度下的表现。实验表明,该方法在复杂真实场景中有效减少了90%的上下文长度。

Infinite Context Learning: Breaking the Limit of Context Window Size via Long Short-term Memory Transformation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-02T00:00:00Z

本研究提出了一种稀疏训练策略,旨在解决多任务学习中的梯度冲突问题。通过部分参数更新,稀疏训练有效减轻了梯度冲突,提高了模型性能,并可与现有技术结合使用。

Active Gradient Conflict Mitigation in Multi-Task Learning: A Sparse Training Perspective

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-27T00:00:00Z

该论文介绍了一种名为指示性解码的方法,通过使用噪声指示来改进指导性调整的语言模型。研究了不同类型的噪声指示,包括随机单词插入语义噪声和引发有偏离性响应的指示。该方法在不需要额外参数更新的情况下,在各种指导性调整的模型和任务中实现了相当大的性能提升。

扭曲、分散、解码:调校模型能够从嘈杂的指令中优化应答

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-01T00:00:00Z

本文介绍了基于模型的元学习中的Learning to Learn优化策略和Meta-Learner LSTM。Meta-Learner LSTM使用单元状态表示Learner参数的更新,既能发现一个良好的Learner初始化参数,又能将Learner的参数更新到一个给定的小训练集,以完成一些新任务。Meta-Learner LSTM和MAML的区别在于信息交流的时间点和元学习器的更新方式。Meta-Learner LSTM适用于LSTM结构的元学习器,但基学习器可以适用于任意模型结构。在miniImageNet上进行分类,Meta-Learner LSTM取得了较好的结果。

了解基于模型的元学习:Learning to Learn优化策略和Meta-Learner LSTM

华为云官方博客
华为云官方博客 · 2023-06-16T02:47:17Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码