小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
重新审视大型语言模型训练中下游指标的缩放特性

本文探讨了大型语言模型(LLMs)在下游任务性能上的缩放特性,提出了一种框架来根据训练预算预测基准性能。研究发现,在固定的令牌与参数比率下,简单的幂律可以准确描述多个下游任务的准确率缩放行为。该方法优于传统的两阶段程序,并提供了预测准确率的功能形式。研究团队还发布了完整的预训练损失和下游评估结果,以支持可重复性。

重新审视大型语言模型训练中下游指标的缩放特性

Apple Machine Learning Research
Apple Machine Learning Research · 2026-03-26T00:00:00Z
EgoScale——第一视角的2万小时人类标注数据扩展灵巧操作能力(提出人类数据下的缩放定律):先大规模人类预训练,再人机对齐,最后单条示范微调

EgoScale是一个基于大规模自中心人类数据的灵巧操作迁移框架。通过在20854小时的动作标注视频上训练视觉-语言-动作模型,发现人类数据规模与验证损失呈对数线性关系。该框架采用两阶段迁移方案,先进行大规模预训练,再进行少量对齐的中期训练,使机器人在极少监督下实现灵巧操作。研究表明,预训练策略在不同机器人平台上均能有效迁移,提升任务成功率。

EgoScale——第一视角的2万小时人类标注数据扩展灵巧操作能力(提出人类数据下的缩放定律):先大规模人类预训练,再人机对齐,最后单条示范微调

结构之法 算法之道
结构之法 算法之道 · 2026-03-02T10:39:29Z
如何使用CSS的"zoom"缩放元素及其布局 (#tilPost)

文章讨论了CSS中的缩放功能,指出使用transform: scale(1)仅影响元素的视觉效果,而布局大小保持不变。相比之下,zoom属性会真正改变元素及其布局。尽管zoom在浏览器中的支持良好,但不建议对其进行动画处理,以避免布局变化带来的问题。

如何使用CSS的"zoom"缩放元素及其布局 (#tilPost)

Stefan Judis Web Development
Stefan Judis Web Development · 2026-02-23T23:00:00Z
C# WPF canvas中绘制缺陷分布map并实现缩放

EFCore.Visualizer 是一款为 Entity Framework Core 设计的可视化调试工具,支持多种数据库,帮助开发者优化查询性能和调试复杂查询。

C# WPF canvas中绘制缺陷分布map并实现缩放

dotNET跨平台
dotNET跨平台 · 2026-02-19T02:06:35Z
CommandPost上手:通过鼠标缩放你的 Final Cut Pro 时间线

使用Final Cut Pro剪辑时,鼠标操作不便,需用触摸板缩放时间轴。CommandPost可解决此问题,下载后需设置辅助功能和录屏权限,支持滚轮缩放时间轴。

CommandPost上手:通过鼠标缩放你的 Final Cut Pro 时间线

张洪Heo
张洪Heo · 2025-10-23T10:27:24Z
在亚马逊云科技中国区域利用 S3  Object Lambda 轻松实现自定义图片缩放

在网站开发中,S3 Object Lambda功能可实现动态图片缩放,按需生成不同尺寸的图片,节省存储空间并简化管理。用户可通过文件名参数获取所需分辨率的图片,避免预存多个版本,适合优化成本和性能。

在亚马逊云科技中国区域利用 S3  Object Lambda 轻松实现自定义图片缩放

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2025-10-15T09:21:33Z
MinMax缩放器 vs 标准缩放器 vs 鲁棒缩放器:哪一个在处理偏斜数据时表现最佳?

本文讨论了MinMaxScaler、StandardScaler和RobustScaler在处理偏斜和异常值数据时的表现。MinMaxScaler适用于无异常值的干净数据,StandardScaler适合近似正态分布的数据,而RobustScaler在存在异常值时表现最佳。选择合适的缩放器可以提高模型的学习效果,RobustScaler通常是处理真实世界数据的安全选择。

MinMax缩放器 vs 标准缩放器 vs 鲁棒缩放器:哪一个在处理偏斜数据时表现最佳?

MachineLearningMastery.com
MachineLearningMastery.com · 2025-10-01T12:00:18Z
最佳数据混合的缩放法则

本文提出了一种系统方法,通过缩放法则确定目标领域的最佳数据混合比例,以提升大规模模型的性能。该方法能够准确预测模型在特定领域权重下的损失,并在大型语言模型、多模态模型和视觉模型的预训练中验证其有效性。通过少量小规模训练,能够估计参数并推断更大规模的性能,提供了一种替代昂贵试错方法的方案。

最佳数据混合的缩放法则

Apple Machine Learning Research
Apple Machine Learning Research · 2025-09-26T00:00:00Z
Esther Minano:利用CNPG实现Postgres数据库的零资源缩放

在云计算中,将数据库缩放至零是一种节省资源的策略。通过分离存储和计算层,数据库在闲置时可以暂停,确保数据安全。Xata利用CNPG-I插件实现自动休眠,适用于临时分支、测试和预发布环境,从而降低成本并提高灵活性。

Esther Minano:利用CNPG实现Postgres数据库的零资源缩放

Planet PostgreSQL
Planet PostgreSQL · 2025-09-17T10:15:20Z
如何建立人工智能缩放法则以实现高效的大型语言模型训练和预算最大化

研究人员在构建大型语言模型时,需要在计算和财务预算内优化性能。麻省理工学院与IBM研究所的团队收集了数百个模型及其性能指标,制定了选择小模型和估算缩放法则的指南,以提高预算使用效率。这些法则帮助研究人员预测大型模型的表现,促进了资源有限的研究者的理解与应用。

如何建立人工智能缩放法则以实现高效的大型语言模型训练和预算最大化

MIT News - Artificial intelligence
MIT News - Artificial intelligence · 2025-09-16T15:00:00Z

AutoScaleHelper是一个WinForm应用的布局自适应工具,解决了不同分辨率下控件错位和布局混乱的问题。它支持控件缩放、动态添加控件和字体自适应,提升用户体验。模块化设计使开发者能轻松实现界面的协调显示。

WinForm 高分屏适配难题?一款强大的控件自适应缩放工具

dotNET跨平台
dotNET跨平台 · 2025-09-09T00:01:19Z
为Mini Micro游戏添加基本动画

最近,Dat_One_Dev在MiniScript Discord上分享了一个简单的追逐气球游戏代码。为了增加趣味性,作者建议让气球实现“呼吸”效果,即缩小和扩展。通过调整气球的缩放属性,使用全局变量和函数来实现动画效果,并在游戏主循环中调用该函数,最终实现气球的动态效果。

为Mini Micro游戏添加基本动画

DEV Community
DEV Community · 2025-05-26T05:12:55Z

本研究探讨了大型语言模型预训练中的超参数调优,重点分析了学习率和权重衰减的关系,并提出了一种预测最佳权重衰减的新方法,为超参数选择提供理论支持。

电力线:大型语言模型预训练中的权重衰减和批处理大小的缩放法则

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-19T00:00:00Z

本研究探讨了大型语言模型中神经缩放规律的起源,提出了基于叠加和特征频率的模型,发现损失与模型维度成反比,验证了叠加表示的重要性。

叠加导致神经网络的稳健缩放

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-15T00:00:00Z

本研究提出了ZeroTIR工具集成推理方法,以解决大型语言模型在数学推理中的计算精度不足问题。研究表明,强化学习训练的进展与自发代码执行频率、响应长度和任务准确率之间存在显著正相关,揭示了计算努力与工具辅助推理策略的关系。

代理强化学习缩放法则:代理强化学习通过自发代码执行进行数学问题解决

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-12T00:00:00Z

本研究解决了机器人和人工智能领域中构建通用智能体的挑战,特别聚焦于体现的缩放法则。通过生成包含约1000种不同体现的数据集并训练通用策略,研究发现增加训练体现数量能显著提升对未见体现的泛化能力。这一成果为实现普适体智能迈出了重要一步,具有广泛的应用潜力。

向机器人运动中的体现缩放法则迈进

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-09T00:00:00Z
如何优化iOS浏览器中的SVG缩放动画?

在iOS浏览器中,SVG动画可能因硬件加速不足、JavaScript处理不当和CSS渲染问题而变慢。为提升性能,应利用硬件加速、优化滚动事件处理、调整CSS过渡属性,并在可能时用CSS元素替代SVG。测试应在真实设备上进行以确保效果最佳。

如何优化iOS浏览器中的SVG缩放动画?

DEV Community
DEV Community · 2025-05-06T00:45:33Z
使用ZeroMQ的C#图像缩放器

本文介绍了在布里斯班活动后,如何高效处理大量照片的缩放。原先使用PHP处理小文件效果良好,但面对5GB的上传量时效率低下且易崩溃。为此,采用C#和ZeroMQ实现多工作者图像处理方案,显著提升处理速度,并可在缩放时添加水印。

使用ZeroMQ的C#图像缩放器

DEV Community
DEV Community · 2025-04-30T23:35:02Z

本研究提出了一种新方法,通过图形表示与多维缩放技术,解决自动驾驶中的泛化能力不足问题。该方法通过嵌入图节点简化学习过程,实现降维,提高车辆在复杂环境中的导航能力。

使用多维缩放学习道路网络的等距嵌入

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-24T00:00:00Z
PyTorch中的ToTensor

本文介绍了如何将PIL图像转换为PyTorch张量并进行缩放。`ToTensor()`已被弃用,建议使用`Compose(transforms=[ToImage(), ToDtype(dtype=torch.float32, scale=True)])`。PIL图像和ndarray的值被缩放到[0.0, 1.0]范围内。

PyTorch中的ToTensor

DEV Community
DEV Community · 2025-04-22T19:11:07Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码