小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

REINFORCE方法通过回报加权优化不可微奖励,但在语言模型中方差过高。Actor-Critic方法将策略与价值函数分开训练,利用广义优势估计(GAE)在Monte-Carlo回报与时间差分(TD)引导之间平衡偏差和方差。Critic帮助构造优势估计,降低策略更新的方差。GAE通过加权多步TD残差,结合折扣因子B3和BB控制未来奖励的影响和优势估计的稳定性。

【强化学习与大模型后训练】04|Actor-Critic 与优势函数、GAE

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-05-29T00:00:00Z
RVPO:通过方差正则化实现风险敏感的对齐

本文提出了一种风险敏感的奖励方差优化框架(RVPO),旨在解决多目标奖励聚合中的约束忽视问题。RVPO通过惩罚奖励间的方差,优化模型的一致性,从而在医疗和科学推理任务中提高表现。实验结果表明,RVPO在HealthBench上显著优于传统方法,并在保持准确性的同时,避免了多奖励方法的性能下降。

RVPO:通过方差正则化实现风险敏感的对齐

Apple Machine Learning Research
Apple Machine Learning Research · 2026-05-08T00:00:00Z

组合构建是量化投资的关键,涉及信号、风险模型和约束条件的优化。研究者需应对协方差的不稳定性和复杂约束,确保权重在实际交易中可行。文章分析了均值方差、风险平价和Black-Litterman等方法的优缺点,强调稳健性和风险管理的重要性。最终,组合构建不仅是数学问题,更是应对不确定性以实现稳定收益的挑战。

【量化交易】组合构建:均值方差、风险平价、Black-Litterman

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-05-01T00:00:00Z

本文介绍了一种高效计算方差的算法,通过同时计算均值和均方实现一次遍历。由于浮点数计算可能导致数值不稳定,尤其在方差小而均值大时,可能出现灾难性取消。为提高算法的数值稳定性,可以采用数据平移技巧,保持方差不变。

一次遍历的简单方差计算算法

Lei Mao's Log Book
Lei Mao's Log Book · 2025-10-29T07:00:00Z
偏差-方差权衡:视觉解释

偏差-方差权衡是机器学习模型性能的关键。偏差指系统性错误,方差则是对训练数据微小变化的敏感性。理想模型应同时具备低偏差和低方差。为降低高偏差,可以增加模型复杂性或特征;为降低高方差,则需增加训练数据或使用正则化。通过学习曲线和交叉验证可以评估模型表现,并持续调整以优化模型。

偏差-方差权衡:视觉解释

MachineLearningMastery.com
MachineLearningMastery.com · 2025-08-19T12:00:26Z

成像质谱(IMS)在生物学中用于可视化生物组织的分子分布。研究者提出结合IMS与光学显微镜的多模态方法,开发基于扩散模型的虚拟染色技术,以提高空间分辨率并简化工作流程。该技术在无标记组织的质谱图像中引入细胞形态对比度,具有重要的临床应用潜力。

输出方差显著降低!UCLA发布双向布朗桥扩散模型,提升虚拟染色结果可重复性

HyperAI超神经
HyperAI超神经 · 2025-08-14T05:07:54Z
在Python中玩转统计学

本文介绍了Python中的统计学概念,包括平均偏差、方差和标准差的计算方法,并通过示例代码展示了如何实现这些统计量,帮助理解数据的分散程度。尽管内容基础,但有助于掌握统计公式的应用。

在Python中玩转统计学

DEV Community
DEV Community · 2025-05-16T02:46:40Z
人工智能模型 – 偏差、方差、欠拟合、过拟合

偏差是由于错误假设引起的误差,高偏差模型过于简单,导致欠拟合;方差是对训练数据过于敏感的误差,高方差模型过于复杂,导致过拟合。可通过增加模型复杂性、特征工程和延长训练时间来减少偏差;通过简化模型、增加训练数据和使用正则化技术来减少方差。

人工智能模型 – 偏差、方差、欠拟合、过拟合

DEV Community
DEV Community · 2025-04-25T21:20:38Z

本研究解决了传统均值-方差模型在投资组合优化中面临的挑战,尤其是投资者观点定义的困难。通过将大型语言模型(LLMs)生成的观点融入黑利特曼框架,本研究提出了一种新方法,通过历史价格和公司元数据估计股票预期收益,并引入预测的不确定性。实证结果表明,不同的LLMs展现出不同的预测乐观程度和信心水平,进而影响投资组合的表现。

将大型语言模型生成的观点整合到使用黑利特曼模型的均值-方差优化中

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-19T00:00:00Z

本研究探讨了扩散模型如何超越训练集进行泛化的问题,尤其是阐明了去噪声评分匹配(DSM)目标的某些特性对泛化能力的影响。作者提出了一种数学理论,揭示了“通过方差实现泛化”的现象,并表明扩散模型学习到的分布与训练分布相似,但存在“间隙”,这种归纳偏差源于训练过程中使用的噪声目标的协方差结构。

通过方差实现泛化:噪声如何塑造扩散模型中的归纳偏差

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-16T00:00:00Z

本研究探讨了语言模型间KL散度估计的高方差问题,提出了一种Rao-Blackwell化估计器,降低了方差并保持无偏性。实证结果表明,该估计器在情感控制微调中显著提高了KL估计的稳定性。

更好的语言模型间KL散度估计

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-14T00:00:00Z

本文提出了一种自适应多保真强化学习框架,旨在解决传统方法中因模型层级依赖导致的方差增加问题。该框架动态结合低保真和高保真模型,降低策略学习方差,提高收敛速度和解决方案质量,消除手动调节模型的需求。

Adaptive Multi-Fidelity Reinforcement Learning for Variance Reduction in Engineering Design Optimization

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-23T00:00:00Z
偏差-方差权衡

在机器学习中,偏差-方差权衡对构建稳健模型至关重要。偏差源于模型对数据的错误假设,可能导致欠拟合;方差则反映模型在不同数据子集上的预测变化,可能导致过拟合。理想模型应在偏差和方差之间取得平衡,以优化预测准确性。

偏差-方差权衡

DEV Community
DEV Community · 2025-03-14T16:30:00Z

本研究探讨了在微调大型语言模型时,随机种子对模型性能的影响。通过GLUE和SuperGLUE基准评估,提出了一种新的稳定性度量,发现随机种子在宏观和微观层面显著影响模型的方差,强调了随机种子选择的重要性。

Evaluating the Macro and Micro Effects of Random Seeds on Fine-Tuning Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-10T00:00:00Z

本研究解决了多层神经网络泛化理论中的一个重要空白,提出了一种不依赖于损失函数有界性的非渐近泛化理论。该理论超越了传统的偏差-方差权衡,首次考虑了近似误差,并利用其显示了多层ReLU网络在回归问题上的近最小最大最优性和双下降现象。该工作为深度学习的理解提供了新的视角。

多层神经网络的近完整非渐近泛化理论:超越偏差-方差权衡

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-03T00:00:00Z
均值、方差和标准差的计算实现

本文介绍了如何使用Python的NumPy库计算均值、方差和标准差。均值表示数据集的中心,方差衡量数据点与均值的离散程度,标准差为方差的平方根。通过示例代码展示了这些统计量的计算,强调了NumPy在数据分析中的重要性。

均值、方差和标准差的计算实现

DEV Community
DEV Community · 2025-02-28T16:30:00Z

本文探讨了KL散度的三种估计方法及其优缺点:原始估计量(k₁)无偏但方差高,适合理论验证;平方对数估计量(k₂)在小差异情况下偏差可忽略,适合快速诊断;控制变量法(k₃)实现了无偏和低方差的平衡,适用于精确评估概率分布差异的场景。建议根据需求选择合适的估计量。

估计KL散度的艺术:平衡偏差与方差的实用指南

NotionNext BLOG
NotionNext BLOG · 2025-02-10T00:00:00Z
中心测量:该数据集的典型行为是什么?

中心趋势的测量在数据分析中至关重要,常用的指标包括均值、 медиана 和众数。均值是所有值的总和除以数量,受极端值影响; медиана 是排序后的中间值,众数是出现频率最高的值。方差和标准差用于衡量数据的离散程度,而四分位数间距(IQR)则衡量中间50%的数据分布。

中心测量:该数据集的典型行为是什么?

DEV Community
DEV Community · 2025-01-21T22:56:05Z
数据分析师必知的10个统计术语

作为数据分析师,掌握统计概念至关重要。本文介绍了10个关键术语:均值、中位数、方差、标准差、正态分布、相关性、概率、p值、直方图和假设检验。这些概念有助于数据分析、趋势识别和数据驱动决策。

数据分析师必知的10个统计术语

DEV Community
DEV Community · 2024-12-21T06:57:13Z

本研究提出了一种基于得分的生成模型(SGM)方法,用于在低计数条件下重建3D PET图像。该方法在真实全3D PET数据上表现出更低的方差,重建结果接近全计数重建效果。

Full 3D PET Image Reconstruction Based on Generative Model Conditional Diffusion Sampling

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-05T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码