小红花·文摘

本文介绍了一种高效计算方差的算法，通过同时计算均值和均方实现一次遍历。由于浮点数计算可能导致数值不稳定，尤其在方差小而均值大时，可能出现灾难性取消。为提高算法的数值稳定性，可以采用数据平移技巧，保持方差不变。

一次遍历的简单方差计算算法

Lei Mao's Log Book ·

偏差-方差权衡：视觉解释

MachineLearningMastery.com ·

成像质谱（IMS）在生物学中用于可视化生物组织的分子分布。研究者提出结合IMS与光学显微镜的多模态方法，开发基于扩散模型的虚拟染色技术，以提高空间分辨率并简化工作流程。该技术在无标记组织的质谱图像中引入细胞形态对比度，具有重要的临床应用潜力。

输出方差显著降低！UCLA发布双向布朗桥扩散模型，提升虚拟染色结果可重复性

HyperAI超神经 ·

在Python中玩转统计学

DEV Community ·

人工智能模型 – 偏差、方差、欠拟合、过拟合

DEV Community ·

本研究解决了传统均值-方差模型在投资组合优化中面临的挑战，尤其是投资者观点定义的困难。通过将大型语言模型（LLMs）生成的观点融入黑利特曼框架，本研究提出了一种新方法，通过历史价格和公司元数据估计股票预期收益，并引入预测的不确定性。实证结果表明，不同的LLMs展现出不同的预测乐观程度和信心水平，进而影响投资组合的表现。

将大型语言模型生成的观点整合到使用黑利特曼模型的均值-方差优化中

BriefGPT - AI 论文速递 ·

本研究探讨了扩散模型如何超越训练集进行泛化的问题，尤其是阐明了去噪声评分匹配（DSM）目标的某些特性对泛化能力的影响。作者提出了一种数学理论，揭示了“通过方差实现泛化”的现象，并表明扩散模型学习到的分布与训练分布相似，但存在“间隙”，这种归纳偏差源于训练过程中使用的噪声目标的协方差结构。

通过方差实现泛化：噪声如何塑造扩散模型中的归纳偏差

BriefGPT - AI 论文速递 ·

本研究探讨了语言模型间KL散度估计的高方差问题，提出了一种Rao-Blackwell化估计器，降低了方差并保持无偏性。实证结果表明，该估计器在情感控制微调中显著提高了KL估计的稳定性。

更好的语言模型间KL散度估计

BriefGPT - AI 论文速递 ·

本文提出了一种自适应多保真强化学习框架，旨在解决传统方法中因模型层级依赖导致的方差增加问题。该框架动态结合低保真和高保真模型，降低策略学习方差，提高收敛速度和解决方案质量，消除手动调节模型的需求。

Adaptive Multi-Fidelity Reinforcement Learning for Variance Reduction in Engineering Design Optimization

BriefGPT - AI 论文速递 ·

偏差-方差权衡

DEV Community ·

本研究探讨了在微调大型语言模型时，随机种子对模型性能的影响。通过GLUE和SuperGLUE基准评估，提出了一种新的稳定性度量，发现随机种子在宏观和微观层面显著影响模型的方差，强调了随机种子选择的重要性。

Evaluating the Macro and Micro Effects of Random Seeds on Fine-Tuning Large Language Models

BriefGPT - AI 论文速递 ·

本研究解决了多层神经网络泛化理论中的一个重要空白，提出了一种不依赖于损失函数有界性的非渐近泛化理论。该理论超越了传统的偏差-方差权衡，首次考虑了近似误差，并利用其显示了多层ReLU网络在回归问题上的近最小最大最优性和双下降现象。该工作为深度学习的理解提供了新的视角。

多层神经网络的近完整非渐近泛化理论：超越偏差-方差权衡

BriefGPT - AI 论文速递 ·

均值、方差和标准差的计算实现

DEV Community ·

本文探讨了KL散度的三种估计方法及其优缺点：原始估计量（k₁）无偏但方差高，适合理论验证；平方对数估计量（k₂）在小差异情况下偏差可忽略，适合快速诊断；控制变量法（k₃）实现了无偏和低方差的平衡，适用于精确评估概率分布差异的场景。建议根据需求选择合适的估计量。

估计KL散度的艺术：平衡偏差与方差的实用指南

NotionNext BLOG ·

中心测量：该数据集的典型行为是什么？

DEV Community ·

数据分析师必知的10个统计术语

DEV Community ·

本研究提出了一种基于得分的生成模型(SGM)方法，用于在低计数条件下重建3D PET图像。该方法在真实全3D PET数据上表现出更低的方差，重建结果接近全计数重建效果。

Full 3D PET Image Reconstruction Based on Generative Model Conditional Diffusion Sampling

BriefGPT - AI 论文速递 ·

过拟合与欠拟合

DEV Community ·

本研究针对大型语言模型（LLMs）的层重要性评估与幻觉生成问题，通过提出激活方差稀疏性评分（AVSS），量化各层对模型性能的贡献。研究发现，通过剪除影响最小的25%层，仍可保留超过90%的性能，且引入增强版本EAVSS后，结合对比学习显著减少了幻觉生成，最大性能提升可达12%，为提升LLMs的鲁棒性与效率提供了框架。

通过增强激活方差稀疏性分析大型语言模型中的层重要性与幻觉

BriefGPT - AI 论文速递 ·

本研究解决了在训练深度神经网络和大型语言模型中方差降低方法应用不足的问题。我们提出了一个统一的优化框架MARS，将预处理梯度方法与方差降低结合，从而实现高效的模型训练。实验表明，MARS在训练GPT-2模型时显著超越了传统的AdamW优化器。

MARS：释放方差降低在大规模模型训练中的潜力

BriefGPT - AI 论文速递 ·