小红花·文摘

损失函数是评估机器学习模型预测错误的重要工具，通过比较模型预测与真实值来反馈错误程度。常见的损失函数包括均方误差（MSE）和平均绝对误差（MAE），前者对大错误惩罚更重，后者则较温和。交叉熵损失用于分类任务，关注模型的预测信心。损失反映错误程度，训练过程中模型通过优化减少损失，提高预测能力。

新手解读损失函数（模型如何识别错误）

KDnuggets ·

大模型的损失函数为什么是交叉熵

木鸟杂记 ·

为什么大模型的损失函数是交叉熵

木鸟杂记 ·

大型语言模型如何学习

ByteByteGo Newsletter ·

优化过程旨在最小化损失函数，常用方法包括随机搜索、梯度下降和随机梯度下降（SGD）。SGD通过小批量数据计算梯度，加速收敛。动量法和RMSProp等技术提高了优化效率，而Adam优化器结合了动量和RMSProp的优点，能够自适应调整学习率。

CS231n 讲义 III：优化

Louis Aeilot's Blog ·

CS231n 讲义 II：线性分类器

Louis Aeilot's Blog ·

CS231n 讲义 II：线性分类器

Louis Aeilot's Blog ·

梯度下降：机器学习优化的引擎

MachineLearningMastery.com ·

本文介绍了神经网络BP传播算法的手算过程，强调只需初高中数学知识。通过C#代码和手算示例，逐步推导神经网络的计算过程，帮助读者理解权重更新和损失函数的概念，旨在让读者掌握简单BP神经网络的工作原理。

手算神经网络BP传播算法

dotNET跨平台 ·

损失函数解析：每个只需2分钟理解数学原理

MachineLearningMastery.com ·

PromptMRG：基于诊断驱动的医疗报告生成提示

DEV Community ·

DiffusionEdge：用于清晰边缘检测的扩散概率模型

DEV Community ·

本研究提出了一种统一的信息论方程，概括了表征学习中多种损失函数的多样性。研究发现多种机器学习方法能够最小化KL散度积分，支持聚类、谱方法和对比学习，并开发了新损失函数，使ImageNet-1K的无监督分类性能提升超过8%。

I-Con：统一的表征学习框架

BriefGPT - AI 论文速递 ·

本研究探讨自监督学习中图嵌入的平滑性与下游任务表现之间的平衡，提出了一种新的损失函数以提升图嵌入质量。实验结果显示，该框架在节点分类和链接预测任务中表现优异。

Balancing Graph Embedding Smoothness in Self-Supervised Learning via Information-Theoretic Decomposition

BriefGPT - AI 论文速递 ·

本研究提出了一种新型损失函数，Target-Robust损失，旨在提升语音识别系统在嘈杂环境下的表现，显著提高RNN-T模型的鲁棒性，恢复超过70%的识别质量。

Loss Function for Noisy Target Speech Recognition Based on RNN-Transducer

BriefGPT - AI 论文速递 ·

本文讨论了群体相对策略优化（GRPO）及其与策略优化（PO）的关系，重点在于GRPO的优势计算方法。GRPO通过不同的响应来估计优势，简化了传统的价值模型需求。研究表明，优化策略需关注样本长度和优势计算，以提高推理模型的性能。

GRPO的新变体及其实现秘密

Josherich的博客 ·

本研究针对越南信息检索缺乏基准的问题，提出了新的基准，专注于检索和重排名任务。同时，提出了一种基于InfoNCE损失函数的新目标函数，以提升越南嵌入模型在信息检索中的表现，并分析了温度超参数对模型性能的影响。

Advancing Learning Objectives and Benchmarks for Vietnamese Information Retrieval

BriefGPT - AI 论文速递 ·

本研究提出了一种基于拉东-尼科迪姆导数的新型异常检测损失函数，显著提升了性能，尤其在多个数据集上表现优异，F1分数更高，具有广泛的应用前景。

Radon-Nikodym Derivative: Rethinking Anomaly Detection from the Perspective of Measure Theory

BriefGPT - AI 论文速递 ·

本研究提出了一种逆知识蒸馏（IKD）方法，旨在解决对抗攻击算法在目标与源模型间转移性不足的问题。通过引入新损失函数，IKD显著提高了对抗样本在黑箱攻击中的有效性和成功率，实验结果表明IKD有效增强了对抗样本的转移性。

Improving the Transferability of Adversarial Examples through Inverse Knowledge Distillation

BriefGPT - AI 论文速递 ·

本研究提出了一种新的机器学习方法GLIMMER，旨在提高1型糖尿病管理中的血糖预测精度。通过修改损失函数，该模型使血糖预测的RMSE和MAE分别提升了23%和31%。

Type 1 Diabetes Management Using GLIMMER: Glucose Level Indicator Model with Modified Error Rate

BriefGPT - AI 论文速递 ·