小红花·文摘

HRV（心率变异性）是评估身体恢复和疲劳的重要指标。通过监测HRV，运动员和爱好者可以优化训练，避免过度训练。结合生活习惯和训练数据，个性化调整训练强度，以提升身心适应能力。有效的干预措施包括慢速呼吸和规律生活，以长期提高HRV水平。

不只是健康指标：也试试用 HRV 指导自己的健身计划

少数派 ·

nanobot-pre-train

plus studio ·

字节推出Self-Forcing++方法，成功实现最长4分15秒的高质量AI视频生成，解决了传统模型生成短视频的问题。该方法通过优化训练过程，显著提升视频的稳定性和一致性，标志着AI视频生成技术的进步。

Sora2还在5秒打转，字节AI生视频已经4分钟“起飞”

量子位 ·

本研究探讨了如何优化大型语言模型（LLMs）的训练，以适应测试时的计算策略。结果表明，交叉熵损失函数可能导致模型过于自信，从而影响准确性。通过限制置信度，提出了一种改进的训练损失，显著提升了数学推理能力。

重新思考在测试时计算扩展下的微调：限制置信度改善数学推理

BriefGPT - AI 论文速递 ·

本研究提出了一种名为FlexDeMo的混合策略，旨在优化大型神经网络模型的训练，特别是在分布式系统中。该方法通过在不同GPU之间进行本地同步，仅交换快速变化的梯度分量，从而改善节点间的通信。实验结果表明，FlexDeMo在验证损失方面与AdamW相当，证明了其有效性。

FlexDeMo: Decoupled Momentum Optimization for Global and Hybrid Sharded Training

BriefGPT - AI 论文速递 ·

本研究旨在优化蛋白质语言模型的训练，提出通过增加多样性和避免过拟合的方法。研究表明，纳入元基因组蛋白质序列可以发现新的标定规律，适当调整计算资源能够提升模型的精确度，同时控制计算预算。

训练计算优化的蛋白质语言模型

BriefGPT - AI 论文速递 ·

本文介绍了多种图神经网络（GNN）训练优化技术，如GPU Initiated Direct Storage Access (GIDS)、DistGNN和BatchGNN。这些方法显著提高了训练速度和效率，在大规模图数据上实现了高达392倍的加速，解决了存储和通信问题，推动了GNN的可扩展性和性能提升。

DiskGNN：为离核 GNN 训练提供 I/O 效率和模型准确性的桥接

BriefGPT - AI 论文速递 ·

本文探讨了通过选择合适的直通估计器（STE）来优化神经网络的训练，提出了修正的直通估计器（ReSTE），在CIFAR-10和ImageNet数据集上表现优异。研究比较了不同STE算法的效果，强调了量化方法对训练稳定性和准确性的影响。

自定义梯度估计器乃掩饰过后的直通式估计器

BriefGPT - AI 论文速递 ·

本文介绍了多种创新的扩散模型方法，包括Patch Diffusion框架、DistriFusion高效图像生成、DiffFit快速适应新领域和自级联扩散模型。这些方法通过优化训练过程、提高生成速度和图像质量，推动了超高分辨率图像合成的研究进展。

CutDiffusion: 一个简单、快速、廉价且强大的扩散外推方法

BriefGPT - AI 论文速递 ·

华为云的昇思MindSpore大模型专题介绍了ChatGLM模型的训练优化过程，包括GLM模型架构、位置编码、自回归填充、多任务预训练和微调等技术。还介绍了使用MindSpore和ChatGLM进行推理的方法和应用场景。

万字带你了解ChatGLM

华为云官方博客 ·