小红花·文摘

基于自适应揭示推理依据的强化学习

Apple Machine Learning Research ·

本研究提出了自适应难度课程学习和专家指导自我改写两种策略，以提升大型语言模型在复杂问题上的推理能力。实验结果显示，这些策略显著改善了模型在数学推理基准上的表现。

Learning Like Humans: Enhancing Reasoning Capabilities of Large Language Models through Adaptive Difficulty Curriculum Learning and Expert-Guided Self-Reformulation

BriefGPT - AI 论文速递 ·

本文提出了一种隐写课程学习训练策略（STCL），旨在改善基于深度学习的隐写模型在图像质量和网络收敛速度方面的不足。STCL通过从简单图像逐步训练到复杂图像，显著提升了模型性能，实验结果表明其在多个算法框架下提高了PSNR和SSIM分数，并降低了隐写分析分数。

STCL: A Curriculum Learning Strategy for Deep Learning-Based Image Steganography Models

BriefGPT - AI 论文速递 ·

面对杂乱场景，灵巧手也能从容应对！NUS邵林团队发布DexSinGrasp基于强化学习实现物体分离与抓取统一策略

机器之心 ·

拓扑排序是一种处理节点依赖关系的算法，用于确定元素的线性顺序。通过构建有向图并记录每个节点的入度，可以判断课程学习的可行性，若无循环依赖，则方案可行。

算法模式：拓扑排序

"地瓜哥"博客网 ·

本研究提出了一种基于课程学习的变换器强化学习算法CTSAC，旨在提升机器人探索中的环境推理能力和收敛速度。实验结果表明，CTSAC在成功率和探索效率方面优于现有算法。

Course-Based Transformer Soft Actor-Critic Algorithm (CTSAC) for Goal-Directed Robotic Exploration

BriefGPT - AI 论文速递 ·

本研究提出了一种新的AdaSin损失函数，通过引入样本嵌入特征与真实类别中心之间的角度正弦，改进了人脸识别中的困难样本度量。结合双重自适应惩罚与课程学习，模型在训练后期更有效地关注困难样本，从而提取出更具判别力的人脸特征。实验证明，该方法的准确性优于现有技术。

AdaSin: Enhancing Hard Sample Metrics in Face Recognition through Dual Adaptive Penalty

BriefGPT - AI 论文速递 ·

智能AI训练方法在保持性能的同时将语言模型训练时间缩短25%

DEV Community ·

本研究提出了一种基于课程学习的跨模态文本-分子训练框架（CLASS），旨在提高训练效率和性能。CLASS在ChEBI-20数据集上表现优异，显著节省了训练时间。

CLASS: Enhancing Cross-Modal Text-Molecule Retrieval Performance and Training Efficiency

BriefGPT - AI 论文速递 ·

该研究提出了一种课程学习方法，解决了传统强化学习在四旋翼稳定控制中的样本效率低和任务复杂性高的问题。通过逐步增加任务复杂性和引入新奖励函数，结果表明该方法在性能和鲁棒性上优于单阶段策略，同时降低了计算资源需求和收敛时间。

基于课程的样本有效强化学习用于四旋翼的稳健稳定化

BriefGPT - AI 论文速递 ·

本研究提出了一种结合深度强化学习与课程学习的方法，以解决传统计算机视觉代理在不熟悉环境中的偏差问题，从而提升自动驾驶的适应性和安全性。通过在CARLA仿真器中训练，显著提高了代理在复杂环境中的可靠性。

CuRLA: Application of Curriculum Learning-Based Deep Reinforcement Learning in Autonomous Driving

BriefGPT - AI 论文速递 ·

本研究解决了大型语言模型在遵循多重软约束方面的不足，设计了高质量输出的自动化获取管道，并引入课程学习训练范式，显著提升了模型能力，具有重要应用潜力。

Gradual Mastery: Enhancing Large Language Models' Adherence to Soft Constraints

BriefGPT - AI 论文速递 ·

本研究针对开源大型语言模型在数学推理方面的不足，提出了课程学习和分解策略。实验结果显示，WizardMath 7B在英语数据集上超越Gemini，在印地语上表现相当，表明双语方法有效提升数学推理能力。

多语言数学推理：推动开源LLM在印地语和英语中的发展

BriefGPT - AI 论文速递 ·

本研究提出了一种课程学习方法，旨在提升嘈杂数据下跨语言文本生成的效果。实验结果显示，该方法在多个印度语言及英语数据集上，BLEU分数最高提升4分，生成的准确性和覆盖率平均提高5-15%。

Curriculum Learning for Cross-Language Data-to-Text Generation with Noisy Data

BriefGPT - AI 论文速递 ·

本研究提出了一种基于课程学习的单目视觉里程计模型，旨在解决几何问题并提升性能。实验结果表明，该模型在复杂环境中的表现优于现有方法，验证了课程学习在视觉里程计中的有效性。

Robust Monocular Visual Odometry Based on Curriculum Learning

BriefGPT - AI 论文速递 ·

本研究通过引入Syllabus库，解决了强化学习库中缺乏课程学习支持的问题，提供了通用算法API及多种课程学习方法的实现，简化了算法设计，并在NetHack和Neural MMO中取得了显著成果。

Syllabus: Portable Curricula for Reinforcement Learning Agents

BriefGPT - AI 论文速递 ·

本研究探讨了小规模语言模型在课程学习中的效率，提出了更细致的学习策略，并构建了四个儿童导向的语料库。结果表明，灵活的学习策略显著提升了模型的性能。

少即是多：使用认知合理的课程学习策略预训练跨语言小规模语言模型

BriefGPT - AI 论文速递 ·

研究提出了一种课程学习方法，优化视觉-语言任务，提高小规模多模态训练效果。结合文本预训练，课程学习在文本任务中表现出显著优势，特别是对小参数模型有明显帮助。这为在数据有限的环境中有效利用机器学习提供了新见解。

探索课程学习在视觉-语言任务中的应用：关于小规模多模态训练的研究

BriefGPT - AI 论文速递 ·

本研究提出了Perseus方法，通过课程学习优化图神经网络的学习顺序，增强模型的鲁棒性和抵御对抗攻击的能力。

Perseus：利用常见数据模式与课程学习增强图神经网络的鲁棒性

BriefGPT - AI 论文速递 ·

研究发现，去噪任务在早期步骤收敛慢且相对熵高。为此，提出了一种结合课程学习的易难混合训练方案，通过按难度递减训练时间步骤或噪声水平，提升性能和收敛速度，并在多种图像生成任务中验证了效果。

生成的表征对齐：训练扩散变换器比你想的更简单

BriefGPT - AI 论文速递 ·