小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
基于自适应揭示推理依据的强化学习

本文提出了一种基于部分专家示范的强化学习框架,旨在解决复杂的序列生成任务。通过自适应回溯算法,动态调整每个样本的监督长度,模型能够逐步学习推理链。研究表明,这种逐样本课程学习在处理长序列依赖时优于传统的监督微调和强化学习,有效提升推理能力。

基于自适应揭示推理依据的强化学习

Apple Machine Learning Research
Apple Machine Learning Research · 2025-10-29T00:00:00Z

本研究提出了自适应难度课程学习和专家指导自我改写两种策略,以提升大型语言模型在复杂问题上的推理能力。实验结果显示,这些策略显著改善了模型在数学推理基准上的表现。

Learning Like Humans: Enhancing Reasoning Capabilities of Large Language Models through Adaptive Difficulty Curriculum Learning and Expert-Guided Self-Reformulation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-13T00:00:00Z

本文提出了一种隐写课程学习训练策略(STCL),旨在改善基于深度学习的隐写模型在图像质量和网络收敛速度方面的不足。STCL通过从简单图像逐步训练到复杂图像,显著提升了模型性能,实验结果表明其在多个算法框架下提高了PSNR和SSIM分数,并降低了隐写分析分数。

STCL: A Curriculum Learning Strategy for Deep Learning-Based Image Steganography Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-24T00:00:00Z
面对杂乱场景,灵巧手也能从容应对!NUS邵林团队发布DexSinGrasp基于强化学习实现物体分离与抓取统一策略

新加坡国立大学研究团队提出了DexSinGrasp,一种基于强化学习的统一策略,旨在提升机器人在杂乱环境中的抓取效率。该方法结合物体分离与抓取任务,通过课程学习和策略蒸馏,显著提高了抓取成功率和操作效率。实验结果显示,DexSinGrasp在多种场景中优于传统方法,未来将扩展至动态复杂环境。

面对杂乱场景,灵巧手也能从容应对!NUS邵林团队发布DexSinGrasp基于强化学习实现物体分离与抓取统一策略

机器之心
机器之心 · 2025-04-12T07:47:26Z

拓扑排序是一种处理节点依赖关系的算法,用于确定元素的线性顺序。通过构建有向图并记录每个节点的入度,可以判断课程学习的可行性,若无循环依赖,则方案可行。

算法模式:拓扑排序

"地瓜哥"博客网
"地瓜哥"博客网 · 2025-04-04T01:09:09Z

本研究提出了一种基于课程学习的变换器强化学习算法CTSAC,旨在提升机器人探索中的环境推理能力和收敛速度。实验结果表明,CTSAC在成功率和探索效率方面优于现有算法。

Course-Based Transformer Soft Actor-Critic Algorithm (CTSAC) for Goal-Directed Robotic Exploration

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-18T00:00:00Z

本研究提出了一种新的AdaSin损失函数,通过引入样本嵌入特征与真实类别中心之间的角度正弦,改进了人脸识别中的困难样本度量。结合双重自适应惩罚与课程学习,模型在训练后期更有效地关注困难样本,从而提取出更具判别力的人脸特征。实验证明,该方法的准确性优于现有技术。

AdaSin: Enhancing Hard Sample Metrics in Face Recognition through Dual Adaptive Penalty

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-05T00:00:00Z
智能AI训练方法在保持性能的同时将语言模型训练时间缩短25%

本文介绍了一种新颖的课程学习方法,通过逐步增加词汇量来训练大型语言模型,降低计算成本,同时保持模型质量。训练时间缩短25%,性能相似,适用于小型和大型语言模型。

智能AI训练方法在保持性能的同时将语言模型训练时间缩短25%

DEV Community
DEV Community · 2025-02-28T09:59:11Z

本研究提出了一种基于课程学习的跨模态文本-分子训练框架(CLASS),旨在提高训练效率和性能。CLASS在ChEBI-20数据集上表现优异,显著节省了训练时间。

CLASS: Enhancing Cross-Modal Text-Molecule Retrieval Performance and Training Efficiency

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-17T00:00:00Z

该研究提出了一种课程学习方法,解决了传统强化学习在四旋翼稳定控制中的样本效率低和任务复杂性高的问题。通过逐步增加任务复杂性和引入新奖励函数,结果表明该方法在性能和鲁棒性上优于单阶段策略,同时降低了计算资源需求和收敛时间。

基于课程的样本有效强化学习用于四旋翼的稳健稳定化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-30T00:00:00Z

本研究提出了一种结合深度强化学习与课程学习的方法,以解决传统计算机视觉代理在不熟悉环境中的偏差问题,从而提升自动驾驶的适应性和安全性。通过在CARLA仿真器中训练,显著提高了代理在复杂环境中的可靠性。

CuRLA: Application of Curriculum Learning-Based Deep Reinforcement Learning in Autonomous Driving

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-09T00:00:00Z

本研究解决了大型语言模型在遵循多重软约束方面的不足,设计了高质量输出的自动化获取管道,并引入课程学习训练范式,显著提升了模型能力,具有重要应用潜力。

Gradual Mastery: Enhancing Large Language Models' Adherence to Soft Constraints

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-09T00:00:00Z

本研究针对开源大型语言模型在数学推理方面的不足,提出了课程学习和分解策略。实验结果显示,WizardMath 7B在英语数据集上超越Gemini,在印地语上表现相当,表明双语方法有效提升数学推理能力。

多语言数学推理:推动开源LLM在印地语和英语中的发展

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-24T00:00:00Z

本研究提出了一种课程学习方法,旨在提升嘈杂数据下跨语言文本生成的效果。实验结果显示,该方法在多个印度语言及英语数据集上,BLEU分数最高提升4分,生成的准确性和覆盖率平均提高5-15%。

Curriculum Learning for Cross-Language Data-to-Text Generation with Noisy Data

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-18T00:00:00Z

本研究提出了一种基于课程学习的单目视觉里程计模型,旨在解决几何问题并提升性能。实验结果表明,该模型在复杂环境中的表现优于现有方法,验证了课程学习在视觉里程计中的有效性。

Robust Monocular Visual Odometry Based on Curriculum Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-20T00:00:00Z

本研究通过引入Syllabus库,解决了强化学习库中缺乏课程学习支持的问题,提供了通用算法API及多种课程学习方法的实现,简化了算法设计,并在NetHack和Neural MMO中取得了显著成果。

Syllabus: Portable Curricula for Reinforcement Learning Agents

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-18T00:00:00Z

本研究探讨了小规模语言模型在课程学习中的效率,提出了更细致的学习策略,并构建了四个儿童导向的语料库。结果表明,灵活的学习策略显著提升了模型的性能。

少即是多:使用认知合理的课程学习策略预训练跨语言小规模语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-30T00:00:00Z

研究提出了一种课程学习方法,优化视觉-语言任务,提高小规模多模态训练效果。结合文本预训练,课程学习在文本任务中表现出显著优势,特别是对小参数模型有明显帮助。这为在数据有限的环境中有效利用机器学习提供了新见解。

探索课程学习在视觉-语言任务中的应用:关于小规模多模态训练的研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-20T00:00:00Z

本研究提出了Perseus方法,通过课程学习优化图神经网络的学习顺序,增强模型的鲁棒性和抵御对抗攻击的能力。

Perseus:利用常见数据模式与课程学习增强图神经网络的鲁棒性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-16T00:00:00Z

研究发现,去噪任务在早期步骤收敛慢且相对熵高。为此,提出了一种结合课程学习的易难混合训练方案,通过按难度递减训练时间步骤或噪声水平,提升性能和收敛速度,并在多种图像生成任务中验证了效果。

生成的表征对齐:训练扩散变换器比你想的更简单

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-09T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码