小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了TelePlanNet框架,以提高5G网络基站选址的效率。该框架结合三层架构与增强学习,实现了多目标优化,规划一致性提升至78%,显著优于传统方法。

TelePlanNet:一个基于人工智能的高效电信网络规划框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-20T00:00:00Z

本研究提出了一种多游戏目标回报优化器(MTRO)算法,能够利用离线数据集自动确定游戏目标回报,从而简化配置过程。实验结果表明,MTRO显著提升了增强学习策略在多种游戏中的表现,促进了自主代理的发展。

Multi-Game Decision Transformer Target Reward Optimizer

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-04T00:00:00Z

该研究提出了一种新方法,结合稳定扩散的想象网络和增强学习,有效利用视觉信息,显著提升多模态翻译效果。

Making Imagination Clearer! Visual Imagination in Multimodal Machine Translation Based on Stable Diffusion

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-17T00:00:00Z

本研究提出了一种名为ELEMENT的多尺度增强学习框架,旨在解决长期探索中的回报消失和高计算成本问题。通过引入情节最大熵优化和新内在奖励,显著提升了探索效率,展现出良好的适应性和性能。

ELEMENT: Exploring Episodes and Lifelong Learning through Maximum Entropy

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-05T00:00:00Z

本文介绍了CodeUltraFeedback,一个包含10,000个复杂指令的数据集,用于评估大型语言模型与用户编码偏好的对齐。通过AI反馈和增强学习,CodeLlama-7B-Instruct在CODAL-Bench上超越了34B模型,验证了其实用性并提升了功能正确性,为模型对齐和代码智能的发展奠定了基础。

自我代码对齐:代码生成的自我对齐方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-31T00:00:00Z

本研究提出了一种新方法RL-V2V-GAN,旨在解决视频到视频合成中的有限标记数据问题。该方法通过增强学习实现源视频到目标视频的映射,同时保持源视频的风格。实验结果表明,在少样本学习条件下,该方法能够生成时序一致的视频。

基于策略梯度的少样本学习视频到视频生成对抗网络

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-28T00:00:00Z

本文提出了一种基于增强学习的交通信号控制方法CityLight,采用MAPPO框架实现多个智能体的协同控制,显著提升交通效率。实验结果显示,整体性能提高11.66%,迁移场景吞吐量提升22.59%。

将神经蒙特卡洛树搜索应用于无人信号灯多交叉口调度的研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-24T00:00:00Z

大型语言模型在少样本学习中表现出色,通过上下文示例学习,无需更新权重。扩展的上下文窗口支持多样本学习,提升生成和判别任务性能。为解决人类示例不足,研究了增强和无监督多样本学习。增强方法用模型生成示例,无监督方法仅用领域问题提示。这些方法在复杂推理任务中有效,能覆盖预训练偏差。分析指出下一个标记预测损失的局限性。

重新审视大型语言模型中的上下文学习推理电路

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-06T00:00:00Z

深度生成人工智能通过最大似然估计训练生成模型,但难以完全满足用户需求。增强学习作为替代方案,通过注入新信号训练模型,更灵活且能遵循人类偏好,拓展了生成人工智能的边界。本文综述了该领域的应用,特别关注大规模语言模型的发展和未来方向。

通过生成世界模型解决多智能体决策问题的基础答案

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-03T00:00:00Z

深度生成AI在文本生成和计算机视觉中备受关注。最大似然估计用于训练生成模型,但不完全满足用户需求。增强学习通过引入新信号和遵循人类偏好,拓展了生成AI的边界。本文综述了增强学习在模型设计和应用中的作用,特别是在大规模语言模型的发展中,并探讨了生成AI的潜在方向。

FactorSim:通过因子化表示进行生成模拟

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-26T00:00:00Z

本文研究了增强学习中的稀疏表示,通过比较标准神经网络和具有稀疏性质的神经网络,在控制策略学习中证明了稀疏表示的有效性。同时,提出了一种名为“分布式正则化器”的方法来鼓励隐藏节点的激活匹配分布,从而产生稀疏的激活状态。

利用L0正则化稀疏化参数模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-05T00:00:00Z

深度生成人工智能是机器学习社区中的重要话题之一。增强学习通过创建新目标注入新的训练信号,能够从多个角度遵循人类的归纳偏好。本综述提供了一个高级别的综述,涵盖了广泛的应用领域和大规模语言模型领域。

机器人中的深度生成模型:基于多模态示范学习的综述

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-08T00:00:00Z

本研究提出了一种新的增强学习方法,称为近端策略优化(PPO),通过与环境交互采样数据并使用随机梯度上升优化“替代”目标函数。实验结果表明,PPO在模拟机器人运动和Atari视频游戏等任务上表现优于其他在线策略梯度方法,同时在样本复杂度、实现简单性和时间效率方面取得了平衡。

使用课程学习和奖励工程的近端策略优化解决实际优化问题

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-03T00:00:00Z

基于弱监督的增强学习系统用于局部化,通过引入新的奖励定义,训练控制器函数定位图像中感兴趣的区域,并利用预训练的二元分类器生成的非二进制分类概率。在临床前列腺多参数磁共振图像的大型数据集上评估,方法优于多实例学习和完全监督基线,仅使用图像级别的分类标签进行训练,与完全监督学习表现相当。

基于双参数磁共振成像的强化学习前列腺癌弱监督本地化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-21T00:00:00Z

SecRepair是一个多用途的代码漏洞分析系统,利用CodeGen2语言模型帮助开发人员识别和生成修复后的代码,并提供漏洞描述和代码评论。研究结果表明,结合增强学习和语义奖励机制可以提高模型在处理代码漏洞方面的能力和效果。

CovRL: 采用覆盖率引导的强化学习为基础的模糊测试 JavaScript 引擎

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-19T00:00:00Z

深度生成人工智能是机器学习社区中的重要话题之一。增强学习通过创建新目标注入新的训练信号,能够灵活地遵循人类归纳偏好。本综述提供了一个高级别的综述,涵盖了广泛的应用领域和大规模语言模型领域。

深度强化学习邀请

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-13T00:00:00Z

该文介绍了一种新颖的生存分析流程,使用改进的生存堆叠模型将生存分析问题转化为分类问题,并使用 ControlBurn 进行特征选择,最终使用可解释的增强学习机器生成可解释的预测结果。该流程在预测心力衰竭的风险方面实现了最先进的性能,并提供了关于心力衰竭风险因素的有趣且新颖的见解。

可解释的心力衰竭风险预测的生存分析

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-24T00:00:00Z

本文介绍了应用RL/DRL实现网络运营中的自主智能体,并提出了名为CyGIL的训练环境,旨在从仿真到现实实现自主智能体应用。

SDGym: 使用系统动力学模型的低代码强化学习环境

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-19T00:00:00Z

本文介绍了一种基于物体为中心示范实现的软机械手训练方法,使用增强学习技术和新算法,在 RBO Hand 2 上应用后,取得了开/关阀门、滑珠和抓取等任务的良好表现。

H-InDex: 手动信息增强在熟练操纵中的视觉强化学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-02T00:00:00Z

VIM是一种增强学习框架,可应用于机器人应用中,使机器人能够学习各种灵活的低级技能,实现任务的平滑过渡和性能对齐。该框架是第一个允许机器人使用单一控制器同时学习多种灵活运动任务的工作。

广义动物模拟器:具备多功能运动先验的灵活运动

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-02T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码