小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
从非结构化文本中提取结构化信息的 Python 库 | 开源日报 No.855

Gym 是一个用于构建大型语言模型强化学习训练环境的库,支持多种推理后端。adk-js 是开源 TypeScript 工具包,专注于智能 AI 代理的构建与部署。langextract 是用于从非结构化文本中提取结构化信息的 Python 库。RemoveWindowsAI 是清除 Windows 11 内置 AI 功能的脚本工具。Gentleman.Dots 提供多平台开发环境配置方案。

从非结构化文本中提取结构化信息的 Python 库 | 开源日报 No.855

开源服务指南
开源服务指南 · 2026-01-19T07:35:56Z
rsl_rl——人形运控部署框架汇总:从经典RL框架rsl_rl到宇树开源的unitree_rl_gym(含unitree_sdk2_python)

本文讨论了人形机器人控制中的强化学习框架rsl_rl,重点介绍了其核心组件和算法实现,包括PPO(近端策略优化)和Actor-Critic模型。rsl_rl支持多种输入数据,适用于不同的机器人控制任务,并结合了unitree_rl_gym等开源项目,提供了丰富的代码资源和部署方案。

rsl_rl——人形运控部署框架汇总:从经典RL框架rsl_rl到宇树开源的unitree_rl_gym(含unitree_sdk2_python)

结构之法 算法之道
结构之法 算法之道 · 2025-11-01T16:18:25Z
使用SWE-Gym训练软件工程代理和验证器

SWE-Gym是首个用于训练软件工程代理的环境,包含2438个真实的Python任务实例。通过SWE-Gym训练的语言模型代理在SWE-Bench测试集上取得了显著提升,验证了其有效性。该平台及相关模型和代理轨迹已公开发布,以促进进一步研究。

使用SWE-Gym训练软件工程代理和验证器

Apple Machine Learning Research
Apple Machine Learning Research · 2025-10-16T00:00:00Z

本文探讨了大型语言模型(LLMs)在编码任务中信息获取不足的问题,提出了“debug-gym”交互式文本环境,帮助模型主动探索代码库以收集信息。实验表明,该方法提升了调试能力,并可扩展至其他信息检索任务。

debug-gym: A Text-Based Environment for Interactive Debugging

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-27T00:00:00Z

该研究针对矿业调度中的动态和随机性问题,提出了Mining Gym,一个可配置的开放源代码基准环境,旨在训练、测试和比较强化学习算法。研究的关键贡献在于提供了一个现实模拟环境,能够处理设备故障和运输周期变化等不确定性,从而提高矿业过程优化的效率,并促进算法之间的公平比较和实用性。

Mining-Gym:用于卡车调度的可配置强化学习基准环境

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-24T00:00:00Z

本研究提出RAG-Gym框架,以克服传统RAG架构在复杂问题中的局限性。通过过程监督和ReSearch架构,显著提升信息获取能力,实验结果显示性能提升达25.6%。

RAG-Gym:通过过程监督优化推理和搜索代理

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-19T00:00:00Z

本文介绍了NS-Gym,一个针对非平稳马尔可夫决策过程的仿真工具包,旨在应对传统决策模型在动态环境中的挑战。NS-Gym提供标准化接口和基准问题,帮助研究者评估算法的适应性与鲁棒性。

NS-Gym: An Open Source Simulation Environment and Benchmark for Non-Stationary Markov Decision Processes

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-16T00:00:00Z
MLOps最佳实践 - MLOps Gym:爬行

MLOps是一个持续的过程,涵盖实践和组织行为,而非单一工具。MLOps Gym系列分为“爬行”、“行走”和“奔跑”三个阶段,提供最佳实践。关键工具包括MLflow和Unity Catalog,以确保数据治理和模型管理。特征库简化特征工程,版本控制促进团队协作。监控AI系统质量至关重要,需持续跟踪数据和模型性能。

MLOps最佳实践 - MLOps Gym:爬行

Databricks
Databricks · 2025-01-06T09:53:36Z

本文提出了SWE-Gym,首个用于训练实际软件工程(SWE)代理的环境,旨在填补现有培训系统的不足。通过在包含2438个真实Python任务实例的环境中训练基于语言模型的SWE代理,我们实现了在SWE-Bench Verified和Lite测试集上分别达到32.0%和26.0%的新基准,为SWE代理的研究提供了重要资源。

用SWE-Gym训练软件工程代理和验证器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-30T00:00:00Z

本文介绍了一种基于强化学习的人到仿真向人型机器人的框架,通过使用一个RGB摄像机实现了全尺寸人型机器人的实时全身遥操作。

Humanoid-Gym: 人形机器人的零样本 Sim2Real 迁移增强学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-08T00:00:00Z

本研究通过构建TextGym模拟器,比较了PPO代理和语言代理。通过实验和研究,初步评估了语言代理在序列决策问题中替代PPO代理的潜力。为语言代理的性能提供了新的认识,并为未来研究铺平了道路。

语言智能能取代 PPO 吗?对 OpenAI Gym 的初步实证研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-06T00:00:00Z
Gym Retro

我们发布了Gym Retro的完整版本,这是一个用于游戏强化学习研究的平台,现支持超过1000款游戏,涵盖多种模拟器,并提供添加新游戏的工具。

Gym Retro

OpenAI
OpenAI · 2018-05-25T07:00:00Z
OpenAI Gym Beta

We’re releasing the public beta of OpenAI Gym, a toolkit for developing and comparing reinforcement learning (RL) algorithms. It consists of a growing suite of environments (from simulated robots...

OpenAI Gym Beta

OpenAI
OpenAI · 2016-04-27T07:00:00Z

题目链接 题意观察样例与提示即可。 挺水的 DP 题,DP 刷的比较少。。

CF GYM 10499J Healthy Recipes(DP)

INTJer
INTJer · 2015-12-03T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码