小红花·文摘

GenCtrl — 生成模型的正式可控性工具包

Apple Machine Learning Research ·

本研究提出了一种结合不平衡感知技术的联合训练基准，以解决少样本增量学习中的类别不平衡问题，缩小基础类与增量类的性能差距，并规范了实验设置与评估流程。

针对少样本增量学习的新基准：重新定义上限

BriefGPT - AI 论文速递 ·

本研究提出ODRL基准，旨在解决动态强化学习方法评估的难题。该基准结合多种实验设置，全面评估算法的适应性，发现现有方法在不同动态环境下未能展现普遍优势，为未来研究提供参考。

ODRL: A Benchmark for Out-of-Distribution Reinforcement Learning

BriefGPT - AI 论文速递 ·

本研究提出了一种“遗忘曲线”方法，以更可靠地评估长文档模型的记忆能力。结果表明，该方法在不同测试语料和实验设置下具有鲁棒性，适用于各种模型规模，并验证了变换器扩展技术的有效性。

Forgetting Curve: A Reliable Method for Evaluating the Memorization Capability of Long-Document Models

BriefGPT - AI 论文速递 ·

本文提出了一种新的基于标签比例学习（LLP）的框架，旨在提升分类器性能。研究涵盖多个领域，介绍了新算法和实验设置，解决了现有方法的问题，并提供了大规模数据集和基准测试结果，以推动LLP技术的发展。

大包内标签比例学习的理论扰动方法

BriefGPT - AI 论文速递 ·

研究人员提出了一种名为OSASIS的新型一次性风格化方法，能够在保持结构的同时对图片进行风格化。实验证明OSASIS在各种实验设置下表现优于其他方法，为风格化提供了有希望的解决方案。

一次性结构感知风格化图像合成

BriefGPT - AI 论文速递 ·

本文介绍了一种数值技术，用于评估报告的性能分数和实验设置的一致性，通过三个医学应用程序的案例，展示了该方法如何有效地检测不一致性，以保护研究领域的完整性。

测试二元分类问题的性能得分的一致性

BriefGPT - AI 论文速递 ·

该文介绍了从先前记录的数据中学习策略的前景方向，以实现真实世界机器人任务。作者提出了一个基准，包括使用强化学习代理在模拟中训练的两个任务的熟练操纵平台的大量离线学习数据的收集，并提供了在真实世界机器人系统和模拟中执行学习策略的选项以进行高效调试。作者还评估了知名的开源离线强化学习算法，并为真实系统上的离线强化学习提供了可重现的实验设置。

通过价值函数预训练的互联网视频机器人离线强化学习

BriefGPT - AI 论文速递 ·

从先前记录的数据中学习策略是实现真实世界机器人任务的有前景方向。提出了一个基准，包括：使用强化学习代理在模拟中训练的两个任务的大量离线学习数据的收集，以及在真实世界机器人系统和模拟中执行学习策略的选项。评估了开源离线强化学习算法，并提供了可重现的实验设置。

2022 年真实机器人挑战赛：在真实环境中从离线数据中学习熟练操纵

BriefGPT - AI 论文速递 ·