BriefGPT - AI 论文速递 ·

PoliFormer: 用 Transformer 扩展 On-Policy 强化学习，实现高超的导航员

📝

内容提要

我们提出了 PoliFormer（Policy Transformer），这是一个使用强化学习进行训练的 RGB 室内导航代理，采用规模化的端到端训练，能够在真实世界中无需适应即可进行泛化，尽管它是纯在模拟环境中训练的。PoliFormer 使用基本的视觉 Transformer 编码器和因果 Transformer...

🏷️

继续阅读

明镜荡｜上海出发一小时的宝藏湖荡露营地
初夏，作者与妻子在澄湖露营，享受湖边的宁静与美景。途中购买新鲜蔬菜，简单烹饪午餐。自驾沿湖探索明镜荡和祝甸砖窑文化馆，最后游览锦溪古镇，感受水乡的古老魅力。
竞争愈发激烈？Codex宣布下次手动重置时用户可以自选重置时间避免额度浪费
Codex 宣布用户可以手动选择重置时间，以避免额度浪费，并提供一次性重置机会，30 天内有效。用户可根据使用情况规划重置，提升使用效率。部分用户在升级后...
A社重置Claude Code当周使用限额同时在7月13日前周限额增加50% 5小时限额不变
因美国政府的出口管制，A社暂时撤回Claude Fable/Mythos 5模型的访问权限，影响了开发者体验。作为补偿，A社将所有付费用户的当周限额重置至...
马斯克远程敲钟穿了老黄的皮衣！SpaceX员工集体穿上绿鞋
马斯克成为首位身家突破1万亿美元的富豪，SpaceX成功上市引发科技圈祝贺。马斯克强调让人类成为多星球物种的目标，回顾了SpaceX的艰辛历程。总裁格温·...
2026 年，AI 长出了四个轮子，驶向物理世界
近年来，人工智能正在向物理世界迁移。赛豆科技推出的AIVA品牌强调AI在汽车设计中的重要性，改变了传统的汽车制造模式。AIVA通过深度学习用户需求，提升驾...
博客首页改版
作者利用AI优化个人博客主题，尝试灵动岛导航样式，调整界面透明度和布局。经过多次修改，最终效果更加协调，提升了视觉体验。AI工具如chatGPT在设计中提供了有效帮助。

内容提要

标签

继续阅读