OpenAI突破:Q*超级智能
原文中文,约2500字,阅读约需6分钟。发表于: 。OpenAI的突破涉及一种称为Q*(Q-star 可能是Q-learning)的东西,消息表明它与奥特曼被解雇有关的。 Q-learning是一类强化学习,并不是新的,但是最近在将Q-learning与transformers和LLM相结合方面取得了进展。 特斯拉将深度Q学习用于自动驾驶。 甚至有人猜测,谷歌期待已久的 Gemini 模型也采用了 Q-learning 的一个版本。 Q*...
OpenAI的突破涉及Q*(Q-star)和奥特曼被解雇有关。Q-learning是一种强化学习方法,最近与transformers和LLM结合取得进展。特斯拉和谷歌的Gemini模型也可能采用了Q-learning。Q*是最优行动函数,寻找Q*涉及训练代理以最大化累积奖励。Q-learning在单智能体游戏中受欢迎,因为它将其他智能体建模为环境中的简单特征。Q-learning和A*搜索结合可用于优化文本生成和多轮对话。这一突破意味着AGI的诞生。