OpenAI Q* 可通过一种自动化且可扩展的方式自我进化
原文中文,约1200字,阅读约需3分钟。发表于: 。OpenAI宫斗可能要归功于一项名为 Q* (Q-learning)的重大突破。 Q* 是 AGI 的前身。 Q*可能在Q-learning和预设启发式之间架起了一座巨大的桥梁: 这可能是革命性的,因为它可以让机器 "预见 "下一步的最佳方案,从而节省大量精力。 这意味着机器可以不再追求次优方案,而只追求最优方案。 机器过去所有的 "失败 "试验(例如,试图行走却摔倒了)都将转化为 "成功 "试验。
OpenAI宫斗可能要归功于Q*(Q-learning)的重大突破,它架起了Q-learning和预设启发式之间的桥梁,让机器能够预见下一步的最佳方案。Q*使OpenAI的语言模型能够直接处理数学和逻辑问题,不再需要外部计算机软件。微软有信心每年投资500亿美元来扩展到AGI或ASI系统。