OpenAI Q* 可通过一种自动化且可扩展的方式自我进化

OpenAI宫斗可能要归功于一项名为 Q* （Q-learning）的重大突破。 Q* 是 AGI 的前身。 Q*可能在Q-learning和预设启发式之间架起了一座巨大的桥梁：这可能是革命性的，因为它可以让机器 "预见 "下一步的最佳方案，从而节省大量精力。这意味着机器可以不再追求次优方案，而只追求最优方案。机器过去所有的 "失败 "试验（例如，试图行走却摔倒了）都将转化为 "成功 "试验。

OpenAI宫斗可能要归功于Q*（Q-learning）的重大突破，它架起了Q-learning和预设启发式之间的桥梁，让机器能够预见下一步的最佳方案。Q*使OpenAI的语言模型能够直接处理数学和逻辑问题，不再需要外部计算机软件。微软有信心每年投资500亿美元来扩展到AGI或ASI系统。

OpenAI Q* Q-learning 微软语言模型