OpenAI发布了新模型o1,采用强化学习和“思维链”方法解决复杂问题。在推理密集型任务中表现优于以前的模型,但速度较慢且更昂贵。OpenAI的CEO Sam Altman宣布了公司结构的变化,朝着更传统的盈利模式发展。RunwayML推出了视频到视频工具,允许用户使用AI定制现实世界的视频。Adobe的Firefly Services已经达到了120亿代,并旨在增强其Creative Cloud和Document Cloud平台。其他新闻包括Waymo和Uber扩大合作伙伴关系,AI初创公司Poolside筹集资金,以及Nvidia面临专利挑战。OpenAI的o1模型代表了人工智能的新范式,专注于推理和扩展。
OpenAI的“Strawberry”是迈向AGI的重要一步,它是一个秘密模型,能够解决LLMs的局限性,提高输出质量。它能进行高级推理,正确回答问题,进行数学推理,并在写下答案之前进行双重检查。
OpenAI正在开发一个名为“Strawberry”的新旗舰模型,以及一个名为“Orion”的GPT-4继任者。他们正在招聘一名技术内部风险调查员。“Strawberry”将在秋季发布,并将改进“Orion”。它可以生成合成数据,解决数学和编程问题,并协助开发OpenAI即将推出的Agent。“Strawberry”和“Orion”的详细信息尚未披露。
OpenAI的新模型,可能是GPT-4,已经由用户测试。据推测,它可能是“草莓”项目的一部分,旨在增强AI的推理能力。该项目可能与Q*模型有关。OpenAI尚未证实这些推测。人们对新一代模型的发布充满期待,可能是GPT-5。
大模型在处理一些简单的问题上表现不佳,如无法正确数出单词中的某个字母。这是因为大模型在Tokenization(分词)时将单词分为多个token,导致难以准确计数。此外,大模型缺乏认知自我知识,即对自身知识和能力的认知,导致在某些领域表现出色,而在其他领域犯错。解决方案可能包括扩大规模和采用更复杂的方法。
最近新模型智障检测出现问题,无法正确数出单词“Strawberry”中的“r”。全球网友尝试各种提示词技巧教会大模型数“r”,成功方法包括使用漫画《死亡笔记中》角色“L”的方法和DeepMind的Self-Discover论文中的方法。有人还尝试使用AI想象一个从0开始的内存计数器来计算文档中“strawberry”出现的次数。ChatGPT和谷歌Gemini也有一定概率能答对。国内选手在测试中表现稳定。大模型公司希望在下个版本中解决这个问题。
完成下面两步后,将自动完成登录并继续当前操作。