小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

“最强具身VLA大模型”π*0.6通过Recap学习方法,使机器人从错误中学习,任务成功率超过90%。该模型结合人类示范与自主经验,优化复杂任务表现,展现出高效自我纠正能力,为机器人研究提供新思路。

“最强具身VLA大模型”,究竟强在哪儿?

量子位
量子位 · 2025-11-21T07:50:35Z
当你询问Unicode是否有海马表情时 ChatGPT等多个AI会精神错乱并给出错误的回答

多个AI聊天机器人在询问Unicode是否有海马表情时出现错误,部分模型如ChatGPT误认为存在海马表情并陷入循环。尽管Unicode未添加海马表情,Qwen模型能自我纠正,而谷歌的Gemini AI则准确回答没有海马表情。

当你询问Unicode是否有海马表情时 ChatGPT等多个AI会精神错乱并给出错误的回答

蓝点网
蓝点网 · 2025-09-14T04:16:14Z

本研究提出了一种新颖的数据标注方法,解决了现有过程奖励模型在长链推理中仅关注初始错误的问题。通过引入错误传播和终止概念,显著提升了模型在自我纠正和推理方面的性能,实验结果优于现有模型。

Beyond the First Error: Process Reward Models for Reflective Mathematical Reasoning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-20T00:00:00Z

本研究提出CEC-Zero框架,通过强化学习使大型语言模型在中文文本处理上自我纠正,无需外部监督。实验结果表明,该框架在精确度和泛化能力上优于传统模型,为中文自然语言处理提供了有效解决方案。

基于大语言模型的中国错误纠正解决方案 CEC-Zero

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-14T00:00:00Z

本研究提出了“凤凰”框架,旨在提升机器人在失败后的自我纠正能力。该框架结合高级语义反省与低级动作纠正,采用双进程调整机制,实现精准的细粒度动作纠正。实验结果表明,该框架在多种操作任务中展现出优越的泛化能力和鲁棒性。

Phoenix: A Motion-based Self-Reflection Framework for Fine-grained Robotic Action Correction

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-20T00:00:00Z

本研究评估了两种生成性人工智能系统(GPT-4o 和 Claude 3.5)在建筑3D合成中的表现。尽管两者能够生成模型,但在准确组装部件方面存在困难,Claude 3.5在自我纠正输出上表现更佳。这为AI在建筑设计中的应用提供了新见解。

使用生成性人工智能进行建筑合成评估

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-04T00:00:00Z
自我纠正的检索增强生成:提升AI语言模型的鲁棒性

CRAG是一种自我纠正框架,提升了检索增强生成(RAG)的准确性。它通过实时评估检索内容,动态触发纠正措施,确保即使初始检索失败,响应依然准确。CRAG的创新包括轻量级检索评估器、基于信心的动态响应和分解重组算法,增强了AI的可靠性。

自我纠正的检索增强生成:提升AI语言模型的鲁棒性

DEV Community
DEV Community · 2025-02-15T14:05:30Z
刚刚,OpenAI正式放出智能体Operator!能推理、联网自主执行任务

OpenAI推出了名为Operator的智能体,用户可通过自然语言描述任务,自动执行多步骤操作。该智能体具备自我纠正能力,并可访问互联网。目前仅供美国Pro用户使用,未来将扩展至更多用户并集成到ChatGPT中。

刚刚,OpenAI正式放出智能体Operator!能推理、联网自主执行任务

机器之心
机器之心 · 2025-01-24T02:31:41Z

本研究提出了一种自我纠正对抗训练框架LIMIT,旨在改善中文非自然文本的纠正效果。该方法有效模拟真实应用中的错误,减少传统训练中的偏差,并在多种错误纠正方面超越现有技术。

Learning from Mistakes: Self-Correcting Adversarial Training for Chinese Unnatural Text Correction

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-23T00:00:00Z

本研究提出一种新方法,通过论证理论中的关键问题来提升大型语言模型的逻辑和数学推理能力。模型通过自我纠正,在多项推理和数学任务上表现显著提升。

Key Questions in Reasoning: Guiding Large Language Models' Inference through Argument Queries

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-19T00:00:00Z

o1满血版推出了每月200美元的Pro模式,但许多人认为1500元的价格不划算。Pro模式在解决复杂问题时表现优异,但大多数用户使用免费或20美元版本即可满足需求。o1在数独和生物医学问题上展现了自我纠正能力,尽管仍有错误。总体而言,Pro模式适合需要频繁使用的少数用户。

o1满血版最鲜测!这¥1500花得值吗?

量子位
量子位 · 2024-12-06T05:30:45Z

本研究探讨了在智能辅导系统中利用大型语言模型自动生成数学问题提示的有效性。研究表明,特定的错误提示能够帮助学生自我纠正,且Llama-3-8B-Instruct的表现优于GPT-4o,强调了模型设置对学习效果的重要性。

Automatic Generation of Question Hints for Mathematics Problems using Large Language Models in Educational Technology

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-05T00:00:00Z
谷歌发布大型语言模型自我纠正算法SCoRe

谷歌DeepMind研究人员提出了一种通过强化学习进行自我纠正(SCoRe)的方法,提升大型语言模型在数学和编程问题上的自我纠正能力。SCoRe使用模型生成的数据进行自我纠正,通过两阶段强化学习微调。与基线模型相比,SCoRe在MATH和HumanEval测试中分别提高了15.6和9.1个百分点。

谷歌发布大型语言模型自我纠正算法SCoRe

InfoQ
InfoQ · 2024-10-15T13:00:00Z

该研究针对视觉语言模型中现有奖励模型的不足,特别是仅提供二元反馈的问题。提出的令牌级探测奖励模型(TLDR)通过细粒度文本标注提升模型性能,改善自我纠正生成和幻觉评估,并显著提高人类标注效率。

TLDR: Token-Level Detection Reward Model for Large-Scale Vision-Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-07T00:00:00Z
大型语言模型的推理能力

研究显示,大型语言模型的推理能力不如人类,尤其在自我纠正方面存在不足,引发对其推理能力的讨论。

大型语言模型的推理能力

DEV Community
DEV Community · 2024-09-25T20:35:14Z

开源大模型Reflection 70B通过新训练技术实现自我纠正,击败其他模型,在数学基准测试中得分99.2%。Reflection 70B能回答错误问题,官方将发布更大的Reflection 405B。Reflection 70B使用Reflection-Tuning训练方法,能够在推理过程中纠正错误。模型由HyperWriteAI的CEO Mutt Shumer带领的小团队开发。

开源大模型新王干翻GPT-4o,新技术可纠正自己幻觉,数学99.2分刷爆测试集

量子位
量子位 · 2024-09-06T05:41:07Z
赋予家庭机器人一些常识

麻省理工学院的工程师们利用大型语言模型,使机器人在执行家庭任务时能够自我纠正错误。通过将机器人运动数据与语言模型的常识知识相结合,机器人能够将复杂任务分解为子任务,并在遇到干扰时进行调整,从而提高任务成功率,减少对人工编程的依赖。

赋予家庭机器人一些常识

MIT News - Computer Science and Artificial Intelligence Laboratory (CSAIL)
MIT News - Computer Science and Artificial Intelligence Laboratory (CSAIL) · 2024-03-25T04:00:00Z

在弱信任和高多样性的群体中,投票是一种复杂的决策方式。成年人难以改变观点,投票常常反映出意见一致时的愉快氛围,而意见分歧时可能引发反对。尽管投票不一定能产生“正确”结果,但其自我纠正机制优于个人决策。投票的目的在于控制感和责任归属,尽管在小区环境中,业委会并无真正的决策权。合理期待投票的功能,有助于找到更好的群体决策方式。

投票的功能和非功能研究

王建硕的博客
王建硕的博客 · 2022-08-16T15:47:34Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码