小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

“最强具身VLA大模型”π*0.6通过Recap学习方法,使机器人从错误中学习,任务成功率超过90%。该模型结合人类示范与自主经验,优化复杂任务表现,展现出高效自我纠正能力,为机器人研究提供新思路。

“最强具身VLA大模型”,究竟强在哪儿?

量子位
量子位 · 2025-11-21T07:50:35Z
当你询问Unicode是否有海马表情时 ChatGPT等多个AI会精神错乱并给出错误的回答

多个AI聊天机器人在询问Unicode是否有海马表情时出现错误,部分模型如ChatGPT误认为存在海马表情并陷入循环。尽管Unicode未添加海马表情,Qwen模型能自我纠正,而谷歌的Gemini AI则准确回答没有海马表情。

当你询问Unicode是否有海马表情时 ChatGPT等多个AI会精神错乱并给出错误的回答

蓝点网
蓝点网 · 2025-09-14T04:16:14Z

本研究提出了一种新颖的数据标注方法,解决了现有过程奖励模型在长链推理中仅关注初始错误的问题。通过引入错误传播和终止概念,显著提升了模型在自我纠正和推理方面的性能,实验结果优于现有模型。

Beyond the First Error: Process Reward Models for Reflective Mathematical Reasoning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-20T00:00:00Z

本研究提出CEC-Zero框架,通过强化学习使大型语言模型在中文文本处理上自我纠正,无需外部监督。实验结果表明,该框架在精确度和泛化能力上优于传统模型,为中文自然语言处理提供了有效解决方案。

基于大语言模型的中国错误纠正解决方案 CEC-Zero

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-14T00:00:00Z

本研究提出了“凤凰”框架,旨在提升机器人在失败后的自我纠正能力。该框架结合高级语义反省与低级动作纠正,采用双进程调整机制,实现精准的细粒度动作纠正。实验结果表明,该框架在多种操作任务中展现出优越的泛化能力和鲁棒性。

Phoenix: A Motion-based Self-Reflection Framework for Fine-grained Robotic Action Correction

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-20T00:00:00Z

本研究评估了两种生成性人工智能系统(GPT-4o 和 Claude 3.5)在建筑3D合成中的表现。尽管两者能够生成模型,但在准确组装部件方面存在困难,Claude 3.5在自我纠正输出上表现更佳。这为AI在建筑设计中的应用提供了新见解。

使用生成性人工智能进行建筑合成评估

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-04T00:00:00Z
自我纠正的检索增强生成:提升AI语言模型的鲁棒性

CRAG是一种自我纠正框架,提升了检索增强生成(RAG)的准确性。它通过实时评估检索内容,动态触发纠正措施,确保即使初始检索失败,响应依然准确。CRAG的创新包括轻量级检索评估器、基于信心的动态响应和分解重组算法,增强了AI的可靠性。

自我纠正的检索增强生成:提升AI语言模型的鲁棒性

DEV Community
DEV Community · 2025-02-15T14:05:30Z
刚刚,OpenAI正式放出智能体Operator!能推理、联网自主执行任务

OpenAI推出了名为Operator的智能体,用户可通过自然语言描述任务,自动执行多步骤操作。该智能体具备自我纠正能力,并可访问互联网。目前仅供美国Pro用户使用,未来将扩展至更多用户并集成到ChatGPT中。

刚刚,OpenAI正式放出智能体Operator!能推理、联网自主执行任务

机器之心
机器之心 · 2025-01-24T02:31:41Z

本研究提出了一种自我纠正对抗训练框架LIMIT,旨在改善中文非自然文本的纠正效果。该方法有效模拟真实应用中的错误,减少传统训练中的偏差,并在多种错误纠正方面超越现有技术。

Learning from Mistakes: Self-Correcting Adversarial Training for Chinese Unnatural Text Correction

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-23T00:00:00Z

本研究提出一种新方法,通过论证理论中的关键问题来提升大型语言模型的逻辑和数学推理能力。模型通过自我纠正,在多项推理和数学任务上表现显著提升。

Key Questions in Reasoning: Guiding Large Language Models' Inference through Argument Queries

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-19T00:00:00Z

o1满血版推出了每月200美元的Pro模式,但许多人认为1500元的价格不划算。Pro模式在解决复杂问题时表现优异,但大多数用户使用免费或20美元版本即可满足需求。o1在数独和生物医学问题上展现了自我纠正能力,尽管仍有错误。总体而言,Pro模式适合需要频繁使用的少数用户。

o1满血版最鲜测!这¥1500花得值吗?

量子位
量子位 · 2024-12-06T05:30:45Z

通过自我纠正训练,小型语言模型在数学和常识推理方面的能力得到了提升。实验表明,强配对的使用显著提高了性能,但弱自验证器的效果有限。

自我训练与一致性相结合:通过一致性驱动的推理评估提升大型语言模型的推理能力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-10T00:00:00Z
谷歌发布大型语言模型自我纠正算法SCoRe

谷歌DeepMind研究人员提出了一种通过强化学习进行自我纠正(SCoRe)的方法,提升大型语言模型在数学和编程问题上的自我纠正能力。SCoRe使用模型生成的数据进行自我纠正,通过两阶段强化学习微调。与基线模型相比,SCoRe在MATH和HumanEval测试中分别提高了15.6和9.1个百分点。

谷歌发布大型语言模型自我纠正算法SCoRe

InfoQ
InfoQ · 2024-10-15T13:00:00Z

该研究针对视觉语言模型中现有奖励模型的不足,特别是仅提供二元反馈的问题。提出的令牌级探测奖励模型(TLDR)通过细粒度文本标注提升模型性能,改善自我纠正生成和幻觉评估,并显著提高人类标注效率。

TLDR: Token-Level Detection Reward Model for Large-Scale Vision-Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-07T00:00:00Z
大型语言模型的推理能力

研究显示,大型语言模型的推理能力不如人类,尤其在自我纠正方面存在不足,引发对其推理能力的讨论。

大型语言模型的推理能力

DEV Community
DEV Community · 2024-09-25T20:35:14Z

本文介绍了一种学生差异信息纠正学习(SDCL)框架,用于解决半监督医学图像分割中的伪标签问题。通过让两个学生模型自我纠正分割差异,SDCL在多个数据集上表现出色,接近全监督学习效果。

学生差异信息纠正学习在半监督医学图像分割中的应用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-25T00:00:00Z

开源大模型Reflection 70B通过新训练技术实现自我纠正,击败其他模型,在数学基准测试中得分99.2%。Reflection 70B能回答错误问题,官方将发布更大的Reflection 405B。Reflection 70B使用Reflection-Tuning训练方法,能够在推理过程中纠正错误。模型由HyperWriteAI的CEO Mutt Shumer带领的小团队开发。

开源大模型新王干翻GPT-4o,新技术可纠正自己幻觉,数学99.2分刷爆测试集

量子位
量子位 · 2024-09-06T05:41:07Z

本文提出了层次扩展框架 (HEF),利用分类法的分层结构进行分层扩展。HEF通过亲属关系检测和树独特功能评估子树连贯性,并引入适合度评分选择最优位置,用于消歧和自我纠正。实验结果显示,HEF在准确性和平均倒数排名方面提高了46.7%和32.3%的精度。

找出父级,然后标记子级:使用预训练语言模型的两阶段分类法完成方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-25T00:00:00Z

本文通过对一种类似于对齐任务的简化设置进行理论分析,展示了大语言模型通过自我纠正可以改进响应。研究发现,softmax关注、多头关注和MLP块在自我纠正中起到关键作用。自我纠正具有潜在应用,如抵制大型语言模型越狱。这些发现将促进对自我纠正的进一步研究和应用。

LLM 能够自我纠错的实际时机研究:对 LLM 自我纠错的关键调查

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-03T00:00:00Z

研究发现大语言模型可以通过自我纠正来改进响应,自我纠正在抵制大型语言模型越狱方面起重要作用。这些发现将推动自我纠正的研究和应用,构建更好的基础模型。

自校正的理论认识与上下文对齐

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-28T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码