小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

文章探讨了记忆与遗忘的机制,指出日常健忘是正常现象,源于注意力转移。通过理解工作记忆与长时记忆的关系,提出减少干扰、复述和记录等方法来改善记忆。遗忘有助于信息过滤、存储强化和环境适应,体现大脑的高效运作。

你真的是记性不好吗?关于记忆和遗忘的常见误区

少数派
少数派 · 2026-01-30T03:13:23Z
LLM上下文窗口:理解与优化工作记忆

LLM的上下文窗口是模型一次处理的最大文本量,受自注意力机制和GPU内存带宽限制。现代模型的上下文窗口已扩展至128K-2M标记,但较小的窗口在实时对话和特定任务中表现更佳。在生产环境中,语义缓存和检索增强生成等策略能有效提升性能。

LLM上下文窗口:理解与优化工作记忆

Redis Blog
Redis Blog · 2026-01-23T00:00:00Z
Claude Code 的"懒加载"更新:AI 终于学会了"随叫随到

Claude Code推出了Tool Search功能,解决了AI工具生态中的“工作记忆”问题。通过懒加载方式,工具不再预加载,节省上下文空间,提高效率。用户可安装更多工具,长对话不易失忆,响应速度更快。这一更新反映了AI工具生态的成熟,关注点从功能转向效率与成本管理。

Claude Code 的"懒加载"更新:AI 终于学会了"随叫随到

宝玉的分享
宝玉的分享 · 2026-01-14T00:00:00Z
从认知心理学看代码可读性

认知心理学为代码可读性提供了重要视角。认知负荷理论表明,代码的复杂度和信息呈现方式会影响理解效率。内在负荷、外在负荷和相关负荷共同影响工作记忆容量。优化代码可读性需减少外在负荷,合理抽象以降低内在负荷。良好的命名和结构能提高理解效率,避免过度抽象和复杂设计。

从认知心理学看代码可读性

硬盘在歌唱
硬盘在歌唱 · 2025-10-15T00:00:00Z

机器之心数据服务现已上线,提供高效、稳定的数据获取服务,简化数据爬取流程。

基于工作记忆的认知测试显示LLM的检索局限:100%混淆无效信息与正确答案

机器之心
机器之心 · 2025-07-10T08:11:47Z
上下文工程:超越提示工程与检索增强生成

上下文工程是构建动态系统以支持大型语言模型(LLM)完成任务的学科,侧重于系统设计和模型生成响应时的所有信息,优化短期“工作记忆”,提升LLM在多种输入下的一致性和能力。

上下文工程:超越提示工程与检索增强生成

The New Stack
The New Stack · 2025-07-08T12:35:05Z
针对我的特殊神经架构的更多改进:工作记忆系统

该模型整合了目标驱动系统、认知系统和工作记忆系统,旨在模拟具有层次记忆管理和动态适应能力的神经网络架构,为现代神经模型提供替代方案。

针对我的特殊神经架构的更多改进:工作记忆系统

DEV Community
DEV Community · 2025-02-09T09:22:27Z

本研究提出了一种名为通用化与关联临时编码(GATE)的新模型,探讨海马如何快速适应不同环境并构建灵活的工作记忆。该模型通过三维多层结构有效捕捉信息,展现出快速普遍化能力,为理解海马记忆机制及仿生智能系统的发展提供了框架。

GATE:通过信息门控实现工作记忆的自适应学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-22T00:00:00Z

本文探讨了大语言模型生成内容的事实不准确问题,提出了一种显式工作记忆(EWE)方法,通过实时反馈提升文本生成的准确性。实验结果表明,EWE显著提高了生成内容的可靠性。

通过显式工作记忆提高事实性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-24T00:00:00Z

本研究分析了语言模型在认知任务中的表现,发现其低性能主要由于对任务理解不足,而非工作记忆容量的限制,旨在改进语言模型的认知评估方法。

语言模型是否理解赋予它们的认知任务?基于N-Back范式的研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-24T00:00:00Z

最近,视频对象分割(VOS)网络通过生成辅助帧和实施原型级匹配,解决了空间-时间一致性和像素匹配问题。实验结果显示,该方法在DAVIS 2017和YouTube VOS 2018上表现优异,推理速度超过32 FPS。

解决视频对象分割中的工作记忆问题

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-29T00:00:00Z

本研究解决了虚拟现实中用户行走时网络眩晕与认知、身体活动之间关系理解不足的问题。通过收集39名参与者的多项指标,提出了一种新的数据集,并通过分类器训练展示其在预测网络眩晕方面的有效性。该数据集可以帮助未来的研究开发网络眩晕检测和减少模型,推动虚拟环境设计的改进。

迷失与困惑:一个关于虚拟现实中步行任务的网络眩晕、工作记忆、心理负荷、身体负荷和注意力的数据集

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-10T00:00:00Z

我们提出了一种名为“动态网络架构”的新型智能系统架构,该架构依赖于稳定循环网络,并讨论其在视觉上的应用。通过动态连接主义原则,我们的模型通过自组织机制,结合Hebbian可塑性和定期加强的抑制来稳定初级传入信号引起的神经激活。我们证明了DNA的可行性,即使在每个空间位置引入了高达59%的噪声,线条表示的构建仍然保持稳定。此外,我们展示了该模型能够从部分遮挡的输入中重建预期特征,并且可以推广到训练期间未观察到的模式。我们提供了关于一个独立区域的优势和不足的深入理解,并展望了未来工作如何通过组合多个区域来实现不变的物体识别。

层次工作记忆与新魔法数字

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-14T00:00:00Z

本文介绍了一种音频-视觉声音分离方案,通过两级网络实现了低时延的成果。该模型利用轻量级图卷积网络从面部标记中提取运动线索,并将视觉和音频特征输入到音频-视觉转换器中,取得了良好的隔离估计结果。在第二阶段,音频网络增强了主要声音。研究进行了消融实验并与最先进的方法进行了比较。最后,探讨了在唱声分离任务中训练语音分离模型的可转移性。

Papez: 基于听觉工作记忆的资源高效语音分离

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-01T00:00:00Z

这篇论文研究了在 Transformer 模型解码器中添加的符号工作内存的属性,该工作内存增强了机器翻译任务中模型预测的质量,并作为信息的神经符号表示,对于模型进行正确翻译至关重要。通过研究记忆内容发现,翻译文本的关键词存储在工作内存中,指向记忆内容与处理文本的相关性。此外,存储在内存中的标记和词性的多样性与机器翻译任务的复杂性相关。

变压器工作记忆中符号表示的复杂性与任务复杂性的相关性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-20T00:00:00Z
双重A的我:ADHD、ASD以及人生滑稽剧

这篇文章讲述了作者Cerebri的故事,他是一个追求理智和知性的人,但在执行功能方面有所欠缺。他提到自己有ADHD和ASD,这使他在工作记忆、规划和时间管理方面遇到困难。作者认为不友好的环境是他面临的最大挑战之一。他批评了一本畅销书《当下的力量》,认为它对他的经历持否定态度。他觉得这本书缺乏内容,只是强调专注于当下可以减轻痛苦。作者认为这本书的作者是一个狡猾的诡辩家,而一些读者也会用这些观点来否定他的创伤经历。他认为人们的麻木才是问题所在。

双重A的我:ADHD、ASD以及人生滑稽剧

知乎每日精选
知乎每日精选 · 2024-04-18T06:48:22Z

该研究介绍了一种将基于Transformer的大型语言模型扩展到无限长输入的有效方法,同时保证有界内存和计算。该方法使用了新的Infini-attention技术,将压缩性记忆融入传统的注意力机制中,并在单个Transformer块中集成了局部和长期线性注意力机制。该方法在长文本语言建模、1M序列长度密钥上下文块检索和500K长度的书籍摘要任务上展示了有效性,使用1B和8B规模的大型语言模型。该方法引入了有界内存参数,并实现了LLMs的快速流式推理。

TransformerFAM:反馈注意力即工作记忆

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-14T00:00:00Z

通过分析基于Transformer神经网络架构的模型在简单序列建模任务上的训练结果,发现Transformer内部的自注意机制呈现出与输入和输出分离机制相似的特征,暗示了关于现代AI架构与人脑模型计算相似性的研究机会。

Transformer 机制在训练人类工作记忆任务时模拟前额 - 纹状体门控操作

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-13T00:00:00Z

该文章介绍了一种基于强化学习的动态难度调整(DDA)方法,用于处理视觉工作记忆游戏中的记忆难度。该方法通过考虑玩家得分和游戏上一轮的难度,个性化地调整游戏难度。与基于规则的方法相比,该方法在玩家体验、得分和胜率等方面有显著提升,并在测试中导致较少的分数下降。

基于连续强化学习的视觉工作记忆游戏中的动态难度调整

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-24T00:00:00Z

本文提出了一个针对混沌系统长期预测的框架,通过两种方法处理噪声数据的多环境训练,保留了描述动力学的不变吸引子的统计特性。实证验证表明该方法在保持混沌吸引子的不变测度方面表现出很好的效果。

无需连续吸引子的持续学习信号和工作记忆

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-24T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码