小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
大模型架构的下半场

华中科技大学的研究团队提出了Flash Depth Attention和混合深度注意力(MoDA),旨在改善深度学习模型中层间的通信能力。新方法通过引入注意力机制,提升信息流动的质量,有望推动大模型架构的发展,提升模型性能。

大模型架构的下半场

量子位
量子位 · 2026-04-19T10:12:10Z

递归神经网络(RNN)用于处理序列数据,具备内部状态(记忆),适应多种输入输出结构。RNN通过递归公式更新隐藏状态并生成输出。长短期记忆(LSTM)通过门控机制解决梯度消失问题,增强信息流动。

CS231n 讲义 VII:递归神经网络

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-04-07T13:30:09Z
播客:信息流动——工程文化的隐性驱动因素

Adrian Peryer 讨论了 Ron Westrom 的文化模型,指出组织文化分为生成性、官僚性和病态文化。生成性文化强调信息流动和团队合作,鼓励分享坏消息。领导者应关注信息流动,建立信任,识别弱信号,以改善文化。

播客:信息流动——工程文化的隐性驱动因素

InfoQ
InfoQ · 2026-03-13T09:00:00Z
我的笔记系统

笔记分为个人、工作和知识三类。知识笔记有助于构建知识网络和提升提问能力,从而挖掘AI潜力。有效的笔记系统包括捕获、存储、处理、回顾和产出五个阶段,强调信息流动和知识内化。合理的工具和流程能促进洞见和决策。

我的笔记系统

Limboy
Limboy · 2026-01-28T00:00:00Z

在AI时代,企业需将AI深度融入日常工作,而非仅依赖模型。飞书的知识问答功能根据员工权限提供精准答案,提升工作效率,促进知识流动,帮助企业更好利用内部信息。

企业把AI用起来,真的不是接入个DeepSeek就完事了

量子位
量子位 · 2025-05-21T04:14:15Z

在AI时代,开发者面临高成本的导航和上下文切换,影响生产力。知识导航概念应运而生,旨在高效追踪软件工件间的关系。通过内部开发者平台(IDP)整合工具和流程,结合AI技术,提升开发者体验和效率,实现信息流动的无缝连接。

AI 驱动的知识导航:通过平台工程提升开发者生产力

phodal
phodal · 2025-05-06T03:59:11Z

红茶的“发酵”实为氧化,未涉及酵母菌。南昌市推动LED产业发展,强调城乡信息流动不对称。作者反思社交生活,认为朋友的定义应更宽泛,强调高质量互动的重要性。

Toots 2025 Apr.20 - Apr.26

素生
素生 · 2025-04-27T07:49:27Z
垂直组织距离

本文探讨了垂直组织距离(VOD)对信息流动和决策质量的影响。高VOD会导致信息延迟、扭曲和减少,影响组织的敏捷性和执行力。有效沟通和降低VOD是提升组织效率的关键,领导者应重视基层员工的意见,以避免决策失误。

垂直组织距离

Alex Ewerlöf Notes
Alex Ewerlöf Notes · 2024-12-25T16:47:05Z

本研究探讨了视觉语言模型(VLMs)在回答实体描述相关的事实性问题时,文本与图像信息之间存在19%的准确率差距。研究指出,信息从图像到查询的流动存在局限,影响模型的推理能力,揭示了VLMs内部机制的效率问题,为提升推理能力提供了新思路。

Performance Gap in Entity Knowledge Extraction in Vision Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-18T00:00:00Z

本研究提出了一种名为“树枝”的创新扩散框架,旨在解决条件图生成中的信息流动不足问题。实验结果表明,该方法在生成任务中优于现有基线,并具有在逆分子设计等复杂任务中的应用潜力。

基于环引导的扩散树枝用于条件图生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-31T00:00:00Z

本文综述了大型语言模型(LLMs)的架构、训练策略及性能评估,分析了其在记忆、推理和理解等方面的表现。研究表明,LLMs的能力结构复杂,不同机制对信息流动有显著影响。未来的研究将集中在模型的改进和评测上。

LLM 电路分析在训练和尺度方面的始终如一性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-15T00:00:00Z

我们建立了语音处理通用性能基准(SUPERB),使用冻结的基础模型和任务专门化的轻量级预测头,证实了基础模型范式在语音处理中的潜力和多任务框架的简单有效性。我们进行了分析,了解 SUPERB 和语音基准模型,包括模型内任务之间的信息流动,加权求和基准测试协议的正确性以及基准测试的统计显著性和稳健性。

一个大规模评估的语音基础模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-15T00:00:00Z

我们提出了一种高效的多头自注意力交互方法,通过跨头交互增强信息流动,降低注意力矩阵维度,实现更高效的注意力操作。实验证明该方法优于现有方法和骨干模型。

具有线性复杂度的交互式多头自注意力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-27T00:00:00Z
小圈子文化

小圈子文化阻碍信息流动,建议老板避免,注重业务本身,倡导3人团队。

小圈子文化

joojenZhou 个人网站
joojenZhou 个人网站 · 2023-09-12T14:03:23Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码