小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
随机KV路由:实现自适应深度缓存共享

本文提出了一种随机跨层注意力机制,以优化变换器语言模型中的键值(KV)缓存管理。通过随机选择使用自身或前一层的KV状态,减少内存占用,同时保持模型性能。这种方法在预训练或微调阶段有效,尤其在数据受限的情况下表现出正则化效果。

随机KV路由:实现自适应深度缓存共享

Apple Machine Learning Research
Apple Machine Learning Research · 2026-05-05T00:00:00Z
AI科研工具深度解析:Paperclip如何用arXiv重构论文检索分析方式

Paperclip通过整合arXiv等数据库,重构了AI论文检索方式,允许AI快速检索和分析论文,提升科研效率。AI能够直接处理全文,支持批量操作和跨领域推理,变成主动的研究员。这一变革使科研从传统阅读转向数据处理,极大提高了效率。

AI科研工具深度解析:Paperclip如何用arXiv重构论文检索分析方式

极道
极道 · 2026-05-01T03:15:00Z

现代Web应用中,服务端与客户端的高效通信至关重要。本文分析了短轮询、WebSocket、SSE和长轮询四种通信方式的优缺点及适用场景。短轮询适合低频更新,WebSocket适合实时双向通信,SSE用于单向推送,长轮询是短轮询的高效替代。选择合适的技术可提升用户体验。

探索服务端通信技术:短轮询、WebSocket、SSE 与长轮询的深度比较

了迹奇有没
了迹奇有没 · 2026-04-30T07:03:32Z

深度求索推出DeepSeek V4 Pro模型限时优惠,价格降至2.5折,截止到2026年5月5日。百万缓存命中价从0.1元降至0.025元,未命中缓存价从12元降至3元,输出价从24元降至6元。此举旨在提升模型使用率,因V4-Flash模型反馈不佳。活动结束后价格将恢复,用户需注意切换模型以避免高费用。

深度求索推出DeepSeek V4 Pro限时活动 调用价格从0.1元起步下调到0.025元

蓝点网
蓝点网 · 2026-04-27T00:30:27Z
DigitalOcean 专用推理:技术深度解析

Dedicated Inference是DigitalOcean AI平台上的托管LLM服务,旨在为需要高性能和可预测成本的团队提供专用GPU推理。该服务简化了基础设施管理,支持快速部署和扩展,确保在高负载下满足服务水平协议,让用户专注于模型选择和工作负载调优。

DigitalOcean 专用推理:技术深度解析

The DigitalOcean Blog
The DigitalOcean Blog · 2026-04-25T02:51:09Z

本文讨论了大规模模型训练中的并行化技术,特别是671B MoE模型的训练挑战。随着模型规模的增加,单卡显存不足以支持训练,因此需要采用数据并行、张量并行和流水线并行等多种策略。文章分析了显存消耗、通信成本及不同并行策略的优缺点,并强调了优化通信与计算重叠的重要性。最后,提出了针对不同规模模型的并行配置建议。

【大模型基础设施工程】06:3D 并行深度——数据 / 张量 / 流水 / 序列 / ZeRO

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-22T00:00:00Z
技术深度揭秘|云知声U1-OCR架构升级 + API 开放,重构 OCR 3.0 时代

云知声发布了工业级文档智能基础大模型Unisound U1-OCR,标志着OCR 3.0时代的到来。该模型具备高效部署和强适配能力,支持金融、医疗等行业的复杂文档解析,提升了文档结构理解和阅读顺序恢复能力,解决了传统OCR的局限性,推动行业数字化转型。

技术深度揭秘|云知声U1-OCR架构升级 + API 开放,重构 OCR 3.0 时代

量子位
量子位 · 2026-04-21T04:50:16Z

本文探讨了Linux内核中的软中断机制,重点分析了网络数据包的处理。软中断是一种不可抢占的延迟执行机制,主要用于网络和块设备。文章讨论了软中断的调度、执行路径及其与ksoftirqd线程的关系,并指出在高负载情况下可能出现的延迟问题。通过引入Threaded NAPI和PREEMPT_RT内核,改善了网络处理的实时性和调度公平性,并提供了在高PPS场景下的性能调优建议。

【Linux 网络子系统深度拆解】软中断与 ksoftirqd:网络包处理的调度引擎

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-20T00:00:00Z

本文深入解析了 Linux 内核中的 socket 机制,介绍了双层分发架构,包括 VFS 层和协议层的结构与功能。详细说明了 socket 创建过程、proto_ops 分发机制、SO_REUSEPORT 的多核支持,以及与 epoll 的集成。通过内核源码分析,揭示了 socket 的核心数据结构及其在网络通信中的重要性。

【Linux 网络子系统深度拆解】Socket 层内核实现:从 VFS 到协议栈的桥梁

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-20T00:00:00Z

本文深入探讨了UDP协议的内核实现,分析了其五个核心机制:socket查找优化、接收与发送路径、UDP GRO聚合、批量收发和UDP封装支持。UDP的轻量特性在高性能场景中表现优异,但独立查找socket的开销也不容忽视。通过双哈希表和优化的接收队列,UDP在高并发情况下能有效提升性能,并支持多种封装协议,适用于隧道技术。

【Linux 网络子系统深度拆解】UDP 内核实现与 socket lookup 优化

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-20T00:00:00Z
Pi-hole原理深度解析:用DNS重写广告分发生态实现全网设备无广告体验

Pi-hole通过DNS拦截广告和追踪请求,为全网设备提供无广告体验。它维护域名黑名单,阻止广告和恶意网站,运行成本低且性能优越。开源特性增强用户信任,提供命令行和Web界面管理,简化操作。整体上,Pi-hole通过控制DNS改善了互联网体验。

Pi-hole原理深度解析:用DNS重写广告分发生态实现全网设备无广告体验

极道
极道 · 2026-04-19T21:53:00Z

Go语言的调度器通过用户态实现M:N调度,支持百万个轻量级goroutine并发运行。其GMP模型中,G代表goroutine,M为操作系统线程,P是逻辑CPU资源。Go调度器采用FIFO队列和工作窃取策略,减少内核调度开销,提高创建和切换速度。与Linux CFS调度器相比,Go设计追求高吞吐量,适合处理大量并发任务。

Go 调度器深度拆解:goroutine 到底对 CPU 做了什么

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-18T00:00:00Z
Grok的性别深度伪造几乎使其在苹果App Store中被禁。差一点。

苹果公司威胁将Elon Musk的AI应用Grok从App Store中移除,原因是未能有效控制非自愿性别深度伪造内容。尽管Grok声称已加强内容审核,但仍存在生成性别化深度伪造的能力。苹果要求开发者改善内容管理,否则可能面临下架。

Grok的性别深度伪造几乎使其在苹果App Store中被禁。差一点。

The Verge
The Verge · 2026-04-15T10:55:22Z
深度分析 FAST 2002–2026:AI 时代来了,存储系统的问题变了吗?

本文回顾了存储系统研究的演变,强调在AI时代,传统存储问题如缓存、恢复和文件系统重新受到关注。通过分析FAST会议的论文,发现AI并未取代旧问题,而是促使其以新形式回归。研究显示,KV缓存、模型加载和检查点等主题在存储系统中变得更加重要,反映出存储研究的主线逐渐转向服务和数据路径的协同。

深度分析 FAST 2002–2026:AI 时代来了,存储系统的问题变了吗?

Steins;Lab
Steins;Lab · 2026-04-13T12:59:46Z
深度数科集团与阿里云签署全面合作协议

深度数科集团与阿里云于4月10日在杭州签署全面合作协议,双方将围绕“人工智能+产业”展开合作,推动人工智能在供应链金融和数字化领域的应用,提升中小企业融资与贸易效率。

深度数科集团与阿里云签署全面合作协议

全球TMT-美通国际
全球TMT-美通国际 · 2026-04-13T03:54:25Z
SmartPerfetto 架构文章 Q&A:8 个深度技术问答

本文讨论了SmartPerfetto AI Agent的技术问题,重点分析了YAML Skill系统与Claude Code的区别、Agent的决策能力、场景识别及AI自主探索的有效性。YAML Skill为性能工程师提供灵活的SQL执行工具,支持参数化和自描述输出格式。文章强调通过三层机制(Strategy文件、Planning Gate、Verifier)确保AI自主探索的可靠性,并提出在不同分析阶段设定约束强度的策略。

SmartPerfetto 架构文章 Q&A:8 个深度技术问答

Android Performance
Android Performance · 2026-04-10T03:00:00Z
深度代理部署:Claude管理代理的开放替代方案

Deep Agents deploy是一个开源代理工具,支持快速部署模型无关的代理。用户可以自定义代理指令和技能,确保记忆数据不被锁定在专有系统中。通过简单命令,用户可在多租户环境中管理代理、记忆和交互接口,促进开放生态系统整合。

深度代理部署:Claude管理代理的开放替代方案

LangChain Blog
LangChain Blog · 2026-04-09T15:40:49Z
不知所云,这篇文章不值一看

作者在博客中表达了对写作内容的困惑,认为文章缺乏主题和深度,写作水平不高,但希望坚持每天更新以提高写作能力。

不知所云,这篇文章不值一看

阿锋的小宇宙
阿锋的小宇宙 · 2026-04-09T13:06:52Z
利用ACP和深度代理揭示现代软件工程的奥秘

Jacob Lee利用Deep Agents和Agent Client Protocol(ACP)构建了一个符合自己工作流程的编码代理。他在LangChain开发开源工具,成功替代Claude Code,提升了工作效率,并实现了代理行为的全面可观察性。通过与IDE的紧密集成,他的代码编辑和调试变得更加高效。

利用ACP和深度代理揭示现代软件工程的奥秘

The JetBrains Blog
The JetBrains Blog · 2026-04-08T12:32:39Z
深度代理 v0.5

深度代理和深度代理JS的新版本发布,新增异步子代理,支持多模态文件系统。异步子代理可在后台独立执行任务,避免主代理阻塞,提高效率。同时扩展了对PDF、音频和视频等文件类型的支持。

深度代理 v0.5

LangChain Blog
LangChain Blog · 2026-04-07T17:06:51Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码