结构之法算法之道 ·

DeepSeek-OCR——上下文视觉压缩：同等长度下，通过更少的视觉token解决长上下文处理难题

📝

内容提要

本文介绍了DeepSeek团队开发的DeepSeek-OCR模型，这是一种创新的视觉-语言模型，专注于通过视觉模态实现高效的文本信息压缩。该模型采用DeepEncoder架构，结合窗口注意力和全局注意力机制，在高分辨率输入下保持低内存消耗和少量视觉token。实验显示，在9-10倍文本压缩下达到96%+的OCR精度，在20倍压缩下约60%精度。模型支持多种分辨率输入，并具备解析图表、化学式等...

🏷️

继续阅读

上下文是2026年AI编码的真正瓶颈
在工程领导会议上，AI生成代码的安全性和可信度受到关注，关键在于上下文传递。解决这一问题的公司将加速进展，减少技术债务。AI工具需获取工程师的隐性知识，目...
DeepSeek 与开源：肥沃土壤孕育 AI 硕果
中国开源生态经过二十年的发展，从零散探索到繁荣，推动了国产AI技术的崛起。DeepSeek等项目的成功得益于开源社区的积累与协作。尽管面临国际竞争，国内开...
Nature子刊｜上智院、复旦、无限光年发布MAPLE框架，破解甲基化衰老与疾病风险预测的泛化难题
破解安全研发三大难题：Gitee 软件工厂助力高标准合规落地
国家安全软件研发面临合规与复杂性挑战。Gitee软件工厂通过统一平台提升协作效率，确保安全与合规，支持高效研发。其核心能力包括细粒度权限控制、标准化流程和...
百万围观、HuggingFace多模态登顶，华人团队开源语音版「DeepSeek」海外爆火
Casio teased a retro gaming-inspired sampler
Casio showed up to NAMM (CES for music gear nerds) this year with a prototype...

DeepSeek-OCR——上下文视觉压缩：同等长度下，通过更少的视觉token解决长上下文处理难题

内容提要

标签

继续阅读