小红花·文摘
首页
广场
排行榜
🏆
直播
FAQ
首页
详情
机器之心
·
2026-01-10T12:56:25Z
DeepSeek-OCR是「长文本理解」未来方向?中科院新基准VTCBench给出答案
🏷️
标签
deepseek
ocr
中科院
阅读原文
生成长图
分享链接
已复制链接
➡️
继续阅读
InternVLA-A1——面向场景理解、未来状态生成、动作执行的一体化框架:融合VLM的语义理解与世界模型的未来动态预测
InternVLA-A1。该模型采用统一的 Mixture-of-Transformers 架构,协同三个专家模块,分别负责场景理解、视觉前瞻生成和动作执...
当关键软件也被卡,我们的答案在哪里
特朗普宣布自2025年11月1日起对中国实施100%关税及软件出口管制,影响软件产业自主能力。Gitee致力于构建国产研发生态,推动开源基础设施,确保技术可控与持续创新。
DeepSeek 与开源:肥沃土壤孕育 AI 硕果
中国开源生态经过二十年的发展,从零散探索到繁荣,推动了国产AI技术的崛起。DeepSeek等项目的成功得益于开源社区的积累与协作。尽管面临国际竞争,国内开...
百万围观、HuggingFace多模态登顶,华人团队开源语音版「DeepSeek」海外爆火
具身启元,智创未来——上海国际具身智能产业博览会新闻发布会在京隆重召开
微软发布 VibeVoice-ASR:一种统一的语音转文本模型,旨在一次性处理长达 60 分钟的音频
微软推出了VibeVoice-ASR,一个开源的语音转文本模型,支持最长60分钟的音频处理,输出结构化文本,包括“谁”、“何时”、“什么”。该模型允许用户...
👤 个人中心
在公众号发送验证码完成验证
去登录
登录验证
在本设备完成一次验证即可继续使用
×
完成下面两步后,将自动完成登录并继续当前操作。
1
关注公众号
小红花技术领袖
如果当前 App 无法识别二维码,请在
微信
搜索并关注该公众号
2
发送验证码
在公众号对话中发送下面 4 位验证码