结构之法算法之道 ·

从Octo与TinyVLA、DeeR-VLA、3D-VLA——OpenVLA之外的VLA模型的持续升级

💡 原文中文，约3300字，阅读约需8分钟。

📝

内容提要

Octo模型通过多样化的机器人数据集训练策略，增强了机器人的泛化能力。与以往模型不同，Octo支持灵活微调，用户可根据新任务调整输入输出，且完全开源。其架构包括输入Tokenizers、Transformer骨干和动作头，能有效处理多种任务和数据。

🎯

🏷️

在线教程丨华中科大与小红书 hi lab开源dots.mocr，SOTA级OCR模型完美还原文档结构，图形也能转 SVG
华中科技大学与小红书hi lab联合开源了dots.mocr，这是一个SOTA级OCR模型，能够完美还原文档结构并将图形转换为SVG格式。
Translumo：一款实时屏幕翻译工具，支持多语言和多OCR引擎
Translumo是一款实时屏幕翻译工具，支持多语言和高精度OCR，适用于游戏和视频等内容的快速翻译。它开源、完全本地化，使用简便，适合多种应用场景。
Magical Order Rabbit - Official April Fools' Day Event of 'Is the Order a Rabbit?'
文章总结为：我不是机器人。
极智嘉2025年收入同比增长31.6%至人民币31.71亿元
极智嘉2025年财报显示，收入同比增长31.6%至31.71亿元，毛利率提升至35.5%。海外收入占75.3%，净利润为4382万元。新签订单额41.37...
OpenClaw v2026.3.31 默认安全模型升级详解与迁移指南
OpenClaw v2026.3.31 实现了从“默认信任”到“零信任”的安全模型，强化了权限控制和插件安全，确保所有操作必须经过授权，以提升系统安全性。
国内最强生图模型Wan2.7-Image来了
Wan2.7-Image模型具备文生图、图生组图和图像编辑等全链路能力，超越GPT-Image1.5，支持超长文本渲染和多种颜色调控，适用于影视、自媒体和...