开源服务指南 ·

纯 JavaScript 实现的 OCR 库：支持超过 100 种语言 | 开源日报 No.715

💡 原文中文，约700字，阅读约需2分钟。

📝

内容提要

tesseract.js 是一个支持多语言的 JavaScript OCR 库，能够从图像和视频中提取文本。JVector 是高效的向量搜索引擎，支持增量更新。ACE_Framework 是开源的智能体框架，依赖本地硬件。TokenFlow 实现高质量的视频编辑，符合文本描述。

🎯

关键要点

tesseract.js 是一个支持超过 100 种语言的 JavaScript OCR 库。
支持从图像和视频中提取文本，使用 WebAssembly 封装 Tesseract OCR 引擎。
可在浏览器和 Node.js 环境中运行，安装简单。
显著减小文件大小，提高运行速度与内存效率。
JVector 是一个高效的嵌入式向量搜索引擎，提供近似最近邻搜索。
基于图的索引结构，支持增量构建和更新，减少内存使用和延迟。
ACE_Framework 是一个完全本地化且开源的智能体框架，依赖本地硬件。
鼓励实验和数据生成，避免供应商锁定，支持多种模型与技术。
TokenFlow 是一个基于文本到图像扩散模型的视频编辑框架。
利用文本驱动的方法生成高质量视频，保持输入视频的空间布局和动态特征。
与现成的图像编辑方法兼容，展示了最先进的编辑效果。

🏷️

标签

ACE_Framework JVector OCR TokenFlow javascript tesseract.js 开源

➡️

继续阅读

老黄「开源协议」就剩一家没签，是谁啊好难猜啊
Denny’s和英伟达，有一项核心业务高度重叠
文本/LaTeX/HTML表格一步搞定！OvisOCR2实现端到端文档智能解析；1.4 万+ 元素标注、万条语言指令！Voxel51 发布 SceneFun3D 室内场景微观交互数据集
该数据集包含 300 个元认知陷阱问题，覆盖数学、物理、生物、法律、医学、经济学、统计学、伦理学、计算机科学等 121 个领域，涵盖 8 种元认知行为类型...
【Rust日报】2026-07-27 Stoffel：Rust 把多方安全计算从语言到 QUIC 运行时整条栈全包了
Stoffel：Rust 把多方安全计算从语言到 QUIC 运行时整条栈全包了 Stoffel 最抓眼球的地方，不是单个 crate，而是它把安全多方计...
CCleaner 复刻版：3.57MB，开源清理工具 FluentCleaner Classic 发布
随着越来越多的 Windows 老用户对经典系统清理工具 CCleaner 的不满，比如广告、推荐、优化建议等，有开发者使用与 CCleaner 早期相同...
不用 Python，也能训练大模型：两年之后再看 Go 语言机器学习框架 GoMLX
本文是对 Go 语言机器学习框架 GoMLX 的一次两年后回访式全面梳理。区别于两年前的入门级介绍，这次聚焦于它经过 v0.28 重组后的整体架构：核心计...
100%开源！吴恩达做了个个人桌面Agent
开源、隐私、本地优先、模型无关