小红花·文摘 - 小红花技术领袖俱乐部

如何判断一个文章是不是AI写的？文字、视频、图片AI检测方法

如何判断一个文章是不是AI写的？文字、视频、图片AI检测方法

张洪Heo ·

PaddleOCR-VL-1.5发布问鼎双榜，0.9B小钢炮攻克“曲面”文档！

PaddleOCR-VL-1.5发布问鼎双榜，0.9B小钢炮攻克“曲面”文档！

百度大脑 ·

百度出招！OCR模型PaddleOCR-VL打破管道与端到端方法局限；面部情感识别数据集Facial Emotion Recognition，赋能 AI 读懂表情

百度出招！OCR模型PaddleOCR-VL打破管道与端到端方法局限；面部情感识别数据集Facial Emotion Recognition，赋能 AI 读懂表情

HyperAI超神经 ·

$DeepSeek-OCR——上下文视觉压缩：同等长度下，通过更少的视觉token解决长上下文处理难题$

DeepSeek-OCR——上下文视觉压缩：同等长度下，通过更少的视觉token解决长上下文处理难题

结构之法算法之道 ·

百度在Hugging Face发布PP-OCRv5，光学字符识别基准测试中超越VLMs

百度在Hugging Face发布PP-OCRv5，光学字符识别基准测试中超越VLMs

InfoQ ·

PaddleOCR 3.2版本发布，英文文本识别精度提升近11%，新增泰语和希腊语支持。全面升级C++本地部署能力，提供高稳定性服务化部署方案，并支持细粒度性能基准测试，帮助用户优化部署。

PaddleOCR 3.2发布，多语种文字识别精度提升，多平台部署能力升级

百度大脑 ·

OCRFlux-3B是一个智能文本识别工具包，能够将PDF和图像转换为可检索的Markdown文本，支持复杂表格和公式，保持文本自然顺序，适合研究人员快速提取信息。该工具基于多模态语言模型，开源并可在消费级显卡上运行。

在线教程｜消费级显卡也能运行？轻量级模型OCRFlux-3B首次实现复杂文本智能识别

HyperAI超神经 ·

PaddleOCR 3.1 更新了多语种文本识别模型，支持37种语言，识别精度提升30%。新增文档翻译工具PP-DocTranslation，支持Markdown、PDF和图片格式翻译，并支持MCP服务器，便于将OCR能力集成到AI应用中。

PaddleOCR 3.1 发布：文心助力30+语种文字识别精度提升30%+，关键能力支持MCP

百度大脑 ·

PaddleOCRSharp v5.1升级了底层库，支持多语言和复杂文本识别，提升了识别精度和性能，新增OCR引擎实例和PDF识别功能，优化了多线程和路径加载，适配多种开发语言，广泛应用于各行业。

PaddleOCRSharp v5.1重磅来袭

dotNET跨平台 ·

03-鸿蒙OS5-文本识别案例

03-鸿蒙OS5-文本识别案例

DEV Community ·

PixPin是一款强大的截图工具，支持自由选择区域、窗口探测、长截图和动图截取，配备丰富的标注工具和文本识别，适合学生、教师和职场人士，提高工作效率。

PixPin – 一款截图/贴图工具

老董日志 ·

PaddleOCRSharp是一个支持多语言的.NET离线OCR库，具备文本识别、检测和表格识别功能，优化后识别率高，适用于多种Windows和Linux系统，提供免费和付费版本，适合各行业开发。

PaddleOCRSharp常见问题与解决方案

dotNET跨平台 ·

本文提出了一种新颖的端到端框架，结合ResNet和视觉变换器，利用可变形卷积等先进技术，显著提升自然图像的文本识别性能。实验结果表明，该框架在多个数据集上表现优异。

End-to-End Text Recognition and Retrieval-Augmented Generation Based on Deformable Optimized Transformer Architecture

BriefGPT - AI 论文速递 ·

如何在Swift中将手写图像转换为文本

如何在Swift中将手写图像转换为文本

DEV Community ·

最佳扫描应用：文件扫描的七大推荐

最佳扫描应用：文件扫描的七大推荐

DEV Community ·

164/365 | ¥10M工作挑战 - 4o图像生成

164/365 | ¥10M工作挑战 - 4o图像生成

DEV Community ·

我试用了10款免费AI检测工具 | 这是我的评测结果

我试用了10款免费AI检测工具 | 这是我的评测结果

DEV Community ·

本研究提出了一种无训练的轻量级场景文本分割与识别网络，旨在降低现代文本识别系统对大型架构和高训练成本的依赖。该框架通过上下文理解和注意力机制，提高了文本区域的识别效率，并在公共基准测试中表现出与先进系统相当的效果，同时显著减少了资源需求。

A Context-Driven Training-Free Lightweight Network for Scene Text Segmentation and Recognition

BriefGPT - AI 论文速递 ·

十大AI内容检测工具

十大AI内容检测工具

DEV Community ·

本文提出了一种新的重参数化垂直注意融合模块（RVAFM），旨在提高手写段落文本识别的效率。该模块在训练时采用多分支结构，推理时转换为单分支，最终在IAM测试集上实现了4.44%的字符错误率和14.37%的单词错误率，同时推理速度也有所提升。

RVAFM: Reparameterized Vertical Attention Fusion Module for Handwritten Paragraph Text Recognition

BriefGPT - AI 论文速递 ·