标签
本列表汇集了关于PDF文件处理、转换及其安全漏洞的最新研究与技术,帮助您了解如何高效、安全地使用PDF文档。
把网页导出成PDF
把网页导出成PDF
本文介绍了几种将网页导出为PDF的方法,包括前端调用浏览器API、使用headless浏览器、使用Playwright等,以及使用工具库将HTML生成PDF的方法。文章还提到了导出PDF的最佳实践,如项目开始时考虑需求、适应打印样式等。最后给出了示例代码和使用Chrome命令行参数生成PDF的方法。
新型PDF二维码攻击规避检测系统并窃取凭证
FreeBuf早报 | 微软远程客户端漏洞可令攻击者远程执行代码;微软PDF导出功能泄露敏感数据
AI 文档转换利器:PDF/图像一键生成网页表单 | 开源日报 No.661
home-assistant/home-assistant.io home-assistant.io 是 Home Assistant 用户文档的官方网站源码项目。 提供完整的用户文档支持,帮助用户了解和使用 Home...
home-assistant.io 提供 Home Assistant 用户文档,支持本地预览和更新。llama3.np 是基于 NumPy 的 Llama 3 模型,便于文本生成。kan-gpt 是基于 KANs 的 PyTorch 实现,支持多数据集。form-extractor-prototype 可从文档生成网页表单,支持多种格式。android-diia 是乌克兰数字化转型部的开源应用。

微软365 PDF导出功能存在本地文件包含漏洞,可泄露敏感服务器数据
网络犯罪分子利用PDF文件冒充微软等品牌实施钓鱼攻击
PDFiumCore:高效处理 PDF 的 .NET 库
它是一个基于 Google 的 PDFium 引擎开发的 .NET 库,专门用于处理 PDF 文件。它提供了丰富的功能,包括 PDF 渲染、文本提取、页面操作等。在开发中,处理 PDF 文件是一个常见的需求。PDFiumCore 支持将 PDF 页面渲染为图像,可以生成高质量的 PNG、JPEG 等格式的图片。PDFiumCore 支持对 PDF...
PDFiumCore 是基于 Google PDFium 引擎的 .NET 库,支持 PDF 渲染、文本提取和页面操作,适用于多平台。可通过 NuGet 安装,具备高质量图像生成和文档元数据提取功能。
Docnet:轻量高效的 .NET PDF 操作库
你好呀,我是踏红叶。我没进过一线大厂,没创过业,也没写过书,更不是技术专家,所以也没有什么亮眼的title。,而不需要复杂的表单构建或数字签名等高级功能,Docnet 将是你项目中处理 PDF 的不二选择。纯属误打误撞,进入程序员的行列,之后开始了程序员之路。Docnet 更加轻量、高效,且依托于 PDFium 渲染引擎,具有极强的解析与渲染能力。在 .NET...
Docnet 是一个轻量级、高性能的跨平台 PDF 处理库,基于 PDFium 引擎,支持 .NET Standard 2.0。它提供 PDF 文档的读取、解析和渲染功能,适用于 Windows、Linux 和 macOS,核心功能包括文本提取、图像渲染和文档操作,适合简单的 PDF 处理项目。
PaddleOCRSharp增加PDF识别,让你的代码更高效
对于有特殊需求的用户,PaddleOCRSharp提供了丰富的接口和模型库,可以根据具体需求进行定制化和扩展。PaddleOCRSharp凭借其强大的OCR功能和广泛的应用场景,成为了.NET开发者在处理OCR任务时的有力工具。在需要自动化处理表单数据的场景中,PaddleOCRSharp可以识别表单中的文字信息,并将其转化为结构化数据。在需要从图像中提取文字信息的场景中,如从截图、图片或P...
PaddleOCRSharp.PDF扩展库高效提取PDF文本,用户可通过简单代码将PDF转换为图像并应用OCR技术,适用于文档数字化和表单识别,支持多语言识别,提升数据处理效率。