Magika 1.0:基于Rust和AI的更智能、更快速的文件检测
谷歌发布了Magika 1.0,这是其开源文件类型检测系统的重大重写。新版本利用AI支持200多种文件类型,提升了速度和安全性。Magika 1.0能够识别多种文本文件类型,如Dockerfiles和Jupyter Notebooks,并能区分相似格式。谷歌工程师创建了超过3TB的数据集来训练AI模型,确保高达99%的精确度。新核心基于Rust,性能显著提升,能够在单核CPU上每秒处理数百个文件。
原文英文,约700词,阅读约需3分钟。