KDnuggets ·

在浏览器中使用 Transformers.js 进行实用的自然语言处理

💡 原文英文，约4800词，阅读约需18分钟。

📝

内容提要

Transformers.js 是一个在浏览器中运行的自然语言处理库，无需服务器，支持文本分类、零-shot 分类和问答等任务。模型首次下载后可离线使用，功能与 Hugging Face 的 Python 版本相同，使用 ONNX Runtime 执行模型，用户可通过简单的 JavaScript 调用进行推理，适合多种应用场景。

🎯

关键要点

Transformers.js 是一个在浏览器中运行的自然语言处理库，无需服务器。
支持文本分类、零-shot 分类和问答等任务，模型首次下载后可离线使用。
使用 ONNX Runtime 执行模型，功能与 Hugging Face 的 Python 版本相同。
用户可以通过简单的 JavaScript 调用进行推理，适合多种应用场景。
模型下载后会缓存到本地，后续使用不再需要下载。
提供了三种主要的 NLP 任务：文本分类、零-shot 分类和问答。
文本分类可以为输入文本分配标签和置信度分数，常用于情感分析。
零-shot 分类允许用户在运行时定义分类标签，无需训练数据。
问答功能从提供的文本中提取答案，适合文档查询。
Transformers.js 不能进行模型的微调或训练，适用于推理任务。

🔎

延伸解读

浏览器中的自然语言处理优势

Transformers.js 使得在浏览器中运行自然语言处理模型成为可能，用户无需依赖服务器。这种方式不仅减少了延迟，还能保护用户数据隐私，适合对数据安全有高要求的应用场景。

模型下载与缓存机制

首次运行时，Transformers.js 会下载模型并缓存到本地，后续使用时无需再下载。这种机制提高了用户体验，但首次加载时可能会消耗一定的带宽，开发者需考虑用户的网络环境。

使用限制与适用场景

Transformers.js 仅支持推理任务，无法进行模型微调或训练。因此，对于需要自定义模型的应用，仍需在服务器端进行训练并导出 ONNX 格式模型。

性能与选择建议

在选择模型时，开发者应考虑目标用户的设备和网络条件。对于移动设备或慢速连接，建议使用 q4 精度，以减少下载大小，尽量提升用户体验。

❓

延伸问答

Transformers.js 是什么？

Transformers.js 是一个在浏览器中运行的自然语言处理库，无需服务器，支持文本分类、零-shot 分类和问答等任务。

Transformers.js 支持哪些自然语言处理任务？

它支持文本分类、零-shot 分类和问答等任务。

如何在浏览器中使用 Transformers.js 进行文本分类？

用户可以通过调用 pipeline() 函数，传入任务名称和模型 ID 来进行文本分类。

零-shot 分类的工作原理是什么？

零-shot 分类允许用户在运行时定义分类标签，模型根据语言语义理解选择最合适的标签。

Transformers.js 的模型下载后如何使用？

模型首次下载后会缓存到本地，后续使用不再需要下载，可以离线使用。

Transformers.js 是否支持模型的微调或训练？

不支持，Transformers.js 仅用于推理任务，模型的微调或训练需要在其他环境中进行。

🏷️