💡
原文英文,约2600词,阅读约需10分钟。
📝
内容提要
Apache SeaTunnel中的Embedding转换插件将文本数据转换为向量表示,支持多种模型提供者和API集成。本文介绍了插件的配置选项,如模型提供者、API密钥和自定义配置,旨在帮助读者在实际项目中应用这些概念。
🎯
关键要点
- Apache SeaTunnel中的Embedding转换插件将文本数据转换为向量表示,支持多种模型提供者和API集成。
- 插件的配置选项包括模型提供者、API密钥和自定义配置,旨在帮助读者在实际项目中应用这些概念。
- Embedding转换插件利用嵌入模型将文本数据转换为向量表示,适用于多个领域。
- 模型提供者包括DOUBAO、QIANFAN和OPENAI,用户也可以选择CUSTOM以实现自定义嵌入模型的请求和检索。
- API密钥用于验证对嵌入服务的请求,通常由模型提供者在注册时提供。
- 插件支持自定义配置选项,如自定义请求头和请求体,以满足特定模型的需求。
- 示例配置展示了如何使用Embedding插件进行批处理,包含数据源和转换设置。
- 配置示例中定义了输入字段与输出向量字段的映射,确保插件能够正确处理文本字段并存储结果向量。
- 插件输出经过验证,确保所有字段符合预期的规则和类型。
➡️