InfoQ ·

将AI推理引入Java：企业架构师的实用指南

💡 原文英文，约2500词，阅读约需9分钟。

📝

内容提要

企业系统可在JVM中直接运行ONNX变换器模型，无需Python依赖。准确推理依赖于标记器与模型的对齐，架构师应将标记器视为版本化组件。ONNX Runtime支持CPU和GPU执行，确保可扩展性，简化AI集成，同时保持Java系统的可观察性和安全性。

🎯

🔎

ONNX标准使得企业能够在Java环境中直接运行AI模型，消除了对Python的依赖。这种集成不仅提高了系统的可观察性和安全性，还简化了部署流程，降低了复杂性。企业架构师应关注如何利用这一优势，优化现有的Java系统架构。

在AI推理中，标记器的作用至关重要。它负责将文本转换为模型所需的输入格式，任何不匹配都可能导致推理失败。因此，架构师应将标记器视为版本化组件，确保其与模型的对齐，以提高推理的准确性和可靠性。

ONNX Runtime支持CPU和GPU的灵活执行，使得企业可以根据需求动态调整资源。这种灵活性不仅提高了系统的可扩展性，还确保了在不同环境下的一致性。架构师应设计无状态、线程安全的推理引擎，以优化性能和资源利用。

❓

企业系统可以直接在JVM中运行ONNX变换器模型，无需Python依赖。

准确推理依赖于标记器与模型的对齐，架构师应将标记器视为版本化组件。

ONNX Runtime支持CPU和GPU执行，确保可扩展性，简化AI集成。

推理引擎应保持无状态、线程安全和资源高效，提供良好的可观察性接口。

设计目标包括消除生产中的Python、支持可插拔的标记化和推理、确保CPU-GPU灵活性。

模型和标记器应作为版本化输入，经过验证和测试后在环境中推广，确保可追溯性和版本控制。

🏷️