The New Stack ·

Kumo的新基础模型用简单英语查询取代了数月的数据科学工程

💡 原文英文，约1000词，阅读约需4分钟。

📝

内容提要

Kumo公司推出了KumoRFM-2，这是一个专为企业关系数据设计的基础模型，能够直接处理结构化数据，无需特征工程或模型训练。该模型在多个基准测试中优于传统监督学习模型，支持自然语言查询，适用于大规模数据集，提升了预测准确性，并能应对噪声和缺失数据。

🎯

🔎

KumoRFM-2模型的推出，标志着企业数据处理的重大进步。它能够直接处理结构化数据，省去了繁琐的特征工程和模型训练，适合各种规模的企业。企业可以通过自然语言查询获取预测结果，降低了数据科学的门槛，使得非技术人员也能参与数据分析。

与传统的监督学习模型相比，KumoRFM-2在多个基准测试中表现更佳，尤其是在处理复杂的关系数据时。传统模型往往需要将多表数据扁平化，而KumoRFM-2能够保留数据之间的关系，提供更准确的预测。这种能力使其在数据分析领域具有明显的竞争优势。

尽管KumoRFM-2在处理噪声和缺失数据方面表现出色，但仍需注意其在特定应用场景下的局限性。模型的性能可能受到数据质量和结构复杂性的影响，因此在实际应用中，企业应确保数据的准确性和完整性，以发挥模型的最大效能。

❓

KumoRFM-2是一个专为企业关系数据设计的基础模型，能够直接处理结构化数据，无需特征工程或模型训练。

KumoRFM-2能够处理超过5000亿行数据，支持自然语言查询，直接在连接的表的图上工作。

KumoRFM-2在多个基准测试中优于传统监督学习模型，提升了预测准确性，并能处理噪声和缺失数据。

KumoRFM-2不需要特征工程或模型训练，用户可以直接用自然语言查询，模型自动处理数据。

在Stanford RelBench v1基准测试中，KumoRFM-2比其前身提高了10%，并在分类和回归任务中超越了最强的监督学习模型5%。

KumoRFM-2通过聚合信息填补缺失数据，能够有效应对噪声和结构退化。

🏷️