亦数智能(北京)科技有限公司于6月16日在北京亦庄成立,专注于具身智能机器人数据服务。公司由亦庄机器人、星海图及北京屹唐创欣联合创办,目标是建立千万小时级通用数据基座,支持VLA及世界模型训练。2026年世界机器人大会期间,将发布10万小时高质量数据集,并启动“100万小时超高质量真实数据计划”。
Howden的首席数据官Barry Panayi讨论了在快速收购和AI需求下,企业数据架构面临的挑战。他指出,传统数据产品模型在快速变化的环境中显得笨重,建议采用开放的服务层以适应变化。通过标准化数据模型和使用Databricks平台,Howden实现了数据的快速整合和可视化,提升了业务效率,减少了手动对账时间。未来的关键在于设计数据服务而非产品。
千百度(1028.HK)收购AI数据服务商本原智数,形成“鞋履+人工智能数据”双主业,旨在提供高质量数据以满足AI行业需求。交易后,本原智数将独立运营,继续为客户服务。管理层认为,高质量数据是AI时代的关键基础设施,将为股东创造长期价值。
AI行业对真实物理世界数据的需求不断增加,尤其是在训练具身智能和世界模型方面。出行平台如如祺出行通过数据采集车在提供出行服务的同时,收集高质量的交互数据,形成完整的因果链条。这些数据不仅支持AI模型的训练,还能实现商业化,推动行业发展,出行平台逐步转型为综合数据服务商,成为AI理解物理世界的重要数据来源。
Robo.ai Inc.计划在中东和亚洲扩展智能数据业务,推进多语言数据标注,开发阿拉伯语言数据集,并与当地制造企业合作,以满足AI模型训练需求。
SwanLake 是基于 Rust 的 Arrow Flight SQL Server,结合 DuckDB 和 DuckLake,旨在提供可部署和可观测的数据服务。它通过五层架构实现高效的查询和会话管理,支持对象存储和元数据统一管理,提升系统的可观测性和性能。
PowerRAG(社区版)是一个开源平台,基于RAGFlow,提供集成数据服务引擎,支持多引擎文档处理、混合检索和结构化信息提取,适用于企业知识问答和合同提取等场景,利用OceanBase的多模态数据库实现统一数据访问。
随着企业在Kubernetes环境中部署AI和数据密集型应用,标准的容器存储接口(CSI)已无法满足需求。Nutanix数据服务为Kubernetes提供解决方案,支持同步和异步数据复制,以确保数据保护和业务连续性,特别是在金融和医疗等受监管行业。
机器之心数据服务已上线,提供高效稳定的数据获取服务,帮助用户轻松获取所需数据。
机器之心数据服务现已上线,提供高效稳定的数据获取,简化爬取流程。
机器之心数据服务现已上线,提供高效稳定的数据获取,简化数据爬取流程。
机器之心数据服务现已上线,提供高效稳定的数据获取服务,简化了数据爬取流程。
机器之心数据服务已上线,提供高效稳定的数据获取,简化数据爬取流程。
完成下面两步后,将自动完成登录并继续当前操作。