传统量化研究依赖行情和基本面数据,而另类数据(如招聘公告、卫星图像、社交媒体等)提供了未被充分定价的信息。这类数据需要自行采集和处理,具有高时效性和细粒度。文章探讨了如何有效利用这些数据,包括数据的定义、分类、工程化处理及其与传统数据的区别,强调了另类数据在投资决策中的价值和潜在风险,以及如何将其整合进特征库以支持量化研究。
特征库是集中管理数据特征的平台,起源于2017年Uber,旨在简化数据管道。它们在机器学习和AI中变得重要,支持实时数据特征,促进特征重用,避免重复工作。流行工具包括Feast、Tecton和Google Cloud Vertex AI特征库。
该文介绍了一种用于遥感图像目标检测的半监督学习方法,使用标记的分布数据动态构建类别特征库,并通过与特征库中的条目进行比较计算 OOD 分数,有效过滤 OOD 样本。实验结果表明,该方法具有卓越的性能和效果。
完成下面两步后,将自动完成登录并继续当前操作。