对 ' 分布式 ' 自然语言处理语料库距离度量的表征
原文中文,约200字,阅读约需1分钟。发表于: 。给定两个语料库,我们想要计算它们之间的单一距离度量(例如,Mauve、Frechet Inception)。我们描述了一种抽象质量,称为 ' 分布性 ',用来说明这些度量的特点。我们量化了该质量,并以平均 Hausdorff 距离和能量距离作为非分布性和分布性距离度量的代表例,可以通过与它们比较其他度量来评估它们的分布性程度。
本文提出了一种集合间的距离函数,可用于生成多种集合空间,并用于计算机科学和信息科学领域的复杂数据集的分析。该距离函数是一种度量标准,适用于有限的非空度量空间子集。同时,对Hausdorff距离的推广和对处理模糊集合无限集合的扩展也进行了讨论。