本研究计算公开健康调查问题之间的语义相似性,以促进基于调查的个人生成健康数据(PGHD)的标准化。构建了包含1758对问题的语义文本相似性数据集,并采用SBERT-LaBSE算法进行比较,显示出其在提高跨语言调查数据语义互操作性方面的潜力。
完成下面两步后,将自动完成登录并继续当前操作。