小红花·文摘

本研究计算公开健康调查问题之间的语义相似性，以促进基于调查的个人生成健康数据（PGHD）的标准化。构建了包含1758对问题的语义文本相似性数据集，并采用SBERT-LaBSE算法进行比较，显示出其在提高跨语言调查数据语义互操作性方面的潜力。