本研究提出了一种语言无关的模型,用于评估维基百科多语言版本的来源可靠性。该模型利用编辑活动数据预测争议性话题,发现领域存在时间是最具预测性的特征,F1宏观得分约为0.80,显示出模型的适应性和重要性。
通过使用Kialo创建的数据集,研究发现ChatGPT在争议性话题上表现良好,尤其是在经济方面。然而,它存在对右倾意识形态的隐性倾向,需要增加更多的调节。在领域知识方面,除了哲学类别外,ChatGPT在跟上人类集体知识水平方面表现良好。与人类答案相比,Bing AI的信息来源在倾向中立方面略有增加。
完成下面两步后,将自动完成登录并继续当前操作。