本研究评估了不同文本领域中文档相似性评分的性能,比较了TF-IDF、Word2Vec和BERT嵌入的优缺点。结果显示,TF-IDF依赖于词汇重叠,Word2Vec在跨领域比较中表现优越,而BERT在复杂领域的表现较差,可能是由于缺乏微调。
本文评估了无监督设置中实现文本领域表征分离的挑战,并通过实验强调了差距和影响分离效果的因素。研究提供了实验框架和数据集,是无监督表征分离和文本交叉领域的首次尝试。
本论文研究了可解释人工智能在文本领域的应用,并提出了SIDU-TXT方法。研究发现,SIDU-TXT在情感分析任务中表现更好,但在法律领域的庇护决策中需要进一步研究适用的XAI方法。
完成下面两步后,将自动完成登录并继续当前操作。