本研究提出了FinTextSim模型,优化了金融文本分析中的信息提取,提升了经济主题的组织清晰度,显著改善了BERTopic在财务文本分析中的表现。
本研究探讨了公众对2023年亚运会电子竞技的看法及其在活动中共同创造的价值。采用加强型BERTopic建模分析,我们发现了五个主要主题,并强调了社交媒体营销在影响公众舆论和推动电子竞技事件方面的战略作用,以及非传统利益相关者在提升国家代表性和表现中的共同创造价值。研究结果表明,电子竞技作为一项运动越来越被主流认可,但仍面临挑战。
该论文首次将BERTopic主题建模技术应用于塞尔维亚语短文本,结果表明在某些预处理情况下,其主题丰富性优于LDA和NMF。这项研究对低资源语言和短文本的处理具有重要意义。
BERTopic Python库现在支持与Hugging Face Hub的集成,用户可以将训练好的主题模型推送和拉取到Hub中,从而更方便地在不同环境中部署和管理模型。此外,BERTopic现在还支持使用safetensors库进行序列化。用户可以使用BERTopic分析客户评论、研究论文或对新闻文章进行分类,从而从文本数据中提取有意义的信息。通过一个例子,展示了如何使用BERTopic监测聊天模型训练数据集中主题的变化,并比较不同数据集中的主题分布。BERTopic Hub集成为用户提供了更快的迭代和高效的模型更新,确保在不同环境中的一致性。
完成下面两步后,将自动完成登录并继续当前操作。