本文介绍了2020年「大数据基本算法」系列课程中的「文本探勘实作」课程内容,包括投影片、大纲、教材和学习单。课程目标是比较不同类型文本的词汇差异规则,并建立预测不同类型文本的分类器。教材使用了Jieba-JS断词分析器和Weka软件。学习单提供了一系列数据集供实际应用。课程分为使用Jieba-JS进行中文断词、文本字符串向量化和在Weka中应用三个部分。还提到了在Colab中使用Python重新实现整个过程的「解释性文本探勘」课程。本文提供了丰富的资源和课程内容,帮助读者学习文本探勘技术,发现规律并进行分析。
本文介绍了2020年「大数据基本算法」系列课程中的一门课程,名为「比较性分析:关联规则探勘之热点分析」。课程提供了投影片、投影片大纲和相关教材,内容包括关联规则分析、热点分析的应用以及与分群和分类的整合。课程目标是让读者了解如何使用热点分析描述目标属性,并让分群和分类结果更易解释。教材中使用了自制套件和不同数据集。最后,读者被邀请在留言区分享对本次教学中哪个主题的兴趣。
本文介绍了2020年的“大数据基本算法”系列课程中的“预测性分析:分类”课程内容,包括投影片、投影片大纲和相关教材。课程目标是建立可解释的分类预测模型,并使用模型预测未知案例。强调机器学习在处理真实世界未知数据中的重要用途。鼓励读者分享对分类中哪个主题更感兴趣的意见。希望这些教材能帮助对机器学习和预测性分析感兴趣的朋友取得进步。
完成下面两步后,将自动完成登录并继续当前操作。