資料探勘技術於圖書館讀者資料分析與應用 / Analysis and Application of Data Mining Technology in Library Readers' Data

原文约1600字,阅读约需4分钟。发表于:

這是中華民國圖書館學會 110 度圖書館智慧服務與創新學習研習班的上課內容。在此做個記錄。 課程大綱 / Outline 本課程是由三個主題所構成。每個主題都有對應的教材檔案與學習任務。這三個主題個別是: Chapter 1. 神鳥領航:Weka簡介  Chapter 2. 看穿因果:熱點分析 Chapter 3. 洞悉未來:時間序列預測 以下是這三個主題的資料。 Chapter 1. 神鳥領航:Weka簡介 / Introduce to Weka Google投影片線上檢視:https://docs.google.com/presentation/d/1gzoWOMkB4RpUsZ9q2F7oWQHsG1uof1WkMWfWaDUyUDU/edit?usp=sharing  Power Point格式備份:GitHub、 Google Drive、 One Drive、 Mega、 Box、 MediaFire、 SlideShare 本章會介紹的內容包括: 認識Weka Weka的下載、安裝與開啟 實機操作:Weka的屬性分析 本章會用到的教材如下: Weka軟體下載:3.8.1 (Windows 64位元) 其他版本下載:支援Windows、Mac OS、Linux版本。Windows版本請下載includes Oracle's Java VM的檔案 請注意你的電腦是64 bit還是32 bit,如何判斷作業系統版本請看此說明。 Mac OS如何安裝Weka:解決「遇上無法打開「...」,因為它來自未識別的開發者。」的問題。 LibreOffice下載 / Download LibreOffice https://zh-tw.libreoffice.org/download/libreoffice-still/  資料集 / Dataset 借閱逾期讀者資料集2020 快問快答 / Quiz 快問快答:認識讀者 這是小測驗喔,完成實作的話就會看到解答了。 Chapter 2. 看穿因果:熱點分析 / Hotspot Analysis Google投影片線上檢視:https://docs.google.com/presentation/d/1_TI_a13WhFUG_GglneVXIdYeTJAf3aq9hryPY5TeqFI/edit?usp=sharing Power Point格式備份:GitHub、 Google Drive、 One Drive、 Mega、 Box、 MediaFire、 SlideShare 本章會介紹的內容包括: 什麼樣的讀者容易借書逾期? 實機操作:熱點分析 熱點分析簡介 看穿因果:深入數據因果之下 本章會用到的教材如下: 資料集 / Dataset 借閱逾期讀者資料集2020 轉換工具:HotSpot分析結果轉換工具 學習任務 / Quiz & Learning Sheet   快問快答:什麼讀者不逾期 學習單:熱點分析 Chapter 3. 洞悉未來:時間序列預測 / Time Series Prediction Google投影片線上檢視:https://docs.google.com/presentation/d/1iBT4_UZDq_BVbEDw3XHyTH6j04XBIkfl3qd39R12AFo/edit?usp=sharing Power Point格式備份:GitHub、 Google Drive、 One Drive、 Mega、 Box、 MediaFire、 SlideShare 本章會介紹的內容包括: 預測下個月的入館人次 實機操作:時間序列預測 時間序列預測簡介 實機操作:更換演算法 多變項時間序列預測 結語:時間序列預測的下一步 本章會用到的教材如下: 資料集 / Dataset 入館人次6月到7月歷史資料 轉換工具:試算表轉ARFF轉換工具 入館人次1月到8月歷史資料 學習任務 / Learning sheet 學習單:時間序列預測 小結 / In closing 一開始設計這些內容的時候,我是打算在三小時內教完。但實際上三小時只講到Chapter 2的一半,而且沒有足夠多的時間讓大家實作,實在是有點可惜。現在回頭看了看當初的規劃,這些內容應該可以重新安排成6週、每週2小時的課程內容,並讓學生可以換個資料來做更多的實作。 https://blog.pulipuli.info/2023/05/explainable-text-mining.html  附帶一提,後來熱點分析的部分內容演化成解釋性文字探勘的文字雲了。這邊的文字雲就不是單純用詞頻來顯示詞彙的大小,而是用跟熱點分析相關的子群組探勘的評估指標來呈現,使得最後結果更具可解釋性。 總之,希望對大家有所幫助。這篇記錄就到此為止了。 文章最後的提問是:你對那個主題比較感興趣呢? 1. 神鳥領航:Weka簡介 2. 看穿因果:熱點分析 3. 洞悉未來:時間序列預測 4. 解釋性文字探勘的文字雲 5. 嗯...沒什麼看法 歡迎在下面留言喔!

本文介绍了中华民国图书馆学会的一门课程,涵盖了数据挖掘技术在图书馆读者数据分析和应用中的应用。课程分为三个主题,分别是Weka简介、热点分析和时间序列预测。作者建议将这些内容重新安排成为6周的课程,每周2小时,并让学生可以使用不同的数据进行更多的实践。

資料探勘技術於圖書館讀者資料分析與應用 / Analysis and Application of Data Mining Technology in Library Readers' Data
相关推荐 去reddit讨论