學生資料集 / Dataset: Student Performance
💡
原文中文,约2400字,阅读约需6分钟。
📝
内容提要
这篇文章介绍了一个修改自Paulo Cortez的学生表现数据集的资料集,用于教学。数据集包括了来自葡萄牙两所中学的学生成绩以及其他相关信息。为了教学需求,成绩属性被舍弃,只以学校作为目标属性。数据集共有32561个训练样本,16281个测试样本,以及41个未知数据。文章提到这个数据集可以用于预测、分群、热点分析等机器学习分析,但需要注意教学环境是否能承载这么大的数据量。最后,作者提出了对于这个数据集可以进行哪些分析方向的问题,欢迎留言回答。
🎯
关键要点
- 這篇文章介紹了一個修改自Paulo Cortez的學生表現數據集,用於教學。
- 數據集來自葡萄牙兩所中學,包含學生的成績和其他相關信息。
- 為了教學需求,數據集舍棄了成績屬性,僅以學校作為目標屬性。
- 數據集包含32561個訓練樣本,16281個測試樣本,以及41個未知數據。
- 數據集無缺失值,包含多種屬性,如性別、年齡、家庭狀況等。
- 該數據集可用於預測、分群、熱點分析等機器學習分析。
- 在教學中需注意環境是否能承載如此大的數據量。
- 作者邀請讀者分享對於數據集分析方向的興趣,包括預測、分群、熱點分析等。
➡️