用数据分析项目,带你走进成语里的数字世界
💡
原文中文,约5900字,阅读约需14分钟。
📝
内容提要
本文分析了成语中数字词的使用情况,发现约8.2%的四字成语含有数字,且数字的组合和位置存在规律。研究表明,数字“一”的使用频率最高,奇数在成语中更受欢迎,揭示了成语的文化内涵。
🎯
关键要点
- 本文分析了成语中数字词的使用情况,约8.2%的四字成语含有数字。
- 数字“一”的使用频率最高,奇数在成语中更受欢迎。
- 研究中提取了成语中的数字词,并分析了其组合和位置规律。
- 成语中绝大多数为四字成语,非四字成语对结果影响不大。
- 数字词的定义包括表达数字含义的词,研究中剔除了不符合条件的词。
- 在29502个四字成语中,2431个带有数字含义,数字词出现频率的规律为:一遥遥领先。
- 成语中数字词的组合模式显示,奇数和偶数的使用存在文化偏好。
- 成语数字词的位置分析表明,数字词通常出现在第1个或第3个字。
- 数字增大的情况在成语中占多数,减小的情况次之。
- 成语中的奇数使用频率高于偶数,尤其在1号和3号位上。
- 数据分析揭示了成语中的文化内涵,值得语言学者深入研究。
➡️