DEV Community ·

出现频率最高的K个单词

💡 原文英文，约500词，阅读约需2分钟。

📝

内容提要

给定一个包含N个单词的数组和整数K，返回按频率从高到低排序的K个最常见单词。如果频率相同，则按字典顺序排列。使用哈希映射记录频率，并用最大堆存储单词和频率对，通过自定义比较器确保高频优先，频率相同时按字典序。时间复杂度为O(N log K)。

🎯

关键要点

给定一个包含N个单词的数组和整数K，返回按频率从高到低排序的K个最常见单词。
如果两个单词的频率相同，则按字典顺序排列。
使用哈希映射记录每个单词的频率。
使用最大堆存储单词和频率对，通过自定义比较器确保高频优先。
时间复杂度为O(N log K)。
示例输入1: 6 2，输出: i love。
示例输入2: 8 3，输出: is the blue。
代码中使用unordered_map存储单词频率，使用优先队列维护最大堆。
提取前K个元素以获取K个最常见的单词。
时间复杂度分析包括O(n)和O(n log k)。

❓

延伸问答

如何找到出现频率最高的K个单词？

通过使用哈希映射记录每个单词的频率，并利用最大堆存储单词和频率对，提取前K个元素即可。

如果两个单词的频率相同，如何处理？

如果频率相同，则按字典顺序排列，字典序较小的单词优先。

这个算法的时间复杂度是多少？

时间复杂度为O(N log K)，其中N是单词总数，K是要返回的单词数量。

如何实现最大堆来存储单词和频率对？

使用优先队列并自定义比较器，确保高频单词优先，频率相同时按字典序排列。

能否给出一个示例输入和输出？

示例输入：6 2，输出：i love；示例输入：8 3，输出：is the blue。

如何使用哈希映射记录单词频率？

遍历单词列表，首次出现的单词频率初始化为1，已存在的单词频率加1。

🏷️

标签

哈希映射字典顺序最大堆自定义比较器频率

➡️

继续阅读

帮助K-12教育工作者提升实用AI技能
OpenAI Academy与沃尔顿家族基金会合作，将于夏季举办K-12教育者AI技能研讨会，旨在帮助教师和管理者有效利用AI工具。研讨会将吸引1600多...
智谱拟配售新H股募资约314亿港元，今日开盘涨超9%
智谱华章科技股份有限公司与中金公司签订配售协议，计划以每股1588港元配售最多1978万股新H股，募资约314.11亿港元。配售后大股东持股比例将下降，资...
三星开始量产数据中心级PM1763固态硬盘单盘16TB 读取速度高达28,400MB/秒
三星开始量产PM1763数据中心级固态硬盘，容量最高可达16TB，读取速度为28,400MB/s，写入速度为21,900MB/s。该硬盘采用PCIe 6....
LineageOS推出基于浏览器的快捷刷机工具简化刷机流程帮助用户轻松刷机
LineageOS推出了一款基于浏览器的快捷刷机工具，简化了刷机流程，支持ADB、Fastboot和Odin协议，但并非所有安卓设备均可使用。用户需授权网...
华为天才少年被质疑抄代码，DeepSeek面试翻车，谁的错？
华为天才少年李博杰在面试DeepSeek时被指控抄袭代码，感到被羞辱并终止面试。此事件引发热议，投资人指责李博杰失联，李博杰则反击称投资人未履行承诺。李博...
马斯克用十四个孩子回应死亡，硅谷永生派看完沉默了
马斯克认为死亡有其社会益处，强调出生率下降才是文明的真正威胁。他通过生育十四个孩子，展示了用新生代替永生的理念。他批评硅谷对抗衰老的思维，认为延长寿命可能...