倒排索引关键点普及
原文约800字/词,阅读约需2分钟。发表于: 。现代搜索引擎绝大多数的索引都是基于倒排索引来进行构建的,这源于在实际应用当中,用户在使用搜索引擎查找信息时往往只输入信息中的某个属性关键字,如一些用户不记得歌名,会输入歌词来查找歌名;输入某个节目内容片段来查找该节目等等。面对海量的信息数据,为满足用户需求,顺应信息时代快速获取信息的趋势,聪明的开发者们在进行搜索引擎开发时对这些信息数据进行逆向运算,研发了“关键词——文档”形式的一种映射结构...
倒排索引是全文检索系统的索引方法,现代搜索引擎常用。它通过逆向运算将物品属性信息映射到物品,帮助用户快速定位目标信息。倒排索引由倒排表和词项字典组成,使用压缩算法节约内存。词项字典使用fst算法映射词项字段和词项索引,节省内存空间。