jieba.NET是jieba中文分词的.NET版本,支持精确、全模式和搜索引擎模式分词,可添加自定义词典和繁体分词。算法基于前缀词典和动态规划查找最大概率路径。支持并行分词和与Lucene.NET的集成。提供其他词典文件和词频统计功能。速度较快。
Jieba.NET是一个基于HMM的中文分词库,支持精确、全和搜索引擎三种分词模式。使用简单,可通过NuGet包管理器安装。可添加自定义词典提高准确性和效率。适用于.NET开发者。
以前做搜索的时候,大部分时间用sphinx、postgreSQL,后来用ES这类java的,但都比较重,要配置和使用需要好一段时间才能从零run起来。 最近正好有个场景,需要快速弄个搜索出来,正好python3里英雄众多,现成的东西不少,结合一下就完成了。下面是一些记录,代码整理后也会放到github中。
其实很早以前就想搞一套完备的标签云架构了,迫于没有时间(其实就是懒),一直就没有弄出来完整的代码,说到底标签对于网站来说还是很重要的,它能够对一件事物产生标志性描述,通常都会采用相关性很强的关键字,这样不仅便于检索和分类,同时对网站的内链体系也是有促进作用的。最近疫情的关系一直在家里呆着,闲暇时和一些学生聊天的时候,人家问:你说你一直在写博客,那你到底在写一些什么内容的文章呢?我竟然一时语塞...
完成下面两步后,将自动完成登录并继续当前操作。