小红花·文摘

将jieba-rs的速度提升至2.4倍

Messense Lv ·

jieba.NET是jieba中文分词的.NET版本，支持精确、全模式和搜索引擎模式分词，可添加自定义词典和繁体分词。算法基于前缀词典和动态规划查找最大概率路径。支持并行分词和与Lucene.NET的集成。提供其他词典文件和词频统计功能。速度较快。

jieba中文分词的.NET版本

dotNET跨平台 ·

Jieba.NET是一个基于HMM的中文分词库，支持精确、全和搜索引擎三种分词模式。使用简单，可通过NuGet包管理器安装。可添加自定义词典提高准确性和效率。适用于.NET开发者。

.NET 中使用 Jieba.NET 实现中文分词匹配

dotNET跨平台 ·

首先下载Anaconda和PyTorch，安装jieba，使用jieba分词，使用nn.Embedding训练词向量，实现代码的运行。

机器学习python环境搭建 - 蝈蝈俊

蝈蝈俊 ·

以前做搜索的时候，大部分时间用sphinx、postgreSQL，后来用ES这类java的，但都比较重，要配置和使用需要好一段时间才能从零run起来。最近正好有个场景，需要快速弄个搜索出来，正好python3里英雄众多，现成的东西不少，结合一下就完成了。下面是一些记录，代码整理后也会放到github中。

利用python,jieba,bm25,django,nginx半小时打造一个基本可用的中文全文检索的搜索引擎

Blog on 54 CHEN ·

其实很早以前就想搞一套完备的标签云架构了，迫于没有时间(其实就是懒)，一直就没有弄出来完整的代码，说到底标签对于网站来说还是很重要的，它能够对一件事物产生标志性描述，通常都会采用相关性很强的关键字，这样不仅便于检索和分类，同时对网站的内链体系也是有促进作用的。最近疫情的关系一直在家里呆着，闲暇时和一些学生聊天的时候，人家问：你说你一直在写博客，那你到底在写一些什么内容的文章呢？我竟然一时语塞...

Python3.7+jieba(结巴分词)配合Wordcloud2.js来构造网站标签云(关键词集合)

刘悦 ·