腊月的季节

jieba分词

分词

1、li=jieba.cut(“我来到襄阳三十六中”,cut_all=True) li是可循环对象 #全模式
2、li=jieba.cut(“我来到襄阳三十六中”,cut_all=False) #精确模式
3、li=jieba.cut(“我来到襄阳三十六中”) #默认是精确模式
4、li=jieba.cut_for_search(“我来到襄阳三十六中”)#搜索引擎模式
5、添加自定义词典
jieba.load_userdict(file_name)
词典格式和dict.txt一样,一个词占一行;每一行分三部分,一部分为词语,另一部分为词频,最后为词性(可省略),用空格隔开
示例:

1
2
3
4
5
6
云计算 5
李小福 2 nr
创新办 3 i
easy_install 3 eng
好用 300
韩玉赏鉴 3 nz

7、difflib比较文本相似度模块

热评文章