本文實例講述了Python中文分詞實現方法。分享給大家供大家參考,具體如下:
在Python這pymmseg-cpp 還是十分方便的!
環境 ubuntu10.04 , python2.65
步驟:
1 下載mmseg-cpp的源代碼 http://code.google.com/p/pymmseg-cpp/
2 執行:
1
2
3
|
tar -zxf pymmseg-cpp*. tar .gz // 解壓后得到pymmseg 目錄 cd pymmseg\mmseg-cpp python build.py #生成 mmseg.so文件 |
3 將 pymmseg 目錄復制到 /usr/local/lib/python2.6/dist-packages 中
4 測試有沒有成功:
test.py文件:
1
2
3
4
5
6
|
from pymmseg import mmseg mmseg.dict_load_defaults() text = '今天的天氣真好啊,我們一起出去玩一下吧' algor = mmseg.Algorithm(text) for tok in algor: print '%s [%d..%d]' % (tok.text, tok.start, tok.end) |
希望本文所述對大家Python程序設計有所幫助。