激情久久久_欧美视频区_成人av免费_不卡视频一二三区_欧美精品在欧美一区二区少妇_欧美一区二区三区的

腳本之家,腳本語言編程技術及教程分享平臺!
分類導航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服務器之家 - 腳本之家 - Python - 編寫簡單的Python程序來判斷文本的語種

編寫簡單的Python程序來判斷文本的語種

2020-05-31 10:49腳本之家 Python

這篇文章主要介紹了編寫簡單的Python程序來判斷語種,代碼非常簡單,主要用到了langid工具包,需要的朋友可以參考下

1.問題的描述

用Python進行文本處理時,有時候處理的文本中包含中文、英文、日文等多個語系的文本,有時候不能同時進行處理,這個時候就需要判別當前文本是屬于哪個語系的。Python中有個langid工具包提供了此功能,langid目前支持97種語言的檢測,非常好用。


2.程序的代碼

以下Python是調用langid工具包來對文本進行語言檢測與判別的程序代碼:
 

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
import langid                             #引入langid模塊
  
def translate(inputFile, outputFile):
  fin = open(inputFile, 'r')                  #以讀的方式打開輸入文件
  fout = open(outputFile, 'w')                 #以寫的方式打開輸出文件
  
  for eachLine in fin:                     #依次讀入每一行
    line = eachLine.strip().decode('utf-8', 'ignore')   #去除每行的首位空格等,并統一轉化成Unicode
    lineTuple = langid.classify(line)           #調用langid來對該行進行語言檢測
    if lineTuple[0] == "zh":               #如果該行語言大部分為中文,則不進行任何處理
      continue
  
    outstr = line                     #如果該行語言為非中文,則準備輸出
    fout.write(outstr.strip().encode('utf-8') + '\n')   #輸出非中文的行,從Unicode轉化成utf-8輸出
  
  fin.close()
  fout.close()
  
if __name__ == '__main__':                      #相當于main函數
  translate("myInputFile.txt", "myOutputFile.txt")

 以上代碼是用來處理一個文本,將不屬于中文的行依次輸出到一個新的文件。

 
3.注意

第9、10行代碼,langid.classify(line)的輸出結果是一個二元組,二元組的第一項表示該文本所屬的語系,如:zh表示中文、en表示英語、等等;二元組的第二項表示該文本中屬于第一項中語系的所占比例。

 

希望對大家有所幫助。

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 污黄视频在线观看 | 国产精品久久久久久久久久久久午夜 | 毛片一级片 | 秋霞a级毛片在线看 | 国产乱淫av一区二区三区 | 免看一级片 | 欧美videofree性欧美另类 | 亚洲欧美爱爱 | 国产合集91合集久久日 | 91精品国产一区二区在线观看 | 欧美艹逼 | 免费男女视频 | 鲁人人人鲁人人鲁精品 | 国产99视频在线观看 | 免费a级毛片大学生免费观看 | 黄色免费网站在线播放 | 久久久久久亚洲综合影院红桃 | 爽爽淫人综合网网站 | 成人乱码一区二区三区不卡视频 | 久久久久国产一区二区三区不卡 | 国产视频在线播放 | 久久最新网址 | 成人黄色一级电影 | 最近日本电影hd免费观看 | 国产精品美女久久久久久不卡 | 免费啪视频在线观看 | 久久96国产精品久久久 | av电影免费观看 | 久国产| 日朝毛片| 一级黄色淫片 | 男女羞羞视频在线观看免费 | 99精品国产一区二区三区 | 一区二区免费看 | 国产在线一级视频 | 国产日韩中文字幕 | videos真实高潮xxxx| 成人免费观看49www在线观看 | 久久久久久久久久久高潮一区二区 | 久久精品中文字幕一区 | 国产日韩免费观看 |