python在安装好后,需要安装很多包,本文介绍了博主机器学习相关配置。若在安装过程中pip出现问题及更新pip源,请参考博主的这篇文章。《python中的pip安装问题》
在使用之前,需要先通过执行python文件的方式下载nltk的工具和语料库,全部包大小几个G,可以根据自己需要自行选择下载的语料库和模型工具包。
import nltk nltk.download()执行上述python文件后,就会启动启动nltk下载器,显示界面如下图。 我们根据自己需要点击自行下载,要自己设置下载目录(Download Directory)。同时在调用的时候,要指定文件的下载路径哦!实例代码如下:
import nltk nltk.data.path.append('e:/dataset/nltk') # 执行文件路径 # 词性标注 text = nltk.word_tokenize('what does the fox say') print(text) print(nltk.pos_tag(text))下载Stanford CoreNLP文件和中文语言包访问stanford官网,点击download https://stanfordnlp.github.io/CoreNLP/ 分别下载,下载界面如图 下载后的文件如下图: 解压corenlp。重命名为Stanford CoreNLP,并将中文语言包.jar放入文件夹内。 在python文件中使用,需要注明安装目录。
from stanfordcorenlp import StanfordCoreNLP nlp = StanfordCoreNLP(r'D:\stanfordNLP 3.9.2\Stanford CoreNLP', lang='zh')Hanlp原生态是支持java的,python安装步骤如下:
安装JDK安装Microsoft Visual C++ Build Tools或者安装组件库(这里博主选择后者)安装pyhanlp安装JDK这里就不介绍了,安装好后配置下环境变量即可。可以参考 https://jingyan.baidu.com/article/6dad5075d1dc40a123e36ea3.html 安装组件库 在此网站找到对应的库 https://www.lfd.uci.edu/~gohlke/pythonlibs/ 看清自己的python版本和电脑是32位还是64位的,对应下载。 然后安装,后面跟的是文件的路径地址。
pip install C:\Users\Think\Desktop\JPype1-0.6.3-cp36-cp36m-win_amd64.whl安装Hanlp
pip install pyhanlp测试Hanlp安装是否成功:可以在python的shell中输入下面命令,如果没有报错,就安装成功了。
from jpype import * startJVM(getDefaultJVMPath(), "-ea") java.lang.System.out.println("Hello World") shutdownJVM()截图 第一运行Hanlp的时候,会自动下载数据哦。在控制台会看到他的下载链接,其中data数据较大,可以在使用下面的链接在浏览器下载,并放到python的目录下D:\python\python36\Lib\site-packages\pyhanlp\static\data-for-1.7.3.zip 运行简单代码:
from pyhanlp import * print(HanLP.segment("今天开心了吗?"))安装pyltp的时候,使用 pip 安装,各种出错,这里提供一种方法 1.下载pyltp-0.2.1-cp36-cp36m-win_amd64.whl文件,百度云,提取码:1gki 2.切换到下载文件的目录,执行 pip install pyltp-0.2.1-cp36-cp36m-win_amd64.whl 3. 执行
pip install pyltp入门使用及参考: 安装和使用pyltp 官方文档