您现在的位置是:首页 >其他 >写爬虫代码前检测环境网站首页其他
写爬虫代码前检测环境
在day12
下创建一个名为07-python安装三方模块
的代码文件
了解html的一些标签后,我们来装环境、写爬虫代码。由于环境可能不太统一,我们需要检查一下。python安装,创建Python项目时,强调了虚拟环境
,它有一个文件夹叫做venv
Pycharm右下方有个Terminal(中文叫做终端),点击进去如果如下图表示环境没问题
如果是以下两种情况,就说明我们的环境有问题!!!
第一种情况:
第二种情况:
我们需要知道Windows系统由这两部分组成:
(1)Win + R 打开 CMD
(2)开始菜单右键,有个叫做终端或Powershell的东西,打开:
也就是说,没有vevn的友友打开的是Powershell,正常打开的应该是cmd,我们来改一下
File --> Setttings --> Tools --> Terminal
紧接着我们关闭Local之后再打开Terminal
回忆之前讲字符串时,所有中文都被打印出来了,并且查看了所有中文的拼音,实现给所有中文标注拼音的是我们安装的三方模块
,叫做pypinyin
。(当时pypinyin是在Settings里面非标准化安装的)
python中模块分为三方模块和内置模块。
内置模块有time模块、我们在讲while循环时的random模块……内置模块是别人实现的功能,我们直接可以使用。爬虫涉及到的基本都是三方模块。
Python安装三方模块,相当于是从网上下载插件,python的三方模块全部存储在模块仓库。那我们如何安装三方模块呢?打开浏览器,搜索pypi
也就是python的模块仓库
打开官网页面为:
以搜索三方模块pypinyin为例,
如果项目简介没有介绍怎么使用就去官方文档界面
python默认的官方仓库服务器在国外,如何快速的从国外服务器安装模块?修改镜像源
,国内有很多像豆瓣、阿里云、清华云等与国外服务器实时同步的服务器,我们可以将镜像源修改成国内服务器镜像源。
1、python修改镜像源
如果是windows系统,就在Terminal中复制下面代码然后回车。
pip config set global.index-url https://pypi.douban.com/simple
windows没有内置的python系统,
mac/linux系统
内置有python2,但是又装了python3意味着电脑里既有python2版本也有python3版本,所以怎样调用python3呢?关键在pip,pip代表python2
,pip3代表python3
如果是mac/linux系统,同理(把pip改为pip3)
pip3 config set global.index-url https://pypi.douban.com/simple
2、Python安装三方模块
方法一:使用命令安装
windows系统:
pip install 模块名 --> 就在Terminal中复制下面代码然后回车。
pip install requests
mac、linux系统:
pip3 install 模块名 --> 操作同理(把pip改为pip3)
pip3 install requests
方法二:使用Pycharm自带的可视化界面安装
settings --> project:项目名 --> python interpreter --> +
--> 搜索模块名 > install package
(pip我这里已经安装好了,友友们直接搜索requests
并install即可)
下图表示安装成功