Pycharm安装scrapy及初始化爬虫项目的完整步骤

一）安装scrapy：

1、打开cmd命令窗口，输入：pip install Scrapy。

2、安装成功之后会显示下面字符，表示未将scrapy设置到环境变量。

3、配置环境变量：右键我的电脑–>属性–>高级设置—>环境变量—->系统变量中的Path—>编辑—>添加—>将上文中黄色的路径添加到环境变量即可。

4、scrapy安装完毕。

二）创建一个scrapy爬虫项目：

1、创建一个普通的Pycharm项目，然后找到下面的terminal

Pycharm安装scrapy及初始化爬虫项目的完整步骤

2、输入命令scrapy startproject 模块名称(可以自己随便起，我以名为mine为例)，成功之后你会发现自己的项目中多了一个mine的包文件。

Pycharm安装scrapy及初始化爬虫项目的完整步骤

3、上述操作成功后终端会显示下图文字：此时我们输入cd那条命令。进入目标文件。

Pycharm安装scrapy及初始化爬虫项目的完整步骤

4、这时就可以创建爬虫目标文件啦，

输入scrapy genspider 爬取名网站域名

1、爬取名是自己随便起的，比如我要爬百度那么我就可以起名为baidu

2、网站域名就是去掉 https:www. 剩下的部分，以博客园的为例：

网址为：https://www.cnblogs.com/

域名为 cnblogs.com

2和3操作截图：

Pycharm安装scrapy及初始化爬虫项目的完整步骤

5、此时我们会在目录里看见一个新的py文件：里自动生成如下代码：

Pycharm安装scrapy及初始化爬虫项目的完整步骤

三）开启pycharm对scrapy框架的调试功能：

由于pycharm没有创建scrapy框架的模块，所以我们想调试scrapy程序时要自己写一个小脚本来开启pycharm对scrapy的调试功能。

1、在与mine包同级条件下创建一个main.py文件：

Pycharm安装scrapy及初始化爬虫项目的完整步骤

2、mine文件将一下代码赋值进去：

import os
import sys
 
from scrapy.cmdline import execute
 
sys.path.append(os.path.dirname(os.path.abspath(__file__)))
execute(["scrapy", "crawl", "cnblog"])  # 第三个参数为自己创建的那个爬取的名称

这样就大功告成啦！

总结

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

Pycharm安装scrapy及初始化爬虫项目的完整步骤

目录

一）安装scrapy：

二）创建一个scrapy爬虫项目：

三）开启pycharm对scrapy框架的调试功能：

总结

评论(0)

提示：请文明发言取消回复

作者信息

本站推荐

OpenCV全攻略C++计算机视觉项目实践含源码

何伟元素流瑜伽系统基础师资培训67GB

移动端APP渗透测试（价值199元）网络攻防

Python高级编程实战及应用[前后端开发]

清栀老师AI风景短视频剪辑自学课入门到进阶

阿炳老师·2026Coze平台搭建智能体课程

热门资源

苹果cms海螺影视模板/大橙子模板/仿B站模板/v7模板/带手机移动端+详细安装使用说明

【已测】修复版H5骰子微信竞猜游戏骰宝免公众号版修复登录ID相同完美全套源码对接免签支付

网页游戏卧龙吟一键服务端加远程工具带架设教程

邪风曲单机版 2D回合制网络游戏源码一键安装即玩服务端公益服+GM工具

完整可用版本去水印小程序源码带教程源码

仙侠H5【苍穹剑诀】一键即玩端+授权后台+外网教程

Pycharm安装scrapy及初始化爬虫项目的完整步骤

目录

一）安装scrapy：

二）创建一个scrapy爬虫项目：

三）开启pycharm对scrapy框架的调试功能：

总结

评论(0)

提示：请文明发言 取消回复

相关文章

作者信息

本站推荐

热门资源

提示：请文明发言取消回复