当前位置：中华考试网 >> python >> python爬虫 >> 文章内容

python爬虫利器：Scrapyrt的安装(Scrapy分布式)

来源：中华考试网 [2020年10月12日] 【大中小】

　　crapyrt为Scrapy提供了一个调度的HTTP接口，有了它，我们就不需要再执行Scrapy命令而是通过请求一个HTTP接口来调度Scrapy任务了。Scrapyrt比Scrapyd更轻量，如果不需要分布式多任务的话，可以简单使用Scrapyrt实现远程Scrapy任务的调度。

　　1. 相关链接

　　GitHub：https://github.com/scrapinghub/scrapyrt

　　官方文档：http://scrapyrt.readthedocs.io

　　2. pip安装

　　这里推荐使用pip安装，命令如下：

　　pip3 install scrapyrt

　　接下来，在任意一个Scrapy项目中运行如下命令来启动HTTP服务：

　　scrapyrt

　　运行之后，会默认在9080端口上启动服务，类似的输出结果如下：

　　scrapyrt

　　2017-07-12 22:31:03+0800 [-] Log opened.

　　2017-07-12 22:31:03+0800 [-] Site starting on 9080

　　2017-07-12 22:31:03+0800 [-] Starting factory

　　如果想更换运行端口，可以使用-p参数，如：

　　scrapyrt -p 9081

　　这样就会在9081端口上运行了。

　　3. Docker安装

　　另外，Scrapyrt也支持Docker。比如，要想在9080端口上运行，且本地Scrapy项目的路径为/home/quotesbot，可以使用如下命令运行：

　　docker run -p 9080:9080 -tid -v /home/user/quotesbot:/scrapyrt/project scrapinghub/scrapyrt

　　这样同样可以在9080端口上监听指定的Scrapy项目。

责编：hym

编辑推荐

python问答

python教程