python

当前位置:中华考试网 >> python >> python爬虫 >> 文章内容

python爬虫利器:Scrapyrt的安装(Scrapy分布式)

来源:中华考试网  [2020年10月12日]  【

  crapyrt为Scrapy提供了一个调度的HTTP接口,有了它,我们就不需要再执行Scrapy命令而是通过请求一个HTTP接口来调度Scrapy任务了。Scrapyrt比Scrapyd更轻量,如果不需要分布式多任务的话,可以简单使用Scrapyrt实现远程Scrapy任务的调度。

  1. 相关链接

  GitHub:https://github.com/scrapinghub/scrapyrt

  官方文档:http://scrapyrt.readthedocs.io

  2. pip安装

  这里推荐使用pip安装,命令如下:

  pip3 install scrapyrt

  接下来,在任意一个Scrapy项目中运行如下命令来启动HTTP服务:

  scrapyrt

  运行之后,会默认在9080端口上启动服务,类似的输出结果如下:

  scrapyrt

  2017-07-12 22:31:03+0800 [-] Log opened.

  2017-07-12 22:31:03+0800 [-] Site starting on 9080

  2017-07-12 22:31:03+0800 [-] Starting factory

  如果想更换运行端口,可以使用-p参数,如:

  scrapyrt -p 9081

  这样就会在9081端口上运行了。

  3. Docker安装

  另外,Scrapyrt也支持Docker。比如,要想在9080端口上运行,且本地Scrapy项目的路径为/home/quotesbot,可以使用如下命令运行:

  docker run -p 9080:9080 -tid -v /home/user/quotesbot:/scrapyrt/project scrapinghub/scrapyrt

  这样同样可以在9080端口上监听指定的Scrapy项目。

责编:hym
  • 会计考试
  • 建筑工程
  • 职业资格
  • 医药考试
  • 外语考试
  • 学历考试