Portia Spider(孔蛛)号称世界上最聪明的蜘蛛,孔蛛属,英文名 Portia,也翻译为波西亚蜘蛛(波西亚跳蛛)。
Portia是scrapyhub开源的一款可视化的爬虫规则编写工具。它提供可视化的Web页面,你只需要通过点击标注页面上你需要抽取的数据,不需要任何编程知识即可完成规则的开发。
这些规则可以在#Scrapy#中使用,用于抓取页面。
不过需要注意的是这个程序需要再python(PY)环境下运行。
具体请参考:http://blog.scrapinghub.com/2014/04/01/announcing-portia/
5 条评论
portia运行成功后,输入要提取的网站点击开始,页面一直显示no page loaded
可视化的,不错不错
是比较不错的,值得推荐
不错不错、之前就论坛看到 一直没人说出来、在这给我发现了、 真是好东西、博主链接么?
链接哇,你的地址是什么?