- 源码介绍
蓝天采集器是一款免费的数据采集发布爬虫软件,采用php+mysql开发,可部署在云服务器,几乎能采集所有类型的网页,无缝对接各类CMS建站程序,免登录实时发布数据,全自动无需人工干预!是网页大数据采集软件中完全跨平台的云端爬虫系统。
蓝天采集器特点:
蓝天采集器(SkyCaiji),网页爬虫系统,采用PHP+Mysql开发,可部署在云端服务器和虚拟主机中,使用浏览器即可采集数据。软件免费无限制使用,规则和插件可自定义开发。
数据采集:
支持多级、多页、分页采集,自定义采集规则(支持正则、XPATH、JSON等)精准匹配任意信息流,几乎能采集所有类型的网页,绝大多数文章类型页面内容可实现智能识别。
内容发布:
无缝对接各类CMS建站程序,实现免登陆导入数据,支持自定义数据发布插件,也可以直接导入数据库、存储为Excel文件、远程API发布等。
云部署及自动化:
该软件类似CMS程序,完全跨平台,任何系统中都能安装,在虚拟主机中也能良好运行。实现定时定量全自动采集发布,简单操作即可持续采集!