高智能的全自动采集程序域名站点采集规则制作简单采集不求人全自动资源爬虫蜘蛛站
(内置2条采集规则、一个小说,一个百度影音电影站)。
– 程序使用环境 php5.2 – php5.6
只需要输入目标站地址就能全自动采集,高智能的采集程序,支持98%的单级域名站点,规则制作十分简单,菜鸟也能制作采集规则,采集不求人
更新日志:2019-10-25
1.增加采集失败或者错误,自动使用缓存数据并2分钟后再采集;(重要)
2.修正某些情况下搜索页面css无法加载的问题;(重要)
3.修正搜索中文问题;(重要)
4.url规则增加保存自动生成规则文件到根目录下(httpd.ini,web.config,.htaccess)。
功能简介:
·后台配置采集节点,输入目标站地址即可全自动智能转换自动全站采集
·支持https、支持POST获取、支持搜索、支持cookie、支持代理、支持破解防盗链、支持破解防采集
·全自动分析,内外链接自动转换、图片地址、css、js,自动分析CSS内的图片使得页面风格不丢失
·广告标签,方便在规则里直接替换广告代码
·支持自定义标签,标签可自定义内容、自由截取、内容正则截取。可以放在模板里,也可以在规则里替换
·支持自定义模板,可使用标签diy个性模板,真正做到内容上移花接木
·调试模式,可观察采集性能,便于发现和解决各种错误
·多条采集规则一键切换,支持导入导出
·内置强大替换和过滤功能,标签过滤、站内外过滤、字符串替换、等等
·IP屏蔽功能,屏蔽想要屏蔽IP地址让它无法访问
·蜘蛛访问记录
*****高级功能*****
·url过滤功能,可过滤屏蔽不采集指定链接
·伪原创,近义词替换有利于seo
·伪静态,url伪静态化,有利于seo
·自动缓存自动更新,可设置缓存时间达到自动更新,css缓存
·简繁体互转
·代理IP、伪造IP、随机IP、伪造user-agent、伪造referer来路、自定义cookie,以便应对防采集措施
·url地址加密转换,个性化url,让你的url地址与众不同
·关键词内链功能
·加入插件机制,内容灵活处理