最新免费网站.棋牌.手游.端游.商业源码下载

游戏源码
当前位置: 主页 > 架设教程 > 网站源码教程

火车头采集器搭建教程

时间:2022-09-13    来源:admin1    人气:

火车头采集器搭建教程

1、下载安装火车头采集器,有付费与免费版,百度查找下载地址。(这里不细说)

2、下载好后,双击火车头图标打开采集器。

火车头采集器教程

3、进入火车头主程序页面。

火车头采集器教程

4、单击新建的黑小三角,新建任务。

火车头采集器教程

5、填写任务名,点击第二步。(采集网址不截了,以防广告)

火车头采集器教程

6、分析目标页面,找到要采集的内容

火车头采集器教程

7、查看源文件,找到要采的内容(复制内容去搜索)

火车头采集器教程

8、建议用360浏览器或者360极速浏览器,找到目标内容,分析目标内容前后的代码。

火车头采集器教程

9、此时标题的前后代码为“<h2>”、“</h2>”。

火车头采集器教程

10、双击采集器“标题”。

火车头采集器教程

11、选择前后截取,把前后代码分别填进去,如图。

火车头采集器教程

12、或者,选择正则提取,如图,点击确认。

火车头采集器教程

13、标题采集规则制作完成,开始分析其他标签规则。

内容中有不要的代码(如图div代码不要),可以排除。

火车头采集器教程

14、双击内容,进入数据处理,点击添加,出现菜单,选择html标签过滤。

火车头采集器教程

15、勾选不要的代码。

火车头采集器教程

16、检查要的内容是否全部采集进来了。

火车头采集器教程


推荐文章

公众号