教程总目录:
我们首先打开一篇文章,看看他的基本结构:标题和内容起始,以及是否有重复。
从下图可以看到有标题重复,以及我们不需要的内容(他的广告)
我们查看网页的源代码,CTRL+U
先搜索标题,看看标题都在哪些位置
可以看到有三个位置都是标题,看到这三个位置,分析下前后的内容。最终我选择了第三个作为采集标题的位置。
因为前后和其他文章更不容易出现不同的情况。避免出现个别文章采集标题为空的情况。
我们打开火车头采集器
将<h3 class=”mtop20 txt22″>作为标题的开头字符串
</h3>作为标题的结尾字符串
这两个字符串之间的内容,火车头会全采集下来,当做标题。所以不要选择错了
我们可以复制文章链接,在火车头里先测试下标题才是是否正确。
在下面有填测试连接的位置
去看你博客原创文章,作者:去看你博客,如若转载,请注明出处:https://www.7kanni.cn/2767.html