火车头分页采集一次性采集多页网址

您所在的位置: >
> phpcms v9火车头采集器接口设置图文教程
phpcms v9火车头采集器接口设置图文教程
日  来源:互联网  次阅读
Phpcms 采用模块化方式开发,功能强大灵活易于扩展,并且完全开放源代码,面向大中型站点提供重量级网站建设解决方案。3年来,凭…
页面地址:/xiazai/phpcms.html
1、首先下载安装好火车头采集器软件(收费免费的本文均适用),这个我相信大家都会,如有不会的找百度或官方论坛。二、下载v9火车头接口文件jiekou.与发布模块,官方下载地址/spider-.html,本站下载地址(选本站更好些,不用转换发布模块,站在前辈肩膀上就是好,不用写接口文件也不用写模块)。如果本站下载无法点通,请复制如下地址:/index.php?m=content&c=down&a_k=79e5ArMn66P4VWhYwHyhyLOIEDK-osou5VScshgiZpbw9fg0NVPIReTcUzyHZhPmvj-9yJgasrDaV2bZDAgy1ise0G0JoHex8VZycYuu8M7PuFVACF569ojNdWOD1ivKm1hzOUbWtfTaXIW8-qggmCL7cGCgIQx2D38b-PNny76Syds5_bsiNnM_4RfEXx0R-YH-vo2cTwSy1Ky4HLQCheopjQ
2、接口文件修改与上传:用软件或文本打开jiekou.php文件,找到$password=';; &这句把123456修改成你想要的数字串,任意数字吧,我现在把它修改为$password=';; & ,记下这个数字串,后面设置发布模块要用到。修改后保存,用FTP上传到你网站的根目录下,即www文件夹下。
3、设置发布模块:打开火车头软件,找到界面上的:发布:按钮
4、点击进入发布模块界面,我们用6步来完成模块设置,与界面上面的12345步骤顺序有所不同。1.点击新建,找到配置名处:起个配置名,在这里我把这个配置名命名为lunwen。2.选择编码设置,与自己网站的一样吧,在这里我选择GB2312.3.登录操作:首先填入网站根目录地址,如/,记得这个一定要填根目录;然后点击&在内置中登录&按钮,用内置把网站打开,输全后台登录网址,和平时进后台方法一样,登录后台。登录成功后点下下面的&确定&按钮,点击回到模块设置界面:见下图
5、这步很重要,&选择web在线发布模块&,里面没有模块,我们就点最右边的绿字&更多&,然后选择&导入&选中我们在第二步中下载好的phpcmsv9发布模块phpcms9.wpm(官方下载的叫phpcms9.cwr,需要转为wpm格式,欢迎页界面的扩展上可以转)。导入后,点绿色字&编辑&,进入编辑界面,点击获取栏目列表,看到界面中&刷新列表页面&中的地址:/jiekou.php?pw=123456,后面的123456数字串要改为与jiekou.php里的一样,即/jiekou.php?pw=111111,前面jiekou.php里我们是设置为了111111,所以这里改为与之一样。
6、设置完后再点击&内容发布参数&按钮,设置方法和上面图中的一样,见下图吧
7、上面设置好了,这步就点&获取列表&,如果上面设置都正确,就会自动获取到网站的所有栏目,如果不能获取就说明上面设置不对,重新检查一次看看。6.成功获取列表后就算成功了,点击&保存设置&,模块设置成功。6步走总图见下图
8、下一步就等着写采集规则了,做过采集的写火车头采集器采集规则应该不难,都差不多,只要在有多页时注意一下就行了,不懂可以查下百度或论坛,例子很多也很全。有空我一定补上采集规则图文。
看过这篇文章的人还看过
输入你的评价或问题……
热门关键字火车头采集器能采集多个页面吗_百度知道
火车头采集器能采集多个页面吗
谁叫我一下?谢谢在线等,我想采集多个页面,不知道怎么用我现在只能采集一个页面
添加标签——多页(由当前网址跳转到别的网址),这样就可以在一个采集内容界面用不同的标签对应采集不同网站的内容。
其他类似问题
为您推荐:
火车头采集器的相关知识
其他1条回答
干什么啊。。。
等待您来回答
下载知道APP
随时随地咨询
出门在外也不愁关于火车头网址采集_百度知道
提问者采纳
所以location&#47,火车头我比较熟识location&#47,可以找我;(*) 这个是不同分类的,应该就是不同面页的;(*) 变量不同的网址分开来采集,它并不是同一面页下的分页,要分开来采集
分类太多,如果都要分开采,量太大。不知道有没其他办法?
凡是采集都是要分类采的,不可能一下子把整个网站采的,你可以在火车头规则那里设定不同的分类名称用同样的规则,这样就容易区分了,也可以几个分类一起采集了。
按分类可以搞定,只是太多,假如有60个,就要采60次。既然木有办法,那也只能这么做了。
提问者评价
虽然木有办法,但还是感谢。
其他类似问题
为您推荐:
您可能关注的推广回答者:
火车头的相关知识
等待您来回答
下载知道APP
随时随地咨询
出门在外也不愁下次自动登录
现在的位置:
& 综合 & 正文
火车头使用多页同时采集多个页面
何为多页?本来我们是从网址采集那块采集到网址,再对这个网址(也叫默认页)进行采集。但是有时有许多信息他并不在一个页面上,而是和这个默认页有一定的关系,要不他网址在默认页里,要不他网址和默认页网址有联系。我们就这个问题来说一下具体的解决办法。
  这里也有两种途径获得第三个网址,我们先讲从默认页网址替换得到新网址。我们以 这个页面为例,比如我们要获得全部的”剧情简介“,就得进入一下页,刚好这两页有关系,”剧情简介“页面的地址是 ,只是多了一个 introduction ,这里可以使用普通替换,也可以使用正则。我们看一下。
这样就可以获得所需要的了。当然这里组合也可以有多个$的,比如$1,$2....规则。
下边我们说一下用默认页中获得网址的方法来处理上边的网址,
这样就可以获得和上边一样的效果了。规则。
&&&&推荐文章:
【上篇】【下篇】

我要回帖

更多关于 火车头多级网址采集 的文章

 

随机推荐