八爪鱼采集器新手采集教程

八爪鱼采集器新手采集教程

八爪鱼采集器如何采集数据?

八爪鱼采集器是一款专门用来采集网页数据的网络软件,以自主研发的分布式云计算平台为核心,能够在短时间内从不同网站和网页上抓取大量规范化的数据内容,帮助用户轻松实现数据自动化采集,编辑,规范化,大大提高用户的效率。下面给大家分享的是八爪鱼采集器新手采集教程,有需要的小伙伴一起来看看吧。

八爪鱼采集器新手采集教程:

步骤一

我们找到八爪鱼采集器的安装位置,双击或右击-打开运行【Octopus.exe】,无法运行的伙伴右击-管理员身份运行;也可以通过桌面的八爪鱼采集器快捷运行方式开启。

步骤二

开始运行后,会弹出登入界面,没有账号的小伙伴们,可以点击免费注册,进行注册使用。

步骤三

登入完后进入主界面,刚开始使用的小伙伴,可能会有一个问卷弹出,如实填写就行。

我们将游标移动到新建按钮上,会展现一个下拉菜单,分别是【自定义任务】、【模板任务】、【导入任务】、【新建任务组】;我们这里选择【模板任务】。

步骤四

八爪鱼采集器在此已经为我们预设了很多模板,这里使用京东作为演示内容。

步骤五

点击选择京东后,会有好几个模板,功能各不相同,这里我们点击第一个【京东-商品搜索】。

点击【立即使用】

步骤六

这个界面便是设置爬取的内容参数,我们一一讲解。

任务名:顾名思义,设置本次的任务名字

任务组:将这次任务归类到哪各组,因为我们没有设置所以只有一个【我的任务组】,小伙伴们可以自行去创建组,在新建按钮中选择【新建任务组】。

搜索关键词:你要在网页中搜索爬取的内容。

页数:爬取多少页的数据,不指定为全部爬取。

这里设置爬取3页手机的数据,点击【保存并启动】,开启爬取

步骤七

点击后会弹出这个界面,有条件的小伙伴可以购买【云采集服务】,这里使用【启动本地采集】

稍加等待后,软件会自己启动前往指定页面爬取数据。

这里没有等待全部爬取完,点击了停止采集,这里我们可以选择直接导出或稍后导出。

步骤八

若点击【导出数据】,我们可以指定导出的格式,这里导出到Excel中。

选择导出位置

导出完毕

查看内容

关于八爪鱼采集器新手采集教程就给大家介绍完了,希望能对大家有所帮助。……