返回
爬山虎采集器 v3.0.3.2免费版(暂未上线)

爬山虎采集器 v3.0.3.2免费版(暂未上线)

大小: 56.7M MB 类别: 网络软件

时间:2021-09-19 系统:Windows

  •   爬山虎采集器V2是一款高效的网页信息采集软件,支持99%的网站数据采集,爬山虎采集器可以生成Excel表格,api数据库文件等内容,可以帮助您管理网站的数据信息,如果您需要采集某一特定的网页数据,请使用本软件。
    爬山虎采集器 v3.0.3.2免费版
     
      软体特性
     
      键入提取数据。
     
      简洁明了,通过可视化的界面,鼠标点击就能抓取数据。
     
      快捷和效率
     
      内建一套高速浏览器内核,加上HTTP引擎模式,实现数据的快速采集。
     
      使用不同的网站。
     
      能在互联网上收集99%的网站,包括动态类型网站,如单页应用Ajax装载。
     
      函数简介
     
      引导模式。
     
      易于使用,通过鼠标点击容易自动生成。
     
      运行时间脚本。
     
      不需人工操作,定时操作。
     
      独特的高速内核。
     
      自主开发的浏览器内核,速度极快,远超对手。
     
      智能化识别
     
      用于页面中的列表、窗体结构(多选框下拉列表等)可以智能识别。
     
      广告牌。
     
      自定义广告屏蔽模块,兼容AdblockPlus语法,可以添加定制规则。
     
      多重数据导出。
     
      对Txt,Excel,MySQL,SQLServer,SQlite,Access,网站等等的支持。
     
      用法。
     
      步骤一:输入网址收集。
     
      开启软件,创建新任务,输入所需网站地址。
     
      步骤二:智能分析,数据的全程自动提取。
     
      完成第二步后,爬山虎采集器自动智能分析网页,并从中提取数据列表。
     
      步骤3:将数据导出到表格,数据库,网站等等。
     
      执行任务,以Csv、Excel和多种数据库导出所收集的数据,支持api导出。
     
      公共问题。
     
      问题:如何过滤列表中的前N个数据?
     
      1.有时候我们需要过滤收集到的数据列表,例如筛选出第一组数据(收集表格时,将表列名称过滤掉)
     
      2.在列表菜单中点击,设置列表xpath。
     
      如何通过抓包来获得cookie并手动设置?
     
      1.先用谷歌浏览器打开要收集的网站,然后登陆。
     
      然后按下F12,会出现开发工具,选择Network。
     
      然后按F5,刷新页面,然后选择请求中的一个。
     
      4.复制完成后,在爬山虎采集器中,编辑任务,进入第三步,指定HTTPHeader。
     
      更新日志。
     
      增加资料浏览-预览,编辑完整资料。
     
      添加数据查看-执行sql功能。
     
      资料处理,增加自动补全的相对URL功能。
     
      在一个单独的脚本命令上可以设置所有页面的执行(右击命令行。
     
      更改文本框高亮。
     
      修正innerText包含样式、脚本问题。
     
     

    相关推荐
    发表评论

    0

    没有更多评论了

    以上留言仅代表用户个人观点,不代表大番茄立场

    立即评论
    游戏排行 软件排行