易语言 爬虫,易语言网络爬虫

  易语言 爬虫,易语言网络爬虫

  [Python]纯文本查看复制代码导入请求

  进口是

  导入操作系统

  # 设置浏览器引擎

  标题={

  用户代理: Mozilla/5.0(Windows NT 10.0;win 64x 64)apple WebKit/537.36(KHTML,像壁虎一样)Chrome/84。0 .4147 .105 Safari/537.36

  }

  # 根据搜索,得到搜索结果网页

  搜索=输入(你想找怎样的女盆友: )

  www。土鸡谷。 com/search/搜索

  response=requests.get(murl,headers=headers)

  HTML=响应。内容。解码(“utf-8”)

  urls=re.findall(

  # 从全部图集统一资源定位器中,找出单个图集的统一资源定位器进行分析

  对于全球资源定位器(Uniform Resource Locator)中的网址:

  response=requests.get(url,headers=headers)

  HTML=响应。内容。解码(“utf-8”)

  picsname=re.findall(

  (.*?),HTML)[0] #图集的名称picmax=int(re.findall(

  图片数量: (.*?)P

  ,HTML)[0]) #获取总的图片数量ID=url.split(/)[4] #获取图集的ID,方便进行图片统一资源定位器的拼接

  路径=图集谷 picsname

  # 创建图集目录

  如果不是os.path.exists(路径):

  os.makedirs(路径)

  打印(目录创建完成!记得设置为隐私文件哦)

  否则:

  打印(目录已创建!一看就是老绅士了)

  # 开始下载图集

  打印(图片名称)

  打印(开始下载嗷~~~)

  对于范围内的I(1,picmax):

  图片URL= https://LNS。海莉。com/a/1/ ID / str(I) . jpg

  print((^.^)喵~~~正在下载: picurl )

  res=requests.get(picurl).内容

  用打开( %s%s.jpg%(path,I), wb )作为女:

  f.write(res)

  打印(图片名称n下载完成!nn )

易语言 爬虫,易语言网络爬虫