易语言 爬虫,易语言网络爬虫
[Python]纯文本查看复制代码导入请求
进口是
导入操作系统
# 设置浏览器引擎
标题={
用户代理: Mozilla/5.0(Windows NT 10.0;win 64x 64)apple WebKit/537.36(KHTML,像壁虎一样)Chrome/84。0 .4147 .105 Safari/537.36
}
# 根据搜索,得到搜索结果网页
搜索=输入(你想找怎样的女盆友: )
www。土鸡谷。 com/search/搜索
response=requests.get(murl,headers=headers)
HTML=响应。内容。解码(“utf-8”)
urls=re.findall(
# 从全部图集统一资源定位器中,找出单个图集的统一资源定位器进行分析
对于全球资源定位器(Uniform Resource Locator)中的网址:
response=requests.get(url,headers=headers)
HTML=响应。内容。解码(“utf-8”)
picsname=re.findall(
(.*?),HTML)[0] #图集的名称picmax=int(re.findall(
图片数量: (.*?)P
,HTML)[0]) #获取总的图片数量ID=url.split(/)[4] #获取图集的ID,方便进行图片统一资源定位器的拼接
路径=图集谷 picsname
# 创建图集目录
如果不是os.path.exists(路径):
os.makedirs(路径)
打印(目录创建完成!记得设置为隐私文件哦)
否则:
打印(目录已创建!一看就是老绅士了)
# 开始下载图集
打印(图片名称)
打印(开始下载嗷~~~)
对于范围内的I(1,picmax):
图片URL= https://LNS。海莉。com/a/1/ ID / str(I) . jpg
print((^.^)喵~~~正在下载: picurl )
res=requests.get(picurl).内容
用打开( %s%s.jpg%(path,I), wb )作为女:
f.write(res)
打印(图片名称n下载完成!nn )