文件名称乱码怎么解决,文件名出现乱码怎么解决
工具的安装由于尝试点安装一直失败,下载了wget3.2的数据包。解压后运行python setup.py安装即可完成安装。
基本使用的下载方法导入wget wget.download(downloadURL,filepathandname)
关于下载链接地址的获取目前使用的方法:利用人人贷得到网页数据,然后规则匹配得到相应的链接。利用人人贷获取(是否有更好的方法,BeautifulSoup?):
导入人人贷
从人人贷导入请求
进口是
页面请求=请求。URL打开(驱动程序。当前网址)
pageRead=pageRequest.read().解码(“utf-8”)
#为什么需要解码?
#在python3.0中pageRequest.read()返回字节型数据,而是模块需要字符串
#系统提示错误不能在类似字节的对象上使用字符串模式
对于pageRead.split中的每一行( n ):
webDownloadURL=re。查找全部( src=).)"",每行)
if(len(webDownloadURL)0)和重新搜索( iframe ,每行):
wgetURL=webDownloadURL[0]
打印( %s%wgetURL)
其他下载文件的方法
#1、文件存储形式
文件下载=URL lib 2。urlopen(URL)
urldata=filedownload.read()
fwrite=open(路径, wb )
fwrite.write(urldata)
fwrite.close()
#2、urllib.urlretrieve
urllib.urlretrieve(url,文件名)
关于文件系统的处理
文件主要使用到的包:os,shutil判断文件是否存在:OS。路径。存在(“…”)
#判断文件夹是否存在,不存在建立新的文件夹
导入操作系统
导入技能
如果os.path。存在(前缀路径名):
及格
否则:
os.mkdir(前缀路径名)
#删除文件
os.rmdir(.)
os.remove(.)
#由于os.rmdir无法删除一个包含其他文件夹的文件夹,而模块具有这样的功能
shutil.rmtree(.)