文件名称乱码怎么解决,文件名出现乱码怎么解决

  文件名称乱码怎么解决,文件名出现乱码怎么解决

  工具的安装由于尝试点安装一直失败,下载了wget3.2的数据包。解压后运行python setup.py安装即可完成安装。

  基本使用的下载方法导入wget wget.download(downloadURL,filepathandname)

  关于下载链接地址的获取目前使用的方法:利用人人贷得到网页数据,然后规则匹配得到相应的链接。利用人人贷获取(是否有更好的方法,BeautifulSoup?):

  导入人人贷

  从人人贷导入请求

  进口是

  页面请求=请求。URL打开(驱动程序。当前网址)

  pageRead=pageRequest.read().解码(“utf-8”)

  #为什么需要解码?

  #在python3.0中pageRequest.read()返回字节型数据,而是模块需要字符串

  #系统提示错误不能在类似字节的对象上使用字符串模式

  对于pageRead.split中的每一行( n ):

  webDownloadURL=re。查找全部( src=).)"",每行)

  if(len(webDownloadURL)0)和重新搜索( iframe ,每行):

  wgetURL=webDownloadURL[0]

  打印( %s%wgetURL)

  其他下载文件的方法

  #1、文件存储形式

  文件下载=URL lib 2。urlopen(URL)

  urldata=filedownload.read()

  fwrite=open(路径, wb )

  fwrite.write(urldata)

  fwrite.close()

  #2、urllib.urlretrieve

  urllib.urlretrieve(url,文件名)

  关于文件系统的处理

  文件主要使用到的包:os,shutil判断文件是否存在:OS。路径。存在(“…”)

  #判断文件夹是否存在,不存在建立新的文件夹

  导入操作系统

  导入技能

  如果os.path。存在(前缀路径名):

  及格

  否则:

  os.mkdir(前缀路径名)

  #删除文件

  os.rmdir(.)

  os.remove(.)

  #由于os.rmdir无法删除一个包含其他文件夹的文件夹,而模块具有这样的功能

  shutil.rmtree(.)

文件名称乱码怎么解决,文件名出现乱码怎么解决