飘荡软件--绿色软件下载站!

  • 软件大小: 20KB
  • 软件语言: 简体中文
  • 软件类别: 国产软件 | 网站推广
  • 运行环境: Xp/Vista/Win7/Win8/WinAll
  • 授权方式: 免费版
  • 软件等级:
  • 更新时间: 2017/6/29 7:06:26
  • 开 发 商:
  • 分享到:
  • 立即下载
  • 一键复制
  • 收藏该软件

软件介绍:

    python图片爬虫(图片爬虫工具)

    python图片爬虫 (图片爬虫工具)是一款专门为互联、it行业的小伙伴们打造的爬虫工具,可以帮大家对软件进行优化、seo的人一定会用的上哦,有兴趣的赶紧下载了哦!

    python图片爬虫代码如下:

    #-*- encoding: utf-8 -*-

    '''

    Created on 2014-4-24

    @author: Leon Wong

    '''

    import urllib2

    import urllib

    import re

    import time

    import os

    import uuid

    #获取二级页面url

    def findUrl2(html):

    re1 = r'http://tuchong.com/\d+/\d+/|http://\w+(?

    url2list = re.findall(re1,html)

    url2lstfltr = list(set(url2list))

    url2lstfltr.sort(key=url2list.index)

    #print url2lstfltr

    return url2lstfltr

    #获取html文本

    def getHtml(url):

    html = urllib2.urlopen(url).read().decode('utf-8')#解码为utf-8

    return html

    #下载图片到本地

    def download(html_page , pageNo):

    #定义文件夹的名字

    x = time.localtime(time.time())

    foldername = str(x.__getattribute__("tm_year"))+"-"+str(x.__getattribute__("tm_mon"))+"-"+str(x.__getattribute__("tm_mday"))

    re2=r'http://photos.tuchong.com/.+/f/.+\.jpg'

    imglist=re.findall(re2,html_page)

    print imglist

    download_img=None

    for imgurl in imglist:

    picpath = 'D:\\TuChong\\%s\\%s'  % (foldername,str(pageNo))

    filename = str(uuid.uuid1())

    if not os.path.exists(picpath):

    os.makedirs(picpath)

    target = picpath+"\\%s.jpg" % filename

    print "The photos location is:"+target

    download_img = urllib.urlretrieve(imgurl, target)#将图片下载到指定路径中

    time.sleep(1)

    print(imgurl)

    return download_img



    关键字: python 图片爬虫工具

相关说明

  • 如果您发现该软件不能下载, 请通知管理员
  • 为了保证您快速的下载,推荐使用[网际快车]等专业工具下载.
  • 为确保所下软件能正常使用,请使用[WinRAR v3.8]或以上版本解压本站软件.
  • 站内软件都是由网上收集,只供网友学习使用,如果所收集的软件侵犯了您的版权,请 来信 告知。