使用tkinter制作爬虫GUI程序

1.如何使用tkinter调用系统路径
2.构造url,参数化图片分类、抓取页数
3.使用tkinter获取输入参数传给执行代码
4.利用tkinter模块做成GUI程序
直接上代码

# coding:utf-8
import tkinter as tk
from tkinter import ttk
from tkinter.filedialog import askdirectory
import requests
import re
import os

"""图形界面爬取图片cj20190807"""


class BXS():
    def __init__(self):
        self.window = tk.Tk()
        self.window.title("爬取不羞涩图片")
        self.window.geometry("580x580")

        self.label1 = tk.Label(self.window, text='存放路径')
        self.label2 = tk.Label(self.window, text='选择分类')
        self.label3 = tk.Label(self.window, text='爬取页数')

        # 创建一个文本展示框,并设置尺寸
        self.info = tk.Text(self.window,width=70)

        # 下拉选择按钮:爬取类型
        self.num1 = tk.StringVar()
        self.cmb1 = ttk.Combobox(self.window, textvariable=self.num1)

        # 设置下拉菜单中的值
        self.cmb1['values'] = ('大胸妹', '小翘臀', '黑丝袜', '美腿控', '有颜值', '大杂烩')
        self.cmb1.current(0)  # 设置默认值,即默认下拉框中的内容,默认值中的内容为索引,从0开始

        # 下拉选择按钮:爬取页数
        self.num2 = tk.StringVar()
        self.cmb2 = ttk.Combobox(self.window, textvariable=self.num2)

        # 设置下拉菜单中的值
        self.cmb2['values'] = (1, 2, 3, 4, 5)
        self.cmb2.current(0)  # 设置默认值,即默认下拉框中的内容,默认值中的内容为索引,从0开始

        # 输入框,显示选择的路径
        self.path = tk.StringVar()
        self.e = tk.Entry(self.window, show=None, width=8, textvariable=self.path)

        # button按钮
        self.t1_button = tk.Button(self.window, text='选择路径', relief=tk.RAISED, width=8, height=1, command=lambda:self.select_Path())

        # 清空输入框
        self.t2_button = tk.Button(self.window, text='清空路径', relief=tk.RAISED, width=8, height=1, command=lambda:self.clear_Path())

        # 提取按钮
        self.run_button = tk.Button(self.window,text="开始提取",relief=tk.RAISED,command=lambda:self.run())


    def gui(self):
        self.label1.grid(row=1, column=1, padx=10, pady=10, ipadx=10, ipady=10)
        self.label2.grid(row=2, column=1, padx=10, pady=20, ipadx=10, ipady=10)
        self.cmb1.grid(row=2, column=2, padx=10, pady=20, ipadx=30, ipady=8)
        self.label3.grid(row=3, column=1, padx=10, pady=10, ipadx=10, ipady=10)
        self.cmb2.grid(row=3, column=2, padx=10, pady=20, ipadx=30, ipady=8)
        self.e.grid(row=1, column=2, padx=1, pady=10, ipadx=130, ipady=8)
        self.t1_button.grid(row=1, column=3, padx=10)
        self.t2_button.grid(row=1, column=4)
        self.run_button.grid(row=2, column=3)
        self.info.grid(row=4, rowspan=5, column=1, columnspan=4)



    def select_Path(self):
        """选取本地路径"""
        filepath = askdirectory()
        self.path.set(filepath)

    def clear_Path(self):
        """清空输入框中路径"""
        self.e.delete(0, "end")  # 从第一行清除到最后一行

    def get_cid(self):
        if self.cmb1.get() == "大胸妹":
            cid = 2
        if self.cmb1.get() == "小翘臀":
            cid = 6
        if self.cmb1.get() == "黑丝袜":
            cid = 7
        if self.cmb1.get() == "美腿控":
            cid = 3
        if self.cmb1.get() == "有颜值":
            cid = 4
        if self.cmb1.get() == "大杂烩":
            cid = 5
        return cid

    def get_pagenum(self):
        return self.cmb2.get()

    def get_url(self):
        base_url = "https://www.dbmeinv.com/index.htm?"
        url_list = []
        for i in range(int(self.get_pagenum())):
            url = base_url + "cid=" + str(self.get_cid()) + "&pager_offset=" + str(self.get_pagenum())
            url_list.append(url)
        return url_list

    def get_dictdata(self,url):
        # url = get_url()
        result = requests.get(url=url).text

        name_pattern = re.compile(r'<img class="height_min".*?title="(.*?)"', re.S)
        src_pattern = re.compile(r'<img class="height_min".*?src="(.*?.jpg)"', re.S)
        name = re.findall(name_pattern, result)  # 提取title
        scr = re.findall(src_pattern, result)  # 提取图片url
        d = []
        for i in range(len(name)):
            d.append([name[i], scr[i]])
        return d  # 列表转换为字典,key相同则只能保存一个链接,所以这里不转换为字典
        # print(d)
        # dictdata = dict(d)#转换为字典
        # return dictdata

    def get_content(self,url):
        try:
            r = requests.get(url)
            if r.status_code == 200:
                return r.content
            else:
                return None
        except Exception as e:
            return None

    def download(self, url):
        a = self.e.get()
        print(a)

        # for t in get_dictdata(url).items():
        for t in self.get_dictdata(url):
            try:
                # title可能相同,所以文件名取了链接后四位作随机数
                file_path = self.e.get() + "\\" + t[0] + t[1][-8:-4] + ".jpg"
                print("正在下载:" + t[0] + " " + t[1])
                self.info.insert('end',"正在下载:" + t[0] + " " + t[1]+'\n')
                if not os.path.exists(file_path):  # 如果不存在则下载写文件
                    with open(file_path, "wb") as f:
                        f.write(self.get_content(t[1]))
            except Exception:
                continue

    def run(self):
        for i in self.get_url():
            self.download(i)


def main():
    t = BXS()
    t.gui()
    tk.mainloop()


if __name__ == '__main__':
    main()


©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,132评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,802评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,566评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,858评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,867评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,695评论 1 282
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,064评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,705评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,915评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,677评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,796评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,432评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,041评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,992评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,223评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,185评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,535评论 2 343

推荐阅读更多精彩内容