Python+Selenium实现web自动化测试

1、Selenium简介

Selenium 是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7, 8, 9, 10, 11),Mozilla Firefox,Safari,Google Chrome,Opera等。这个工具的主要功能包括:测试与浏览器的兼容性——测试你的应用程序看是否能够很好得工作在不同浏览器和操作系统之上。测试系统功能——创建回归测试检验软件功能和用户需求。支持自动录制动作和自动生成 .Net、Java、Perl等不同语言的测试脚本。
我们在这里使用 Selenium with Python 版本,主要用来模拟用户在网站上的操作和请求,以便于我们能更好的进行爬虫获取数据。

2、Selenium的安装和使用

在另一篇文中介绍过PyCharm中库的安装,selenium的安装跟其他的库安装一样,可以进行搜索安装。(我是另一篇~~) 当然,你也可以使用命令行的方式安装,macOS 下打开终端,使用以下命令行

pip3 install selenium 

前提是你的系统中已经安装过Python 3.5,macOS系统自带的是Python 2.5+版本,本文使用的是Python 3.5版本


我们还以gitbook.cn网站为例子进行Selenium的简单使用,以下代码是获取一个搜索框,并进行内容搜索

from selenium import webdriver
from selenium.webdriver.common.keys import Keys  # 导入Keys


driver = webdriver.Chrome('/Users/Pro-007/Desktop/chromedriver')
driver.get('http://gitbook.cn/gitchat/hot')

assert 'GitChat' in driver.title  # 如果关键字GitChat不在网页的<title></title>中,程序跳出,否则继续
tag = driver.find_element_by_id('orderedChatSearch')  # 通过id值获取HTML的标签元素,这里获取的是搜索框
tag.clear()  # 清空搜索框的内容
tag.send_keys('面试')  # 在搜索框中填入搜索值
tag.send_keys(Keys.RETURN)  # 模拟敲回车键

# 如果没有结果程序退出
assert 'No results found.' not in driver.page_source
driver.close()  # 关闭driver

这个是模拟的搜索结果
模拟搜索.png

3、Selenium的导航操作 Navigating

  • 定位一个元素
find_element_by_id  #根据id值定位标签元素
find_element_by_name
find_element_by_xpath  #通过使用xpath匹配定位标签元素
find_element_by_link_text
find_element_by_partial_link_text
find_element_by_tag_name
find_element_by_class_name
find_element_by_css_selector  #通过CSS选择器定位标签元素
  • 定位多个元素
find_elements_by_name
find_elements_by_xpath
find_elements_by_link_text
find_elements_by_partial_link_text
find_elements_by_tag_name
find_elements_by_class_name
find_elements_by_css_selector

通过导航从而定位标签元素,这样我们就可以获取到标签并可以进行相应的操作,比如上面的在搜索框内输入'面试'时,浏览器可以自动的进行相应的搜索,不需要用户的操作。

4、继续我们的爬虫

在上一篇文章中我们基本已经实现爬虫操作了,但是最后发现我们每次只能获取到20条数据,这个可不是我们想要的结果。下面就让我们利用上面的知识进行模拟用户上拉操作,从而获取到更多的数据。这里我们仅仅需要实现一个函数方法就行。(需配合另一篇文章使用)传送门

#代码示例
    def scroll_down(self, driver, times):
        for i in range(times):
            print('开始执行第', str(i + 1), '次上拉操作')
            # 执行js代码,实现上拉操作
            driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
            print('第%s次上拉操作执行完毕' % str(i + 1))
            print('开始等待网页加载...')
            # 需要 import time
            time.sleep(20)  # 等待20秒,等页面加载出来后在进行下拉操作,这个值根据网速自定义

结果输出:
爬虫结果.png

5、小结

这个爬虫项目算是已经完成了,这也算是我第一次写文章,谨以此文来记录我在学习Python的过程中所写过的代码,并分享出来给可以用到帅哥美女们。谢谢!

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,802评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,109评论 2 379
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,683评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,458评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,452评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,505评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,901评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,550评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,763评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,556评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,629评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,330评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,898评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,897评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,140评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,807评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,339评论 2 342

推荐阅读更多精彩内容