环境搭建
一、安装selenium
1.打开开始菜单--运行--cmd,输入: pip install selenium:
可以下载并安装最新的版本,可以输入pip list 查看是否已安装:
列表中显示selenium即为已安装。
二、下载浏览器驱动
每个浏览器都有对应的驱动,需要下载所使用浏览器的驱动。常用的两个浏览器驱动:谷歌驱动:http://npm.taobao.org/mirrors/chromedriver/火狐驱动:https://github.com/mozilla/geckodriver/releases
下载后需要解压,将解压后的文件(非文件夹)放在Python安装目录下或者Scripts目录下,并配置好环境变量。
元素定位
一、认识html信息
在打开的界面上按F12键,打开元素审查界面(如图3):
点击元素信息区域左上角的按钮(如图4)可以识取网页元素的信息,点击该按钮后,再点击网页的任意元素,下方可以定位到该元素的信息。
元素信息的含义:
<html>:声明html网页
<a>:代表的是一个链接 href=”https://**************/”
<title>:窗口的标题
<title>:表单,一般存在于登录页面
<form>:是一个块标签,是一个容器标签,里面可以包含不同的标签,比如a,p,div 取决于前端开发人员
<div>:是一个块标签,是一个文本容器标签,里面一般放文本不同的标签
<p>:声明的是一个段落
<input>:是一个文本框
<iframe>html:页面中的一个网页嵌套另一个网页
二、打开被测系统界面
导入selenium 的 webdriver 方法:from selenium import webdriver
打开浏览器(以谷歌浏览器为例):dr = webdriver.chrome() ----赋值给变量方便后续操作
打开被测系统界面(以360搜索为例):dr.get(“https://www.so.com/”)
运行以上语句即可自动打开谷歌浏览器并打开360搜索界面。
三、元素定位八种方法
在元素定位介绍前,先了解元素操作最常用的两个方法:
(1)模拟用户点击:click()
(2)模拟用户输入信息:send_keys(“输入的内容”)
以360搜索页面为例:
(1)根据id定位----属性值必须唯一
在输入框中输入“Python”:dr.find_element_by_id(“input”).send_keys(“Python”)
(2)根据name定位----属性值必须唯一
在输入框中输入“Python”:dr.find_element_by_name(“q”).send_keys(“Python”)
(3)根据class_name定位----属性值必须唯一
点击“搜索”按钮:dr.find_element_class_name(“skin-search-button”).click()
(4)根据link_text文本链接定位----属性值必须唯一
点击“资讯”链接:dr.find_element_by_link_text("资讯").click()
(5)根据partial_link_text部分文本链接定位:----属性值必须唯一
点击“京公网安备11000002000022号”链接:
dr.find_element_by_partial_link_text("京公").click()
(6)根据tag_name标签名定位(不常用):----属性值必须唯一
find_element_by_tag_name(“tag_name属性值”)
(7)通过xpath语法定位:
①根据绝对路径:
在输入框中输入“Python”:
path1 = "/html/body/div[2]/div/section[2]/div/form/fieldset/div[2]/input"
dr.find_element_by_xpath(path1).send_keys("Python")
②根据元素属性:
点击“搜索”按钮:
dr.find_element_by_xpath(//input[@type='submit']).click()
③通过多个属性组合定位:
点击“搜索”按钮:
dr.find_elemen_by_xpath(“//*[@type=’submit’and @value=’搜索’]”).click()
④通过层级和属性组合定位:
在输入框中输入“Python”:
dr.find_elemen_by_xpath(“//div[@id=’suggest-align’]/input[@name=’q’]”).send_keys(“Python”)
(8)通过css语法定位
①根据class属性定位:
点击“搜索”按钮:
dr.find_element_by_css_selector(.skin-search-button).click()
②根据id属性定位:
在输入框中输入“Python”:
dr.find_element_by_css_selector(#input).send_keys(“Python”)
③根据标签名定位:
在输入框中输入“Python”:
dr.find_element_by_css_selector("input").send_keys("Python")
④通过属性定位:
点击“搜索”按钮:
dr.find_element_by_css_selector(“[value=搜索]”).click()
dr.find_element_by_css_selector(“input[value=搜索]”).click()
⑤通过层级的父子关系定位:
在输入框中输入“Python”:
dr.find_element_by_css_selector("div > input").send_keys("Python")
⑥通过层级和属性定位:
点击“搜索”按钮:
dr.find_element_by_css_selector(“div>input#search-button”).click()
四、表单切换
Webdriver每次只能在一个页面上定位元素,对于frame嵌套内的页面元素,需要进行表单切换,将当前表单切换到要定位的元素所在的表单,然后才可以定位。
以QQ邮箱的登录界面为例,打开QQ邮箱登录界面:
from selenium import webdriver
dr = webdriver.Chrome()
url = "https://mail.qq.com/"
dr.get(url)
定位账号密码输入框所在表单的位置:
frame = dr.find_element(By.CSS_SELECTOR,"#login_frame")
然后切换表单:dr.switch_to.frame(frame)
再想定位其它表单的元素时,需要将表单再切回默认:dr.switch_to.default_content()