webDriver是Python 的一个用于实现web自动化的第三方库,以百度首页为例,学习元素定位。
首先使用前端工具找到百度首页部分前端代码:
<html>
<head>
<body link="#0000cc">
<script>
<div id="wrapper" style="display: block;">
<script>
<div id="head">
<div class="head_wrapper">
<div class="s_form">
<div class="s_form_wrapper soutu-env-nomac soutu-env-index">
<div id="lg">
<a id="result_logo" onmousedown="return c({'fm':'tab','tab':'logo'})" href="/">
<form id="form" class="fm" action="/s" name="f">
<input type="hidden" value="utf-8" name="ie">
<input type="hidden" value="8" name="f">
<input type="hidden" value="0" name="rsv_bp">
<input type="hidden" value="1" name="rsv_idx">
<input type="hidden" value="" name="ch">
<input type="hidden" value="monline_3_dg" name="tn">
<input type="hidden" value="" name="bar">
<span class="bg s_ipt_wr quickdelete-wrap">
<input id="kw" class="s_ipt" autocomplete="off" maxlength="255" value="" name="wd">
</span>
<span class="bg s_btn_wr">
<input id="su" class="bg s_btn" type="submit" value="百度一下">
</span>
......
webDriver 中元素定位方法:
find_element_by_id() find_element_by_name()
find_element_by_class_name() find_element_by_tag_name()
find_element_by_link_test() find_element_by_partial_link_text()
find_element_by_xpath() find_element_by_css_selector()
1.id/name/class/tag定位
例如百度输入框:
我们可以使用它的各种属性进行定位:
find_element_by_id("kw")
find_element_by_name("wd")
find_element_by_class_name("s_ipt")
find_element_by_tag_name("input") -- 但是下查看前端会发现大量<div>、<input>、<a>等标签,所以很难通过by_tag_name找到准确的定位,适用于批量定位。
2.link/partial link 定位:
link定位是专门用来定位文本连接 的。比如:
<a class="mnav" name="tj_trvideo" href="http://v.baidu.com">视频</a>
<a class="mnav" name="tj_trtieba" href="http://tieba.baidu.com">贴吧</a>
<a class="bri" style="display: block;" name="tj_briicon" href="http://www.baidu.com/more/">更多产品</a>
------------------------------------------
find_element_by_link_test("视频")
#当文本比较长的时候,我们可以取文本的一部分,只要这部分信息可以唯一标识这个连接就行:
find_element_by_partial_link_text("更多")
3.XPath定位
例:(百度输入框和搜索框定位)
●绝对路径定位
find_element_by_xpath("/html/body/div/div/div/div/div/form/span/input")
find_element_by_xpath("/html/body/div/div/div/div/div/form/span[2]/input")
如果一个层级下有多个相同标签名,按上下顺序确定是第几个,如:span[2] 第二个表示搜索框
●元素属性定位
find_element_by_xpath("//input[@id='kw']")
find_element_by_xpath("//input[@id='su']")
find_element_by_xpath("//*[@id='su']")
//表示当前页面某个目录下,input是元素标签名,[@id='kw']表示元素的id属性,这里可以使用元素的任意属性名,只要能唯一识别该元素,如果不想指定标签名可以用*号代替
●层级属性结合
如果一个元素没有任何可以唯一标识的属性,可以找到他的上一级元素(上级没有找上上级...)
find_element_by_xpath("//span[@class='bg s_ipt_wr']/input")
find_element_by_xpath("//span[@class='bg s_btn']/input")
●使用逻辑运算符
如果一个属性不能唯一区分一个元素,可以用逻辑运算符 ‘and’ 连接多个属性定位元素
find_element_by_xpath("//input[@id='kw' and @class='s_ipt']")
4.CSS定位
1.通过(.)号进行class属性定位,(#)号进行id属性定位:
find_element_by_css_selector(".s_ipt")
find_element_by_css_selector("#kw")
2.通过标签名定位
find_element_by_css_selector("input") #标签名重复概率大,适用定位一组元素
3.通过父子关系定位
find_element_by_css_selector("span>input")
4.通过属性定位
find_element_by_css_selector("autocomplete=off")
5.组合定位
find_element_by_css_selector("form.fm>span>input.s_ipt")
#class属性为fm的form标签->span标签->标签名为input、class属性为s_ipt 的元素。
WebDriver的8种定位方法还提供了统一的调用方法:find_element() 方法。通过By声明定位方法,再 传入响应的定位参数:
使用By之前导入By类:
form selenium.webdriver.common.by import By
find_element(By.ID, "kw")
find_element(By.NAME, "wd")
...