一、官方参考文档:http://selenium-python.readthedocs.io/index.html
二、安装方式:
1.PyPI 网站下载 Selenium库https://pypi.python.org/simple/selenium
2. pip install selenium
Selenium 库里有 WebDriver 的 API。WebDriver 类似可以加载网站的浏览器,同时可以像 BeautifulSoup、xpath 或者其他 Selector 对象一样用来查找页面元素,与页面上的元素进行交互 (发送文本、点击等),以及执行其他动作来运行网络爬虫,提取网页动态数据以及应对反爬。
三、操作步骤:
1.导包
from selenium import webdriver
2.调用环境变量指定的Chrome浏览器创建浏览器对象
driver = webdriver.Chrome()
3.定位元素
driver.find_element_by_id
4.获取标签属性值
get_attribute('属性名')
5.获取文本
text
6.填入表单数据
send_keys()
7.鼠标点击
click()
8.获取cookies值
get_cookies()
9.selenium中的页面等待
现在的网页越来越多采用了 Ajax 技术,这样程序便不能确定何时某个元素完全加载出来了。如果实际页面等待时间过长导致某个dom元素还没出来,但是你的代码直接使用了这个WebElement,那么就会抛出NullPointer的异常。
为了避免这种元素定位困难而且会提高产生 ElementNotVisibleException 的概率。所以 Selenium 提供了两种等待方式,一种是隐式等待,一种是显式等待。
隐式等待是等待特定的时间,显式等待是指定某一条件直到这个条件成立时继续执行。
1.显性等待
2.隐性等待
driver.implicitly_wait(10)
time.sleep(2)