简介: 我们在做Web自动化时,最根本的就是操作页面上的各种元素,而操作的基础就是元素的定位,只有准确地定位到唯一元素才能进行后续的自动化控制。
单一属性定位
通过元素ID定位
元素的ID值在当前整个html页面是唯一的,因此可以通过id属性来唯一定位一个元素,这是首选的元素定位方式,但不是每个元素都有ID属性。实例如下:
loc = driver.find_element_by_id("kw")
print(ele.get_attribute('class'))
ele.send_keys('selenium')
通过元素的name
元素的name属性,但name不一定是唯一的,就像大家的身份证ID是唯一的,但是名字是有重复的。dirver.find_element_by_name
只返回第一个匹配到的元素,如果想返回所有匹配到该name到元素,则使用dirver.find_elements_by_name。
driver.find_element_by_name('wd')
通过元素的标签名
tag就是元素的标签标识,但不一定是唯一值, element带s时返回匹配到的元素列表
dirvier.find_element_by_tag_name('span')
XPATH定位
xpath时一门在xml文档中查找信息的语言,因为html与xml比较相似,用的比较广泛,所以xpath也可以用在html对元素进行定位。它是将整个html看成一个树形结构,html为根节点,页面当中节点与其他节点可以有祖先、父辈、兄弟、这样的关系,类似一个族谱。
selenium提供的xpath定位的方法名:find_element_by_xpath(xpath表达式)
,表达式语法如下:
表达式 | 说明 |
---|---|
/ | 绝对定位,从根节点选取 |
// | 相对定位,选择匹配的节点 |
. | 选择当前节点 |
.. | 选择当前节点的父节点 |
@ | 选择属性,如:@class="class值",@id="id值",属性放在中括号[]中 |
* | 通配符,匹配所有 |
@* | 通配符,匹配所有属性,如:@*="test" |
from selenium import webdriver
import time
driver = webdriver.Chrome()
driver.get("https://www.baidu.com")
# 定位到输入框并输入搜索内容
driver.find_element_by_xpath("//input[@id='kw']").send_keys("selenium")
# 定位到百度按钮,并点击
driver.find_element_by_xpath("//input[@class='btn self-btn bg s_btn']").click()
time.sleep(5)
# 关闭浏览器
driver.quit()
CSS 定位
css定位也可以较为灵活地选择控件的任意属性,一般情况下定位速度要比xpath要快,但比较复杂,这里只做简单介绍。有兴趣的可以深入了解。
选择器 | 例子 | 描述 |
---|---|---|
class | .intro | class选择器,选择class="intro"的所有元素 |
#id | #firstname | id选择器,选择id= " firstname"的所有元素 |
* | * | 选择所有元素 |
element | p | 元素所有<p>元素 |
element > element | div > input | 选择父元素为<div>的所有<input> 元素 |
element + element | div + input | 选择同一级中紧接在<div> 元素之后的所有<input> 元素 |
[attribute= value] | [target=_blank] | 选择target="_blank"的所有元素。 |
以百度输入框和搜索框为例:
- 🍄 find_element_by_css_selector(".s_ipt") #通过class属性定位
- 🍄 find_element_by_css_selector("#kw") #通过id属性
- 🍄 find_element_by_css_selector("input") #通过标签名
- 🍄 find_element_by_css_selector("span>input") #通过父子关系定位,查找span所有标签名叫input的子元素
- 🍄 find_element_by_css_selector("[name='kw']") #通过属性定位
- 🍄 find_element_by_css_selector("span.bg s_ipt_wr>input.s_ipt") #组合定位,父元素是span标签名,class属性是.bg s_ipt_wr,有一个子元素,标签名为input,class属性是s_ipt
辅助定位工具: chrome浏览器快捷键f12,打开elements,ctrl+f 可以调出元素查找框,输入表达式,定位元素是否存在且唯一。