from seleniumimport webdriver
from selenium.webdriver.common.byimport By
"""
webDriver提供了8种元素定位方法:
id定位: find_element_by_id(id属性值)
name定位: find_element_by_name(name属性值)
tag定位: find_element_by_tag_name(标签名)
class定位: find_element_by_class_name(class属性值)
link_text定位: find_element_by_link_text(文本内容)
partial link定位:find_element_by_partial_link_text(部分文本内容)
XPath定位:find_element_by_xpath()
CSS_selector定位:find_element_by_css_selector()
"""
driver = webdriver.Chrome()
driver.get("https://www.baidu.com")
# link_text定位示例:
"""<a class="mnav" name="tj_trnews" href="http://news.baidu.com">新闻"""
driver.find_element_by_link_text("新闻")
# partial link定位示例:
"""<a class="mnav" name="tj_trnews" href="http://news.baidu.com">一个很长很长的文本链接</a>"""
driver.find_element_by_partial_link_text("一个很长很长的")
driver.find_element_by_partial_link_text("文本链接")
# XPath绝对路径定位:
driver.find_element_by_xpath("/html/body/div/div[2]/div/div/div/from/span/input")# div[2]表示当前层级下第二个div标签
driver.find_element_by_xpath("/html/body/div/div[2]/div/div/div/from/span[2]/input")# span[2]表示当前层级下第二个span标签
"""
XPath定位其他用法:
如果不想指定标签名,那么可以用*代替。
使用XPath不局限于id,name和class这三个属性值。
元素的任意属性都可以使用,只要他能唯一标识一个元素
"""
driver.find_element_by_xpath("//input[@id='kw']")
driver.find_element_by_xpath("//*[name='wd']")
driver.find_element_by_xpath("//*[@class='s_ipt']")
driver.find_element_by_xpath("//input[@maxlength='100']")
driver.find_element_by_xpath("//input[@autocomplete='off']")
driver.find_element_by_xpath("//input[@type='submit']")
"""
层级与属性结合
如果一个元素本身没有可以唯一标识这个元素的属性值,那么我们可以查找其上一级元素。
如果他的上一级元素有可以唯一标识属性的值,就可以拿来用。
<form id="form" class="fm" action="/s" name="f">
<span class="bg s_ipt_wr">
<input id="kw" class="s_ipt" autocomplete="off" maxlength="100" name="wd">
</span>
<span class="bg s_btn_wr">
<input id="su" class="s_btn" type="submit" value="百度一下">
</span>
</form>
"""
driver.find_element_by_xpath("//span[@class='bg s_ipt_wr']/input")
driver.find_element_by_xpath("//form[@id='form']/span/input")
driver.find_element_by_xpath("//form[@id='form']/span[2]/input")
"""
使用逻辑运算符
如果一个属性不能唯一区分一个元素,那么我们可以使用逻辑运算符连接多个属性来查找元素。
"""
driver.find_element_by_xpath("//input[@id='kw' and @class='s_ipt']")
"""
使用contains方法contains方法用于匹配一个属性中包含的部分字符串。
"""
driver.find_element_by_xpath("//span[contains(@class,'s_ipt_wr')]/input")
"""使用text()方法text()方法用于匹配显示文本信息。"""
driver.find_element_by_xpath("//a[text(),'新闻']")
"""contains和text()也可以配合使用"""
driver.find_element_by_xpath("//a[contains(text(),'一个很长很长的')")
"""
CSS_selector定位
<form id="form" class="fm" action="/s" name="f">
<span class=bg wrap>
<a href="#" class="demo_btn">demo</a>
</span>
<span class="bg s_ipt_wr">
<input id="kw" class="s_ipt" autocomplete="off" maxlength="100" name="wd">
</span>
<span class="bg s_btn_wr">
<input id="su" class="s_btn" type="submit" value="百度一下">
</span>
</form>
"""
# 通过class定位
driver.find_element_by_css_selector(".s_ipt")
driver.find_element_by_css_selector(".s_btn")
# 通过id定位
driver.find_element_by_css_selector("#kw")
driver.find_element_by_css_selector("#su")
# 通过标签名定位
driver.find_element_by_css_selector("input")
# 通过标签层级关系定位
driver.find_element_by_css_selector("span>input")
# 通过属性定位
driver.find_element_by_css_selector("[autocomplete=off]")
driver.find_element_by_css_selector("[name=wd]")
driver.find_element_by_css_selector("[type=submit]")
# 组合定位
driver.find_element_by_css_selector("form.fm>span>input.s_ipt")
driver.find_element_by_css_selector("form.#form>span>input#kw")
# 查找class属性包含"s_ipt_wr"字符串的元素
driver.find_element_by_css_selector("[class*='s_ipt_wr]")
# 查找class属性以"bg"字符串开头的元素
driver.find_element_by_css_selector("[class^=bg]")
# 查找class属性以"wrap"字符串结尾的元素
driver.find_element_by_css_selector("[clsss$=wrap]")
# 查找from标签下面第2个input标签的元素
driver.find_element_by_css_selector("form>input:nth-child(2)")
"""
用By定位元素find_element()方法用于定位元素,他需要两个参数。
第一个参数是定位的类型,由By提供。
第二个参数是定位的值,在使用By之前需要先导入(from selenium.webdriver.common.by import By)。
"""
driver.find_element(By.ID, "kw")
driver.find_element(By.NAME, "wd")
driver.find_element(By.CLASS_NAME, "s_ipt")
driver.find_element(By.TAG_NAME, "input")
driver.find_element(By.LINK_TEXT, "新闻")
driver.find_element(By.PARTIAL_LINK_TEXT, "新")
driver.find_element(By.XPATH, "//*[@class='bg s_btn']")
driver.find_element(By.CSS_SELECTOR, "span.bg s_btn_wr>input#su")