干货 | 掌握 Selenium 元素定位，解决 Web 自动化测试痛点！

hogwarts · 2020 年7 月 16 日 04:11

有关 Selenium 的介绍在网上实在是太多了，总结起来就是一个目前在 Web 自动化方面运用最为广泛的一个开源、无浏览器要求、可支持多语言、设计测试用例非常灵活的自动化测试框架。

Selenium架构及核心组件

了解 Selenium 之前，我们需要了解 Selenium 的架构及核心组件。俗话说：『工欲善其事，必先利其器』。只有先了解架构及核心组件，才能了解该如何正确使用这个工具。才能让『它』成为我们工作中的一把利器，帮助我们解决难题。

Selenium架构

client：每个语言都有自己的库，提供不同的 API 供用户去调用完成相关的自动化测试行为；这里调用有关 web 自动化的 API 到 selenium 的 server
selenium：用于将接收到的请求传给浏览器的driver，实施调用，实际上 selenium 就是浏览器driver的一个封装
driver：针对浏览器的一个驱动引擎，每个浏览器都有自己的驱动（一般由各个浏览器厂商提供），可以通过驱动浏览器的API来完成对应操作
browser：浏览器

Selenium核心组件

selenium webdriver client （目前主要使用的，依赖于drivers）
selenium drivers (浏览器驱动，被webdriver client 所依赖)
selenium1 selenium-rc (已弃用)
selenium IDE (入门录制工具-本人不常用，仅了解过)
selenium grid （可操纵浏览器集群，也可操作App）

Selenium安装

第一步：组件安装

安装浏览器：web自动化，没浏览器好像说不过去了，先装浏览器是必须的
安装selenium driver，加入环境变量 path ：环境变量，老生常谈的问题了
安装selenium-client ：安装到这步后就可以开始web自动化了,不同语言的根据需要进行安装，如Java的可以使用 maven ,目前建议使用稳定版本的3.141.59：
安装selenium-ide : 新手入门，我在这里就不去演示了，需要入门了解的小伙伴可以查阅资料哈~

//此处为 Selenium-client 代码

 <groupId>org.seleniumhq.selenium</groupId>

 <artifactId>selenium-java</artifactId>

3.141.59

第二步：ChromeDriver下载

笔者这里主要用的是Chrome浏览器，所以就以Chrome为例。

1）先去到selenium官网的下载中心www.seleniumhq.org/download/；往下翻，翻到如下图的位置：

2）进去后找到与你当前Chrome浏览器版本对应的driver版本，下载对应系统的driver(需要梯子，如果没有继续往下看)

如果你没有梯子，无法去官网下载driver的话，这里提供一个淘宝的镜像，在国内的网络就可以直接下载 https://npm.taobao.org/mirrors/chromedriver

3）下载完成后解压到自己指定的路径即可，别忘了将路径添加到环境变量中(这里以Mac为例)

$ echo ‘export PATH=$PATH:chrome’ >> ~/.bash_profile

chrome改为chromedriver的存放路径

$ tail -1 ~/.bash_profile

元素定位

元素定位是做UI自动化最基础也是最重要的部分之一了，搞定了元素定位，算是推开了web自动化的大门，即可走进web自动化的世界。

现在我们用一个『侦探』的眼光，把元素定位当成一个『刑侦手段』，来看看如何利用元素定位这个刑侦手段，侦破一个『犯罪现场』。

首先，我们需要认识元素。元素是可识别区分的属性。 Selenium 的 WebDriver 一共提供了九种定位方法，其中最常用的是前八种，先来看看在Java中的对应关系

如上表所示，web自动化就是靠着HTML的各种标签、属性等来定位元素来进行操作，那么这些定位方式怎么理解？我们可以参考一个犯罪案例：

警察正在抓捕一名人犯罪嫌疑人，要确认犯罪嫌疑人的身份就可以根据嫌疑人的姓名、别名、指纹、身份证号、手机号等可识别区分的属性；同样的，元素自身也有 id 、 classname 、 tagname 、 name 等属性可用于区分定位；

此嫌疑人的反侦察能力比较强，隐藏了自己的身份特征，无法根据其自身的属性进行定位，那么就可以根据其经常出没的场所来进行定位抓捕，例如去某省某市的某个酒吧里，去某县某村某号的一个住所去；同样的，元素自身也可以通过 Xpath 和 CSS 这种标签的层级位置来定位元素。

到目前为止，嫌烦依然在逃，为了躲避侦查，曾经的常去场所都不再接触，高手！这是高手！苦苦的等待，最终办案民警们终于有了线索(接下来该办案民警出场讲述转机了~)：由于犯罪嫌疑人是个大孝子且十分疼爱自己的妻儿，于是在某个地方偷偷的给父母通了电话，去学校见了妻儿；最终根据其家人提供的信息暴露自己，被定位抓获！同样的，元素也可以通过与其相关的元素来进行定位，我们就可以用 CSS 或 Xpath 来进行父子，兄弟等节点位置的方式来进行定位了。

案件告破，案件总结-定位元素的方法

Warning！下面在介绍各种定位方式的时候还会顺便补充CSS的定位方式作为对比，首次接触的话可能会因为看不懂而引起不适，不用担心，可以先忽略，后面会专门介绍CSS的，待了解了CSS定位方式后再回来学习

1.By ID - 身份证

现在我们要定位testerhome首页右上角的欢迎，如下图：

打开Chrome开发者工具，选中元素进行查看，元素是有id的，可以根据id来定位：

WebDriver driver = new ChromeDriver();
driver.findElement(By.id(“cornertip”));
driver.findElement(By.cssSelector(“#cornertip”)); //CSS

小技巧 ：我们可以在 Chrome 的开发者工具中 Control+F 搜索框中对我们要定位的元素进行搜索来确认定位是否正确，支持 CSS 和 xpath ，如上图所示

2.By Class Name - 别名

要定位 testerhome 首页的搜索框，就可以根据 ClassName ，如下图：

WebDriver driver = new ChromeDriver();
driver.findElement(By.className(“form-control”));
driver.findElement(By.cssSelector(“.form-control”)); //CSS

3.By Name - 姓名

依然定位首页的搜索框，可通过 name 和 CSS 定位：

WebDriver driver = new ChromeDriver();
driver.findElement(By.className(“q”));
driver.findElement(By.cssSelector(“[name=‘q’]”)); //CSS

4.By Tag Name

依然是定位 testerhome 首页的搜索框，通过 tagname ： input 来定位

WebDriver driver = new ChromeDriver();driver.findElement(By.tagName("input"));driver.findElement(By.cssSelector("input"));  //CSS

5.By Link Text

定位testerhome首页一周最热的帖子，通过 linktest 和 CSS :

WebDriver driver = new ChromeDriver();driver.findElement(By.linkText("[深圳][头条] 招聘测试 leader"));

driver.findElement(By.cssSelector("a[title='[深圳][头条] 招聘测试 leader']"));

By Partial Link Text

定位 testerhome 首页一周最热的帖子，通过 partialLinkText 和 CSS

WebDriver driver = new ChromeDriver();

driver.findElement(By.partialLinkText(“[深圳][头条]”));

driver.findElement(By.cssSelector(“[title~=‘[深圳][头条]’]”)); //CSS

7.Using JavaScript

有时候我们的页面元素被遮挡导致无法定位，需要滚动屏幕进行可视化，便可以用JS来操作

((JavascriptExecutor)(driver)).executeScript(“window.scroll(0, 1200)”);

8.By Xpath

XPath 是一门在 XML 文档中查找信息的语言。 XPath 可用来在 XML 文档中对元素和属性进行遍历,而 HTML 又正好可以看做是 XML 的一种实现，因此我们便可以用 xpath 来定位元素啦

问题：一般刚开始学定位的时候很多人都会想，都有了上面那么多种定位方式了，还要 xpath 干吗？感觉还挺复杂的样子（和其他的定位方式相比却是要复杂那么一丢丢）~
答：那是因为并不是所有的元素都“如您所愿”，就如上面警察抓捕罪犯的例子，有时候元素并不能直接提供给我们想要的定位

常用路径表达式：

举几个简单的栗子

1）绝对路径定位：

做测试开发或者有编程经验的小伙伴一定对绝对路径不陌生，通过绝对路径就是使用元素在页面上的完整路径。

还是以定位一周内的最热门帖子为例，在Chrome浏览器的开发者工具栏中，找到要定位元素的HTML位置，右击会出现 Copy full Xpath ,点击它

然后我们把复制到的内容黏贴后如下：

/html/body/div[2]/div[2]/div/div[2]/div[1]/div[2]/div[1]/div/a

写到代码里就是这样：

WebDriver driver = new ChromeDriver();

driver.findElement(By.xpath(“/html/body/div[2]/div[2]/div/div[2]/div[1]/div[2]/div[1]/div/a”));

可以用又臭又长来形容了，那么细心的小伙伴会发现还有一个 Copy xpath ，复制黏贴后内容如下：

//*[@id=“main”]/div/div[2]/div[1]/div[2]/div[1]/div/a

看起来好像简化了点，还用上了 xpath 的语法，但是实际上也没优化多少，依然是通过标签的层级关系，从最外层一级一级的往下找，也不是很可取；

其实不可取的最主要原因还是这种 绝对路径 的方式在实际自动化过程中很不稳定，界面的位置发生任何一丢丢的变化，那元素的绝对路径就很可能变了，也就无法准确定位了。

因此我们就要用 元素的属性 或者 属性和层级关系 相结合的方式来定位，这样就算页面变化，只要变化不是非常大，依然可以通过元素的属性和相对的位置来进行定位，受页面位置变化的影响就要小的多了

2）元素属性定位：

定位 testerhome 首页的 欢迎 ，利用 xpath 语法通过 id 来定位：

WebDriver driver = new ChromeDriver();
driver.findElement(By.xpath(“//div[@id=‘c-button’]”));

语法解释： //div 表示从当前页面的 div 标签开始匹配， @id 表示用id属性值， = 后面跟着具体的 id 值

3）属性和层级关系定位：

上面的通过属性定位完全可以用 WebDriver 的 API 或者 CSS 搞定， xpath 最大的价值就是上面说的当元素没有直接可定位的属性时，它的价值才得以完美体现：

现在我们要定位” 七日最热 Top10 “这个标题，它只有 class 属性，我们按照 className 来进行定位会发现如下情况：

没错，出现了10个可被定位到的元素，因为有很多的标题都有相同的 classname ，并且没有其他如 id ， name 等属性了；没办法了，我们就要往上找，我们发现往上2个 div 标签节点， classname 为” col-md-3 home-side-bar “的标签节点是唯一的：

现在我们就利用 Xpath 先定位到唯一的那个 class ，然后往下找两层 div ，再取两层后 div 中的第一个就可以了

WebDriver driver = new ChromeDriver();
driver.findElement(By.xpath(“//*[@class=‘col-md-3 home-side-bar’]/div[1]/div[1]”));

4）使用Xpath运算符定位：

Xpath还支持运算符，如果元素的一个属性无法定位，需要使用多个属性时可以使用Xpath运算符将多个属性连接起来一起定位

Xpath常用运算符

现在需要定位 testhome 社区首页一篇最新帖子的作者，作者名为“乌云乌云快走开” 如果我们只依靠 className 的话会发现有28个相同属性的元素，如下图：

继续观察会发现还有一个叫做 data-name 的属性，属性值就是作者的姓名，我们通过and符将两个属性连接后便发现可以精准定位到指定元素了：

WebDriver driver = new ChromeDriver();
driver.findElement(By.xpath(“//a[@class=‘user-name’ and @data-name=‘乌云乌云快走开’]”));

5）使用Xpath函数定位：

Xpath还提供了很多函数来供我们更灵活的定位，这里以我常用的一个 contains 函数为例

我们依旧来定位 testerhome 首页七日最热贴的首贴“[深圳][头条] 招聘测试 leader”，通过对DOM的分析可以看到 title 属性的内容就是帖子的标题，我们用此属性值的一部分来作为定位条件：

关于Xpath的语法使用还有很多，包括还有很多函数，具体的可参考W3C进行学习：https://www.w3school.com.cn/xpath/xpath_syntax.asp

9.By CSS

Web页面的样式通常保存在外部的 .css 文件中。通过仅仅编辑一个简单的 CSS 文档，外部样式表使你有能力同时改变站点中所有页面的布局和外观。因此我们可以利用CSS的选择器来定位页面绑定了属性的元素，从而为我们的selenium所用

从上面的文章一路看下来的小伙伴应该发现了，在介绍 xpath 之前的定位方式时，都另外还写了一个 CSS 的定位方式，没错，就是它，没注意的小伙伴可以返回去看一看；

推荐使用CSS： CSS 也是我们在Web自动化中最推荐使用的一种方式，原因又如下几种：

例如 id 这种元素在一个页面中可能并不唯一，并且很有可能是前端的框架自动生成的，研发人员并未对其进行维护，随时可能变；而 CSS 是前端开发最常用的一种维护方式，对于我们开发和维护自动化用例也更为清晰和方便
大部分定位都可以用 CSS 来解决
CSS 的写法相较于 Xpath 要更为简洁

常用的CSS选择器语法：

先将前面已经演示过的 CSS 语法在这来个小的汇总：

通过 id ``

WebDriver driver = new ChromeDriver();driver.findElement(By.cssSelector("#cornertip"));  //CSS

通过 className

WebDriver driver = new ChromeDriver();driver.findElement(By.cssSelector(".form-control"));

通过 name

WebDriver driver = new ChromeDriver();driver.findElement(By.cssSelector("[name='q']"));

通过 tag name

WebDriver driver = new ChromeDriver();driver.findElement(By.cssSelector("input"));

通过 link text

WebDriver driver = new ChromeDriver();driver.findElement(By.cssSelector("a[title='[深圳][头条] 招聘测试 leader']"));

通过 partialLinkText

WebDriver driver = new ChromeDriver();driver.findElement(By.cssSelector("[title~='[深圳][头条]']"));

另外CSS也可以将属性和层级关系组合在一起进行使用，现在我们以这种组合方式来定位testerhome社区置顶帖的第一篇帖子：

WebDriver driver = new ChromeDriver();
driver.findElement(By.cssSelector(“.panel-heading+div>div>div.topic-20857”));

简要说明： .panel-heading ：class值为panel-heading +div : 后面紧接着的div >div ：后面所有子的div div.topic-20857 ：class名为topic-20857的div标签

更多细节和用法可参考W3C进行学习：

https://www.w3school.com.cn/cssref/css_selectors.asp

参考文档：

selenium官网：https://selenium.dev/documentation/en/