selenium获取元素信息常用方法_selenium获取元素文本-程序员宅基地

技术标签: Python+Selenium自动化测试自学笔记  python  selenium  测试工具  

selenium获取元素信息常用方法

如何使用 Selenium 获取网页元素的信息

Selenium 是一个用于 Web 应用程序测试的工具,可以使用它来模拟用户在浏览器中的操作,并进行自动化测试。其中最常见的任务之一就是获取网页元素的信息,我们可以使用 Selenium 提供的方法来获取元素的文本内容、大小、属性值等信息,进而对页面进行分析和处理。

方法名 方法解析
size() 返回元素的大小,即高度和宽度,返回值类型为字典。
text() 获取元素的文本内容。
get_attribute(attr_name) 获取元素的指定属性值,如获取超链接的 href 属性,可以通过 get_attribute(‘href’) 实现。
is_displayed() 判断元素是否可见,返回 True 或 False。
is_enabled() 判断元素是否可用,即是否被禁用,返回 True 或 False。
is_selected() 判断元素是否被选中,如单选框或复选框,返回 True 或 False。
current_url 返回当前页面的 URL。
title 返回当前页面的标题(即 < title > 标签中的内容)。

️实例讲解️

案例一

# 导入必要的库
from selenium import webdriver
from selenium.webdriver.common.by import By

# 创建一个新的 Chrome 浏览器实例
d = webdriver.Chrome()

# 打开京东首页
d.get('https://www.jd.com')

# 通过 CSS 选择器查找元素,并使用 size 方法获取了元素的大小(即高度和宽度)
jd_supermarket = d.find_element(By.CSS_SELECTOR, '[aria-lable="京东超市"]')
print(jd_supermarket.size)

# 通过 XPath 查找元素,并使用 text 方法获取了超链接的文本内容
jd_seckill = d.find_element(By.XPATH, '//div/a[4]')
print(jd_seckill.text)

# 通过 XPath 查找元素,并使用 get_attribute 方法获取了超链接的 href 属性值
jd_vipshop = d.find_element(By.XPATH, '//div/div/div[4]/ul/li/a')
print(jd_vipshop.get_attribute('href'))

# 关闭浏览器
d.quit()

案例二

判断元素是否可点击

判断元素在页面上是否可以点击,WebElement对象调用 is_enabled() 方法。

is_enabled()方法返回一个布尔值,若可点击返回: True 。若不可点击则返回: False 。

# 导入需要的模块
from selenium import webdriver  # 导入webdriver模块
import time  # 导入time模块
from selenium.webdriver.common.by import By  # 导入By模块

# 创建一个Chrome浏览器实例
driver = webdriver.Chrome()

# 打开百度首页
driver.get('https://www.baidu.com/')

# 定位百度首页的地图按钮
elm = driver.find_element(By.XPATH, '//*[@id="s-top-left"]/a[3]')

# 判断元素是否可点击
answer = elm.is_enabled()

# 打印结果
print(answer)  # 执行结果:True,故可以点击。

# 等待3秒
time.sleep(3)

# 关闭浏览器
driver.quit()

案例三

判断元素是否可见

判断元素在页面上是否可见,WebElement对象调用 is_displayed() 方法。

# 导入selenium模块中的webdriver和By模块
from selenium import webdriver
from selenium.webdriver.common.by import By

# 创建一个Chrome浏览器实例
driver = webdriver.Chrome()

# 最大化浏览器窗口
driver.maximize_window()

# 打开百度首页
driver.get('https://www.baidu.com/')

# 定位到百度地图按钮
elm = driver.find_element(By.XPATH,'//*[@id="s-top-left"]/a[3]')

# 判断百度地图按钮是否可见
answer = elm.is_displayed()
print(answer)

# 关闭浏览器
driver.quit()

案例四

判断元素是否可被选中

判断元素在页面上是否被选中,WebElement对象调用 is_selected() 方法。

is_selected() 方法返回一个布尔值,若被选中则返回:True 。若没被选中则返回:False 。

# 导入selenium模块中的webdriver和By模块
from selenium import webdriver
from selenium.webdriver.common.by import By

# 创建一个Chrome浏览器实例
driver = webdriver.Chrome()

# 最大化浏览器窗口
driver.maximize_window()

# 打开百度首页
driver.get('https://www.baidu.com/')

# 定位到百度地图按钮
elm = driver.find_element(By.XPATH,'//*[@id="s-top-left"]/a[3]')

# 判断百度地图按钮是否被选中
answer = elm.is_selected()
print(answer)

# 关闭浏览器
driver.quit()

执行结果:False,说明未被选中。

问题:有一个选项框,本身就是选中状态,如果再点击一下,它就反而变成了未被选中的状态,期望结果是该选项框处于选中状态;当该选项框为未选中状态时,判断去点击选中该选项框;当该选项框处于选中状态时,不做任何操作。

解决思路: is_selected() 检查是否选中该元素,一般针对单选框复选框,返回的结果是bool 值,元素处于未选中状态的时候返回 False,元素处于选中状态时返回 True。

# 导入selenium模块中的webdriver和By模块
from selenium import webdriver
from selenium.webdriver.common.by import By

# 创建一个Chrome浏览器实例
driver = webdriver.Chrome()

# 最大化浏览器窗口
driver.maximize_window()

# 打开百度高级搜索页面
driver.get("https://www.baidu.com/gaoji/preferences.html")

# 定位到“仅简体中文”这个选项
element = driver.find_element(By.XPATH,"//*[text()='仅简体中文']")

# 判断“仅简体中文”这个选项是否被选中
if element.is_selected():
    print("元素已经被选中")
else:
    print("元素没有被选中")

# 关闭浏览器
driver.quit()

获取url地址

在 Web 应用自动化测试中,获取当前页面的 URL 地址是一个非常基础的操作。Selenium 提供了多个获取方法来获取当前页面的 URL,下面将分别介绍这些方法的使用。

使用 current_url 属性

使用 current_url 属性可返回当前页面的 URL。

# 导入selenium库中的webdriver模块
from selenium import webdriver

# 创建一个Chrome浏览器实例
driver = webdriver.Chrome()

# 访问百度首页
driver.get('https://www.baidu.com')

# 获取当前页面的URL并打印出来
current_url = driver.current_url
print(current_url)

# 关闭浏览器
driver.quit()

使用 execute_script() 方法

使用 execute_script() 方法可获取当前页面的URL。

# 导入selenium库中的webdriver模块
from selenium import webdriver

# 创建一个Chrome浏览器实例
driver = webdriver.Chrome()

# 访问百度首页
driver.get('https://www.baidu.com')

# 使用JavaScript语言获取当前页面的URL并打印出来
current_url = driver.execute_script("return window.location.href")
print(current_url)

# 关闭浏览器
driver.quit()

使用 window_handles 属性和 switch_to.window() 方法

如果浏览器中只有一个标签页,可以直接通过 current_url 属性获取当前URL。

如果打开了多个标签页,此时获取的是当前活动标签页的URL。如果需要获取其他标签页的URL,则可以使用 window_handles 属性获取所有的标签句柄,然后通过 switch_to.window() 方法切换到对应的标签页,再获取URL。

# 导入selenium库中的webdriver模块
from selenium import webdriver

# 创建一个Chrome浏览器实例
driver = webdriver.Chrome()

# 访问百度首页
driver.get('https://www.baidu.com')

# 在新的标签页中打开Google首页
driver.execute_script('''window.open("https://www.google.com")''')

# 获取当前标签页的URL并打印出来
current_url = driver.current_url
print(current_url)

# 获取所有标签页的句柄
handles = driver.window_handles

# 切换到新标签页
driver.switch_to.window(handles[1])

# 获取当前标签页的URL并打印出来
current_url = driver.current_url
print(current_url)

# 关闭浏览器
driver.quit()

使用 page_source 属性

使用 page_source 属性可获取当前页面的源代码,然后通过正则表达式或其他方法解析出URL。

# 导入selenium库中的webdriver模块
from selenium import webdriver

# 导入re库中的正则表达式模块
import re

# 创建一个Chrome浏览器实例
driver = webdriver.Chrome()

# 最大化浏览器窗口
driver.maximize_window()

# 访问百度首页
driver.get('https://www.baidu.com')

# 获取页面源代码
page_source = driver.page_source

# 通过正则表达式解析出URL
url_pattern = re.compile(r'https?://(?:[-\w.]|(?:%[\da-fA-F]{2}))+')
urls = url_pattern.findall(page_source)

# 遍历所有的URL地址,并打印出来
for url in urls:
    print(url)

# 关闭浏览器
driver.quit()

获取网页title

在 Web 应用自动化测试中,获取网页 Title 是一个基础的操作,Selenium 提供了多个获取方法来获取网页 Title,下面将分别介绍这些方法的使用。

使用 title 属性

使用 title 属性可直接获取当前页面的 Title。

# 导入selenium库中的webdriver模块
from selenium import webdriver

# 创建一个Chrome浏览器实例
driver = webdriver.Chrome()

# 访问百度首页
driver.get('https://www.baidu.com')

# 获取当前页面的标题并打印出来
title = driver.title
print(title)

# 关闭浏览器
driver.quit()

使用 execute_script() 方法

使用 execute_script() 方法也可以获取当前页面的 Title。

# 导入selenium库中的webdriver模块
from selenium import webdriver

# 创建一个Chrome浏览器实例
driver = webdriver.Chrome()

# 访问百度首页
driver.get('https://www.baidu.com')

# 使用execute_script方法执行JavaScript代码,并返回当前页面的标题
title = driver.execute_script("return document.title")
print(title)

# 关闭浏览器
driver.quit()

使用 find_element(By.TAG_NAME,tag_name)方法

使用 find_element(By.TAG_NAME,tag_name) 方法可实现寻找 head 标签,然后进一步找到 title 标签,从而获取当前页面的 Title

# 导入selenium库中的webdriver模块和By类
from selenium import webdriver
from selenium.webdriver.common.by import By

# 创建一个Chrome浏览器实例
driver = webdriver.Chrome()

# 访问百度首页
driver.get('https://www.baidu.com')

# 使用find_element方法定位页面元素,并获取元素的textContent属性值
title = driver.find_element(By.TAG_NAME, "title").get_attribute("textContent")
print(title)

# 关闭浏览器
driver.quit()

使用 page_source 属性

使用 page_source 属性可获取当前页面的源代码,然后通过正则表达式或其他方法解析出 Title。

# 导入re模块和selenium库中的webdriver模块
import re
from selenium import webdriver

# 创建一个Chrome浏览器实例
driver = webdriver.Chrome()

# 访问百度首页
driver.get('https://www.baidu.com')

# 获取页面源代码
page_source = driver.page_source

# 使用正则表达式解析出页面标题
title_pattern = re.compile(r'<title>(.*?)</title>') # 创建一个正则表达式对象,用于匹配页面标题
title = title_pattern.findall(page_source)[0] # 通过findall方法获取页面标题
print(title)

# 关闭浏览器
driver.quit()

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/m0_67268191/article/details/131094009

智能推荐

从零开始搭建Hadoop_创建一个hadoop项目-程序员宅基地

文章浏览阅读331次。第一部分:准备工作1 安装虚拟机2 安装centos73 安装JDK以上三步是准备工作,至此已经完成一台已安装JDK的主机第二部分:准备3台虚拟机以下所有工作最好都在root权限下操作1 克隆上面已经有一台虚拟机了,现在对master进行克隆,克隆出另外2台子机;1.1 进行克隆21.2 下一步1.3 下一步1.4 下一步1.5 根据子机需要,命名和安装路径1.6 ..._创建一个hadoop项目

心脏滴血漏洞HeartBleed CVE-2014-0160深入代码层面的分析_heartbleed代码分析-程序员宅基地

文章浏览阅读1.7k次。心脏滴血漏洞HeartBleed CVE-2014-0160 是由heartbeat功能引入的,本文从深入码层面的分析该漏洞产生的原因_heartbleed代码分析

java读取ofd文档内容_ofd电子文档内容分析工具(分析文档、签章和证书)-程序员宅基地

文章浏览阅读1.4k次。前言ofd是国家文档标准,其对标的文档格式是pdf。ofd文档是容器格式文件,ofd其实就是压缩包。将ofd文件后缀改为.zip,解压后可看到文件包含的内容。ofd文件分析工具下载:点我下载。ofd文件解压后,可以看到如下内容: 对于xml文件,可以用文本工具查看。但是对于印章文件(Seal.esl)、签名文件(SignedValue.dat)就无法查看其内容了。本人开发一款ofd内容查看器,..._signedvalue.dat

基于FPGA的数据采集系统(一)_基于fpga的信息采集-程序员宅基地

文章浏览阅读1.8w次,点赞29次,收藏313次。整体系统设计本设计主要是对ADC和DAC的使用,主要实现功能流程为:首先通过串口向FPGA发送控制信号,控制DAC芯片tlv5618进行DA装换,转换的数据存在ROM中,转换开始时读取ROM中数据进行读取转换。其次用按键控制adc128s052进行模数转换100次,模数转换数据存储到FIFO中,再从FIFO中读取数据通过串口输出显示在pc上。其整体系统框图如下:图1:FPGA数据采集系统框图从图中可以看出,该系统主要包括9个模块:串口接收模块、按键消抖模块、按键控制模块、ROM模块、D.._基于fpga的信息采集

微服务 spring cloud zuul com.netflix.zuul.exception.ZuulException GENERAL-程序员宅基地

文章浏览阅读2.5w次。1.背景错误信息:-- [http-nio-9904-exec-5] o.s.c.n.z.filters.post.SendErrorFilter : Error during filteringcom.netflix.zuul.exception.ZuulException: Forwarding error at org.springframework.cloud..._com.netflix.zuul.exception.zuulexception

邻接矩阵-建立图-程序员宅基地

文章浏览阅读358次。1.介绍图的相关概念  图是由顶点的有穷非空集和一个描述顶点之间关系-边(或者弧)的集合组成。通常,图中的数据元素被称为顶点,顶点间的关系用边表示,图通常用字母G表示,图的顶点通常用字母V表示,所以图可以定义为:  G=(V,E)其中,V(G)是图中顶点的有穷非空集合,E(G)是V(G)中顶点的边的有穷集合1.1 无向图:图中任意两个顶点构成的边是没有方向的1.2 有向图:图中..._给定一个邻接矩阵未必能够造出一个图

随便推点

MDT2012部署系列之11 WDS安装与配置-程序员宅基地

文章浏览阅读321次。(十二)、WDS服务器安装通过前面的测试我们会发现,每次安装的时候需要加域光盘映像,这是一个比较麻烦的事情,试想一个上万个的公司,你天天带着一个光盘与光驱去给别人装系统,这将是一个多么痛苦的事情啊,有什么方法可以解决这个问题了?答案是肯定的,下面我们就来简单说一下。WDS服务器,它是Windows自带的一个免费的基于系统本身角色的一个功能,它主要提供一种简单、安全的通过网络快速、远程将Window..._doc server2012上通过wds+mdt无人值守部署win11系统.doc

python--xlrd/xlwt/xlutils_xlutils模块可以读xlsx吗-程序员宅基地

文章浏览阅读219次。python–xlrd/xlwt/xlutilsxlrd只能读取,不能改,支持 xlsx和xls 格式xlwt只能改,不能读xlwt只能保存为.xls格式xlutils能将xlrd.Book转为xlwt.Workbook,从而得以在现有xls的基础上修改数据,并创建一个新的xls,实现修改xlrd打开文件import xlrdexcel=xlrd.open_workbook('E:/test.xlsx') 返回值为xlrd.book.Book对象,不能修改获取sheett_xlutils模块可以读xlsx吗

关于新版本selenium定位元素报错:‘WebDriver‘ object has no attribute ‘find_element_by_id‘等问题_unresolved attribute reference 'find_element_by_id-程序员宅基地

文章浏览阅读8.2w次,点赞267次,收藏656次。运行Selenium出现'WebDriver' object has no attribute 'find_element_by_id'或AttributeError: 'WebDriver' object has no attribute 'find_element_by_xpath'等定位元素代码错误,是因为selenium更新到了新的版本,以前的一些语法经过改动。..............._unresolved attribute reference 'find_element_by_id' for class 'webdriver

DOM对象转换成jQuery对象转换与子页面获取父页面DOM对象-程序员宅基地

文章浏览阅读198次。一:模态窗口//父页面JSwindow.showModalDialog(ifrmehref, window, 'dialogWidth:550px;dialogHeight:150px;help:no;resizable:no;status:no');//子页面获取父页面DOM对象//window.showModalDialog的DOM对象var v=parentWin..._jquery获取父window下的dom对象

什么是算法?-程序员宅基地

文章浏览阅读1.7w次,点赞15次,收藏129次。算法(algorithm)是解决一系列问题的清晰指令,也就是,能对一定规范的输入,在有限的时间内获得所要求的输出。 简单来说,算法就是解决一个问题的具体方法和步骤。算法是程序的灵 魂。二、算法的特征1.可行性 算法中执行的任何计算步骤都可以分解为基本可执行的操作步,即每个计算步都可以在有限时间里完成(也称之为有效性) 算法的每一步都要有确切的意义,不能有二义性。例如“增加x的值”,并没有说增加多少,计算机就无法执行明确的运算。 _算法

【网络安全】网络安全的标准和规范_网络安全标准规范-程序员宅基地

文章浏览阅读1.5k次,点赞18次,收藏26次。网络安全的标准和规范是网络安全领域的重要组成部分。它们为网络安全提供了技术依据,规定了网络安全的技术要求和操作方式,帮助我们构建安全的网络环境。下面,我们将详细介绍一些主要的网络安全标准和规范,以及它们在实际操作中的应用。_网络安全标准规范

推荐文章

热门文章

相关标签