python教程网

当前位置：首页 » python爬虫 » 正文

Python Selenium自动化获取页面信息的方法

看: 1764次时间：2020-10-09 分类 : python爬虫

1.获取页面title

title：获取当前页面的标题显示的字段

from selenium import webdriver
import time 

browser = webdriver.Chrome()
browser.get('https://www.baidu.com') 

#打印网页标题
print(browser.title)
#输出内容：百度一下，你就知道

2.获取页面URL

current_url：获取当前页面的URL

from selenium import webdriver
import time 

browser = webdriver.Chrome()
browser.get('https://www.baidu.com') 

#打印网页标题
print(browser.current_url)
#输出内容：https://www.baidu.com/

3.获取浏览器版本号

capabilities['version'])：打印浏览器version的值

from selenium import webdriver
import time 

browser = webdriver.Chrome()
browser.get('https://www.baidu.com') 

#打印网页标题
print(browser.capabilities['version'])
#输出内容：67.0.3396.87

4.获取元素尺寸

size：返回元素的尺寸

from selenium import webdriver
import time 

browser = webdriver.Chrome()
browser.get('https://www.baidu.com') 

#定位输入框
input_box = browser.find_element_by_id('kw')
#打印输入框尺寸
print(input_box.size)
#输出内容：{'height': 22, 'width': 500}

5.获取元素的文本

text：返回元素的文本信息

from selenium import webdriver
import time 

browser = webdriver.Chrome()
browser.get('https://www.baidu.com') 

#定位备案元素
recordcode = browser.find_element_by_id('jgwab')
#打印备案元素信息
print(recordcode.text)
#输出内容：京公网安备11000002000001号

6.获得属性值

get_attribute('')方法
get_attribute('href'):获取href属性值
get_attribute('id'):获取id属性值

# coding=utf-8
import time
from selenium import webdriver


driver = webdriver.Chrome()
driver.maximize_window()
driver.implicitly_wait(6)
driver.get("https://www.baidu.com")
time.sleep(1)

for link in driver.find_elements_by_xpath("//*[@href]"):
  print (link.get_attribute('href'))
driver.quit()

到此这篇关于Python Selenium自动化获取页面信息的方法的文章就介绍到这了,更多相关Python Selenium 获取页面信息内容请搜索python博客以前的文章或继续浏览下面的相关文章希望大家以后多多支持python博客！

标签：selenium

2021-07-20Python爬虫基础之爬虫的分类知识总结
2021-07-20Python爬虫基础讲解之请求
2021-07-20PyQt5爬取12306车票信息程序的实现
2021-07-20Python爬虫之m3u8文件里提取小视频的正确姿势
2021-07-20如何用python抓取B站数据
2021-07-20快速搭建python爬虫管理平台
2021-07-20Python爬虫之获取心知天气API实时天气数据并弹窗提醒
2021-07-20Python爬虫之批量下载喜马拉雅音频
2021-07-20python使用pywinauto驱动微信客户端实现公众号爬虫
2021-07-20Requests什么的通通爬不了的Python超强反爬虫方案！

搜索

推荐资源

python教程网

当前位置：首页 » python爬虫 » 正文

Python Selenium自动化获取页面信息的方法

看: 1764次 时间：2020-10-09 分类 : python爬虫

相关文章

搜索

推荐资源

看: 1764次时间：2020-10-09 分类 : python爬虫