selenium的基本使用

    xiaoxiao2025-05-31  90

    1 加载网页:

    selenium通过控制浏览器,所以对应的获取的数据都是elements中的内容 ```python from selenium import webdriver # 指定driver的绝对路径 # driver = webdriver.PhantomJS(executable_path='/home/worker/Desktop/driver/phantomjs') driver = webdriver.Chrome(executable_path='/home/worker/Desktop/driver/chromedriver') # 向一个url发起请求 driver.get("http://www.itcast.cn/") # 把网页保存为图片 driver.save_screenshot("itcast.png") # 退出模拟浏览器 driver.quit() # 一定要退出!不退出会有残留进程!

    2 定位和操作:

    以百度搜索为例

    ```python import time from selenium import webdriver driver = webdriver.Chrome(executable_path='/home/worker/Desktop/driver/chromedriver') driver.get("https://www.baidu.com/") driver.find_element_by_id('kw').send_keys('python') driver.find_element_by_id('su').click() time.sleep(6) driver.quit()

     

    3 查看请求信息:

    ```python driver.page_source # 查看网页源码 driver.get_cookies() # # 获取当前浏览器的全部cookies driver.current_url # 获取当前页面的url ```

    4 退出

    ```python driver.close() #退出当前页面 driver.quit() #退出浏览器

     

    小结

    selenium的导包:from selenium import webdriverselenium创建driver对象:webdriver.PhantomJS()selenium请求数据:driver.get("http://www.baidu.com/")selenium查看数据: driver.page_source关闭无界面浏览器: driver.quit()根据id定位元素: driver.find_element_by_id(“kw”)操作点击事件: click()给输入框赋值:send_keys()

     

    最新回复(0)