这里我们以搜狗微信公众号的验证页为例,实现验证码的定位截取。
# encoding:utf-8 from PIL import Image from selenium import webdriver url = 'https://weixin.sogou.com/antispider/?from=http://weixin.sogou.com/weixin?type=2&query=python' driver = webdriver.Chrome() driver.maximize_window() # 将浏览器最大化 driver.get(url) # 截取当前网页并放到D盘下命名为printscreen,该网页有我们需要的验证码 driver.save_screenshot('D:\\python371\\python_wordspace\\img\\printscreen.png') imgelement = driver.find_element_by_id('seccodeImage') # 定位验证码 location = imgelement.location # 获取验证码x,y轴坐标 print(location) size = imgelement.size # 获取验证码的长宽 print(size) rangle = (int(location['x']+110), int(location['y']+60), int(location['x'] + size['width']+165), int(location['y'] + size['height']+90)) # 写成我们需要截取的位置坐标 i = Image.open("D:\\python371\\python_wordspace\\img\\printscreen.png") # 打开截图 frame4 = i.crop(rangle) # 使用Image的crop函数,从截图中再次截取我们需要的区域 frame4=frame4.convert('RGB') frame4.save('D:\\python371\\python_wordspace\\img\\save.jpg') # 保存我们接下来的验证码图片 进行打码 driver.close()结果:
之后再对截取的验证码进行识别,模拟输入就行了。