python+Selenium之自动滑块破解滑块验证码

头大系列:以虎嗅网注册页面的滑块验证码为例:

开发环境

  • python3.7
  • selenium模块
  • re模块
  • PIL模块
  • urllib模块

破解分析

打开浏览器调试工具,点击左上角按钮进行页面元素跟踪,然后将鼠标移动到滑块验证码的图像上,就发现问题了,这也是关键所在:

验证码的图像是由很多个这样的10x58(宽10高58)的小方块拼接而成的。再检查一下元素标签,发现每一个小方块的元素标签里面都有background-image:url以及background-position这两个关键的信息。

既然是url,就不妨打开链接来观察。发现打开的链接是一张图片,但却是一张乱七八糟的图片。

得到这张乱七八糟的图片,第一感觉是重影。试猜想,会不会将每一个小方块的url链接图片都重叠在一起或拼接在一起就能组成我们所看到的验证码图片。

但经打开每一张图片发现,每个小方块后面的url链接的图片是一样的。
这就说明不可能是将图片进行重叠或拼接了。那就有可能是另外一种可能:将这张完整的验证码图片的部分区域切割然后打乱排序,形成一张新的图片,而这张新的图片就是我们现在所看到的乱七八糟的图片。

再观察发现,每个小方块后面还有background-position这个重要的信息。发现里面正是-157px -58px; -145px -58px;这种形式,是不是很像坐标的形式了。而进一步猜想,将我们刚刚的乱七八糟的图按每一个小方块的坐标进行切割,然后再进行排序,是不是就能得到原来完整的验证码图片了。

def go():
    ...
    fulls = driver.find_elements_by_class_name('gt_cut_fullbg_slice')
    locationlist = []
    for index,full in enumerate(fulls):
        fulllocation = {}
        cc = full.get_attribute('style')
        fullurl = re.findall(r'url\("(.*?)"\);',cc)[0].replace('webp','jpg')
        fulljpg = fullurl
        fulllocation['x'] = re.findall(r'background-position:(.*?)px .*?px;',cc)[0]
        fulllocation['y'] = re.findall(r'background-position:.*?px (.*?)px;',cc)[0]
        locationlist.append(fulllocation)
    namea = "full78.jpg"
    urllib.request.urlretrieve(fulljpg,namea)
    getfull(namea,locationlist)

进行实践:
运用PIL模块的切割crop()以及粘贴paste(),重新将图片进行整合。效果神奇出现:

def getfull(namea,locationlist):
    old = Image.open(namea)
    new = Image.new('RGB',(260,116))  #260,116是完整验证码的大小,10x58的小方块一共有56块。一行26个,即260。上下两行,即116。
    shang = []
    xia = []
    for location in locationlist:
        if location['y'] == str(-58):
            shang.append(old.crop((abs(int(location['x'])),58,abs(int(location['x']))+10,116)))
        if location['y'] == str(0):
            xia.append(old.crop((abs(int(location['x'])),0,abs(int(location['x']))+10,58)))
    #粘贴
    i = 0
    for ima in shang:
        new.paste(ima,(i,0))   #根据图片左上角的坐标来粘贴
        i +=10
    i = 0
    for imx in xia:
        new.paste(imx,(i,58))
        i +=10
    new.save("yes.jpg") 

先不管其他了的。先把两张完整的图片拼接出来再进行下一步吧。
按照相同的方法,找到页面元素中鼠标点击后的出现缺口的验证码图片位置,找到缺口图片乱七八糟的url链接。

通过相同方法拼接:

已经得到两张关键的验证码图片,那接下来就是PIL大显身手的时候了,对比两张图片的像素点,缺口位置明显黑了一块,也就是RGB三色必然与周围的像素RGB三色差别明显。

将两张图片的每个像素点进行遍历对比,RGB三色任意一色差距大于一定的范围即视为是滑块的缺口。

def compare(yes,no):
    for xzhou in range(0,260):
        for yzhou in range(0,116):
            pianyi = offset(yes,no,xzhou,yzhou)
            if pianyi == None:
                pass
            else:
                return pianyi  

def offset(yes,no,x,y):
    pix1 = yes.getpixel((x,y))
    pix2 = no.getpixel((x,y))
    for rgb in range(0,3):
        if pix1[rgb] - pix2[rgb] > 48:
            print (x)
            return x  #这就是偏移量

找到缺口之后返回遍历的像素点的x坐标值(因为滑块只能X轴左右移动,所以y轴可以不需要用到),而x坐标就是滑块需要移动的距离。

def startslide(driver,xoffest):
    slideelements = driver.find_element_by_xpath('//*[@id="login-modal"]/div/div/div/div[2]/div/div[2]/div/div[3]/div[2]')
    person = ActionChains(driver)
    person.click_and_hold(slideelements)
    allx = int(xoffest)+16  #乱图与完整的图大小是有差别的,完整图的偏移量较小,我们所滑动的偏移量较大,故这根据情况调试。
    person.move_to_element_with_offset(slideelements,allx,0).release().perform()
    print ("OK")

结果展示:

完美拼接。但被吃了,也是美中不足:
快速,匀速,准确,所谓的“快,准,稳”,一样不差。
那就认定你是机器人来滑动的吧,把你吃掉!

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 210,914评论 6 490
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 89,935评论 2 383
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 156,531评论 0 345
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,309评论 1 282
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,381评论 5 384
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,730评论 1 289
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,882评论 3 404
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,643评论 0 266
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,095评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,448评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,566评论 1 339
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,253评论 4 328
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,829评论 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,715评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,945评论 1 264
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,248评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,440评论 2 348

推荐阅读更多精彩内容