Python爬虫——selenium模拟登陆新浪微博（网页）

上一篇文章Python爬虫——新浪微博（网页版）中提到cookie过期问题，想了一下可以通过selenium+chrome模拟登陆获取登陆成功后的cookies，然后构造字典返回，这样在主程序进行判断如果抓不到正确的数据，就重新模拟登陆获取新的cookies并返回（个人想法，测试可行）
URL入口+xpath定位
URL：http://weibo.com/login.php

输入框位置

** selenium+chrome**
这里如果没有安装相关的包，可以自行百度解决环境问题，主程序主要使用selenium相关的函数去模拟点击和输入事件，最后获取登录后的cookies，废话不多说，直接上代码供大家参考。
模拟登录Demo

import time
from selenium import webdriver

class COOKIE(object):
    url = 'http://weibo.com/login.php'
    def __init__(self):
        self.browser = webdriver.Chrome()
    def getcookie(self):
        self.browser.get(self.url)
        self.browser.implicitly_wait(15)
        self.browser.find_element_by_xpath('//*[@id="loginname"]').clear()
        self.browser.find_element_by_xpath('//*[@id="loginname"]').send_keys('你的用户名')
        self.browser.find_element_by_xpath('//*[@id="pl_login_form"]/div/div[3]/div[2]/div/input').clear()
        time.sleep(1)
        self.browser.find_element_by_xpath('//*[@id="pl_login_form"]/div/div[3]/div[2]/div/input').send_keys('密码')
        time.sleep(1)
        self.browser.find_element_by_xpath('//*[@id="pl_login_form"]/div/div[3]/div[6]/a').click()
        cookie_dic={}
        cookies = self.browser.get_cookies()
        self.browser.close()
        for cookie in cookies:
            if cookie.has_key('name') and cookie.has_key('value'):
                cookie_dic[cookie['name'].encode('utf-8')]=cookie['value'].encode('utf-8')
        return cookie_dic

遇到的问题

1.为什么没使用无界面的phantomjs，测试的时候使用的是chrome。并且成功返回了cookies，之后更换phantomjs后，出现找不到填充的位置的问题，之前以为是请求头等问题，添加之后仍然不可行，所以暂时采用chrome。
2.程序中间加了强制等待，这是因为，如果不加这个的话可能出现登录不成功的情况（可能于网速有关系吧），所以最好还是加上，时间自行调整。

selenium使用案例
想对selenium进一步了解的可以自行查相关的资料，然后就是在模拟登录的时候要找到正确URL入口和账户和密码的输入框的位置，这里给一个58同城登录的示例作为参考。

58同城登录界面

很显然我们用工具去抓的时候，给我的位置是第一个密码框的位置，但是这个位置是填充不进去值的，接着看下边同样也是密码输入框，但是display：none（隐藏了），然后我就想如果定位到这个位置能否成功填充密码，经测试果然可以，我们可以更改这个网页元素属性来看一下有怎样的变化。

更改属性后

我们可以看到我讲display的none属性去掉后，主页面多了一个密码框，所以这个才是真正的密码填充框，只不过一开始隐藏了。
总结
selenium模拟登录这块还是要找到正确的URL入口和正确的输入框位置，解决了这些差不多就可以完成模拟登录一个网站。

最后编辑于：2017.12.07 03:52:52

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 216,651评论 6赞 501
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,468评论 3赞 392
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 162,931评论 0赞 353
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,218评论 1赞 292
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,234评论 6赞 388
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,198评论 1赞 299
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,084评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,926评论 0赞 274
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,341评论 1赞 311
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,563评论 2赞 333
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,731评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,430评论 5赞 343
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,036评论 3赞 326
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,676评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,829评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,743评论 2赞 368
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,629评论 2赞 354

Python爬虫——selenium模拟登陆新浪微博（网页）

推荐阅读更多精彩内容