模拟登录Github

1. 检查请求

首先来到Github的登录页面,如下所示。


image.png

然后打开开发者模式,切换到Netword选项卡下,然后在浏览器输入用户名和密码,不要着急点击登录,先清除Network下的所有请求。
然后点击登录,会看到有很多的请求被发送出去。
接着找到第一个session请求,查看该post请求的form data,如下图所示。


Form data

其中的login 和 password就是我们所输入的账号名与密码。那么,接下来的模拟过程就是我们只需要构造这个form data然后往该请求的request URL发送数据就可以完成模拟登录。
经过分析可以发现,我们需要构造的参数有authenticity_token,ga_id , timestamp,timestamp_secret这四个参数,其他的例如commit ,utf8,webauth-invpaa-support 等可以直接复制。

2.构造请求参数

那么,我们要怎样构造所需要的四个参数呢?

2.1 authenticity_token

我们还是在登录页面打开开发者模式,不用输入账户密码进行登录,然后切换到Element选项下,在该页面下搜索token,发现只有一个搜索结果。


token

这个input元素里的value值就是authenticity_token的值,我们只需通过xpath选择器选择该节点,然后取其value属性即可。该xpath表达式为://input[@name="authenticity_token"]/@value

2.2 timestamp与timestamp_secret

同样,我们搜索timestamp可以同时发现timestamp与tiemstamp_secret两个参数。


timestamp&timestamp_secret

其value值也就是我们需要的参数值。
然后通过xpath选出该值。
timestamp://input[@name="timestamp"]/@value
timestamp_secret://input[@name="timestamp_secret"]/@value

2.3 ga_id

跟上面的思路一样,我们可以通过同样的方式找出ga_id,一共有两个搜索结果,一个是head 里的meta信息,还有一个是登录表单里的信息。


head-->meta

input

这两个元素里都有我们需要的值,meta里的content内容和inp里的value值就是ga_id 的值,而且这两个值是一样的。照理,我们也可以用xpath提取到ga_id的值。但是在程序完成之后,我们发现其他的值都可以提取出来,而ga_id提取的出来的值却为空,其原因是该元素是通过js动态加载的,在程序里是提取不到这个值的。所以,在这个地方我们有两种解决办法,一个是阅读js的代码,找到ga_id的生成方法后自己生成一个ga_id,还有一种是通过Selenium加载页面,然后按照xpath提取值。在这里我们选用第二种方法,因为这种方法快速简洁而方便。

    def ga_id(self):
        broser = webdriver.Chrome()
        broser.get(self.login_url)
        time.sleep(5)
        html = broser.page_source
        html = etree.HTML(html)
        ga_id = html.xpath('//div//input[@name="ga_id"]/@value')[0]
        return ga_id

这里要用Chrome驱动,用Phantomjs驱动依然提取不到值。
这样,我们需要的请求参数都构造完成了,接下来发送请求就可以了。

3.发送请求

    def login(self):
        formdata = {
            'commit':'Sign in',
            'utf8':'√',
            'authenticity_token':self.token(),
            'ga_id':self.ga_id(),
            'login':账号名,
            'password':密码,
            'webauthn-support':'',
            'webauthn-iuvpaa-support':'',
            'timestamp':self.timestamp(),
            'timestamp_secret':self.timestamp_secret()

        }
        response = self.session.post(self.post_url,data=formdata,headers=self.headers)

        # 测试登录后的页面
        zhuye = self.session.get('https://github.com/settings/keys',headers =self.headers)
        print(zhuye.text)

运行代码可以发现其输出了登录后才能显示的页面,也就模拟登录成功了。

完整代码如下:

# coding-utf-8
import time
import requests
from lxml import etree
from selenium import webdriver

class Login(object):
    def __init__(self):
        self.headers = {
            "Origin":"https://github.com",
            "Host":"github.com",
            "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:70.0) Gecko/20100101 Firefox/70.0"
        }
        self.login_url = "https://github.com/login"
        self.post_url = "https://github.com/session"
        self.session = requests.Session()

        self.lresponse = self.session.get(self.login_url, headers=self.headers)
        self.html = etree.HTML(self.lresponse.text)


    def token(self):
        token = self.html.xpath('//input[@name="authenticity_token"]/@value')[0]
        return token

    def ga_id(self):
        broser = webdriver.Chrome()
        broser.get(self.login_url)
        time.sleep(5)
        html = broser.page_source
        html = etree.HTML(html)
        ga_id = html.xpath('//div//input[@name="ga_id"]/@value')[0]
        return ga_id

    def timestamp(self):
        tiemstamp = self.html.xpath('//input[@name="timestamp"]/@value')[0]
        return tiemstamp

    def timestamp_secret(self):
        tiemstamp_secret = self.html.xpath('//input[@name="timestamp_secret"]/@value')[0]
        return tiemstamp_secret

    def login(self):
        formdata = {
            'commit':'Sign in',
            'utf8':'√',
            'authenticity_token':self.token(),
            'ga_id':self.ga_id(),
            'login':账号,
            'password':密码,
            'webauthn-support':'',
            'webauthn-iuvpaa-support':'',
            'timestamp':self.timestamp(),
            'timestamp_secret':self.timestamp_secret()

        }
        response = self.session.post(self.post_url,data=formdata,headers=self.headers)

        # 测试登录后的页面
        zhuye = self.session.get('https://github.com/settings/keys',headers =self.headers)
        print(zhuye.text)

if __name__ =="__main__":
    github = Login()
    github.login()
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,743评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,296评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,285评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,485评论 1 283
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,581评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,821评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,960评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,719评论 0 266
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,186评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,516评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,650评论 1 340
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,329评论 4 330
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,936评论 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,757评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,991评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,370评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,527评论 2 349

推荐阅读更多精彩内容