用Python获取英雄联盟皮肤原画?走过路过不要错过

前言

作为喜欢读书的我,也是很喜欢打游戏的,之前看到有人爬王者荣耀的皮肤的,我可是王者荣耀的老玩家了,所以我把英雄联盟给爬了。

哈哈哈,没想到吧!

在本次的爬虫教程的过程中,我也会分享给大家一些简单实用的爬虫小技巧。

夜太美,爬虫就没那么危险

在爬取的时候,不要猛攻嘛~,啊啊。。人家服务器受不了啊。。。

你要学会停顿,克制一点,该 sleep 就 sleep。

趁着人家睡觉的时候,限制防范程度是最低的,能晚点就晚点爬,没有看过凌晨4点的洛杉矶,但是你还可以看到凌晨4点的爬虫呢。

这样你的IP地址才不会容易被封。

这里多说一句,小编是一名python开发工程师,这里有我自己整理了一套最新的python系统学习教程,包括从基础的python脚本到web开发、爬虫、数据分析、数据可视化、机器学习等。想要这些资料的可以进裙930900780领取。

善于利用他人的UA

如果你在看别人网站的robots.txt,你就会看到别人的声明,声明什么内容可以爬,什么内容不可以爬。但是,不要忽略了人家的声明,希望给什么搜索引擎爬,比如下面这个

看到没,这个别人定义的robots.txt值得注意的是User-Agent,那么当你在Python构造headers的时候,User-Agent就直接指定它们的robots定义的就好了啊,比如:百度的UA,Google的UA或者是搜狗的UA等等。你再去爬爬看,那叫一个友好啊。

爬虫过程

分析网页

通过开发者模式F12,你就会发现箭头所指的文件了,没有看到的话,刷新一下试试。

url0 = 'https://game.gtimg.cn/images/lol/act/img/js/heroList/hero_list.js'

try:

    response = requests.get(url0, headers=headers)

    response.raise_for_status()

    response.encoding = response.apparent_encoding  # 设置编码格式

    hreolist = response.json() # 将Response转换成json格式

    print(hreolist) # 打印出英雄列表

    print(len(hreolist['hero']))    # 打印英雄个数:151

except Exception as e:

    print(e)

复制代码

通过上面的代码,我成功的获取到了所有的英雄,以及英雄的总个数。

这里只是截取部分的打印信息

{'hero': [{'heroId': '1', 'name': '黑暗之女', 'alias': 'Annie', 'title': '安妮', 'roles': ['mage'], 'isWeekFree': '0', 'attack': '2', 'defense': '3', 'magic': '10', 'difficulty': '6', 'selectAudio': 'https://game.gtimg.cn/images/lol/act/img/vo/choose/1.ogg', 'banAudio': 'https://game.gtimg.cn/images/lol/act/img/vo/ban/1.ogg', 'isARAMweekfree': '0', 'ispermanentweekfree': '0', 'changeLabel': '无改动', 'goldPrice': '4800', 'couponPrice': '2000', 'camp': '', 'campId': '', 'keywords': '安妮,黑暗之女,火女,Annie,anni,heianzhinv,huonv,an,hazn,hn'}

复制代码

通过上面的json信息其实你会发现,英雄的列表信息是写在了hero下的。

获取每一位英雄的ID值

通过刚刚获取到的json值,你会发现,这些值里面有一个键:'heroId',那么这个'heroId'是用来做什么的呢?

这个我开始是不知道的,接下来我进入到了皮肤原画的网址,马上就霍然开朗了

https://lol.qq.com/data/info-defail.shtml?id=1 安妮

https://lol.qq.com/data/info-defail.shtml?id=2 奥拉夫

https://lol.qq.com/data/info-defail.shtml?id=876 莉莉娅

复制代码

通过上面的三个URL地址你就会发现heroId就是一个查询参数id。

但是在这里有一个坑,想必你也看到了,英雄的个数只有151个,id值却是876,。没错,在前100多个英雄都不会有什么问题很有规律,但是100多之后就出现问题了,每个英雄的id值跳转的很多,所以要进入每一位英雄的原画去爬图片就必须要正确拼接URL。每位英雄的ID值获取就成了必不可少的一步。

url = 'https://game.gtimg.cn/images/lol/act/img/js/heroList/hero_list.js'

hero_list_json = hreolist

hero_lists = hero_list_json['hero']    # 获取英雄列表

heros_id = list(map(lambda x: x['heroId'], hero_lists))    # 获取英雄编号

复制代码

分析原画网页

打开开发者模式,你会发现一个文件

在上图中可以看到skins有10个值,点开第一个可以看到loadingImg,而这个键对应的值就是皮肤原画的URL地址。

当然,作为老玩家们都知道,莉莉娅只有两种皮肤,但是skins里面为什么有10个值,依次点开第三个至第十个,会发现其余的loadingImg的值都是空的。

url_list = []  # 保存每一位英雄信息的url地址

for hero_id in heros_id:

      url = 'https://game.gtimg.cn/images/lol/act/img/js/hero/{}.js'.format(hero_id)

      # print(url)

      url_list.append(url)

复制代码

url1 = 'https://game.gtimg.cn/images/lol/act/img/js/hero/876.js'

try:

    response = requests.get(url1, headers=headers)

    response.raise_for_status()

    response.encoding = response.apparent_encoding  # 设置编码格式

    hreo_info = response.json()

    skins = hreo_info['skins']  # 获取英雄皮肤信息

    # 遍历每一个皮肤的loadingImg与皮肤名称

    for skin in skins:

        print(skin['loadingImg'])

        print(skin['name'])

except Exception as e:

    print(e)

复制代码

通过上面的两组代码的思路,那么已经可以实现一个英雄的皮肤原画的爬取了,需要获取所有的皮肤原画,无非就是多一个循环。

当你会爬第一个英雄的原画时,你还怕得不到其他英雄吗?

结语

爬取英雄联盟的英雄原画的思路已经分享给大家了。

请问亲爱的读者,你是否可以将王者荣耀的英雄皮肤全部拿下呢?

相信你绝对是没有问题的,加油!

最后多说一句,小编是一名python开发工程师,这里有我自己整理了一套最新的python系统学习教程,包括从基础的python脚本到web开发、爬虫、数据分析、数据可视化、机器学习等。想要这些资料的可以进裙930900780领取。

本文章素材来源于网络,如有侵权请联系删除。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,294评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,780评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,001评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,593评论 1 289
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,687评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,679评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,667评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,426评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,872评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,180评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,346评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,019评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,658评论 3 323
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,268评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,495评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,275评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,207评论 2 352