作为一名热爱王者两年的程序员,早就想爬取所有英雄皮肤的高清照片,在设个幻灯片放映,真香,这次只用16行代码就能实现,对于新手拿这个作为实战练手项目既简单又容易上手,快来尝试下。
百度"王者荣耀"进入官网 https://pvp.qq.com/
,我这边直接以Goole Chrome浏览器为例,在更多工具中选择开发者工具
,或直接按F12
进入调试界面,然后按F5
刷新界面
图中标识的herolist.json
文件就是我们所需要的英雄列表,其中包括英雄编号、英雄名称、英雄类型、皮肤的名称等信息,在文件上右击复制链接
http://pvp.qq.com/web201605/js/herolist.json
接下来验证一下我们寻找的是否正确,代码:
import urllib.request
import json
import os
response = urllib.request.urlopen("http://pvp.qq.com/web201605/js/herolist.json")
hero_json = json.loads(response.read())
hero_num = len(hero_json)
print(hero_json)
print("hero_num : " , str(hero_num))
以上代码读取英雄列表并存入hero_json
,并获取英雄数量,运行效果如下图
点击首页的“游戏资料”标签页,进入新的页面后随意点击一个英雄头像进入英雄资料页面,以李白为例。同样的F12
然后F5
,将鼠标在李白的几个皮肤上一次扫过
如图:
可以看到李白的高清皮肤一共有6个,同样我们在一个皮肤上右键复制链接得到:
https://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/131/131-bigskin-6.jpg
分析这个链接我们可以发现,其中‘131’是英雄的编号,最后的’-6’是该英雄的皮肤编号。到这里,浏览器上所需要的信息我们已经全部获得,可以开始下载
在第一步获取到的herolist.json
文件中有'skin_name'
字段,我们只要解析这个字段就可以获取皮肤数量与名称。
代码如下:
hero_name = hero_json[0]['cname']
skin_names = hero_json[0]['skin_name'].split('|')
skin_num = len(skin_names)
print('hero_name: ', hero_name)
print('skin_names :', skin_names)
print('skin_num: ' + str(skin_num))
下载文件用到urlretrieve
接口,并且考虑两个问题:
- 检查文件夹是否存在,不存在则创建。
save_dir = 'D:\heroskin\\'
if not os.path.exists(save_dir):
os.mkdir(save_dir)
- 检查图片文件是否存在,如果存在则跳过下载。
if not os.path.exists(save_file_name):
urllib.request.urlretrieve(skin_url, save_file_name)
完整代码如下,除去注释和空行一共16行代码:
import urllib.request
import json
import os
response = urllib.request.urlopen("http://pvp.qq.com/web201605/js/herolist.json")
hero_json = json.loads(response.read())
hero_num = len(hero_json)
save_dir = 'D:\heroskin\\'
if not os.path.exists(save_dir):
os.mkdir(save_dir)
for i in range(hero_num):
# 获取英雄皮肤列表
skin_names = hero_json[i]['skin_name'].split('|')
for cnt in range(len(skin_names)):
save_file_name = save_dir + str(hero_json[i]['ename']) + '-' +hero_json[i]['cname']+ '-' +skin_names[cnt] + '.jpg'
skin_url = 'http://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/'+str(hero_json[i]['ename'])+ '/' +str(hero_json[i]['ename'])+'-bigskin-' + str(cnt+1) +'.jpg'
print(skin_url)
if not os.path.exists(save_file_name):
urllib.request.urlretrieve(skin_url, save_file_name)
实现后的效果如图所示:
分享到这结束啦,更多Python精彩内容可以关注我看我主页,爬虫案例与多种游戏源码分享需要的朋友可以私信我交流。