python 爬虫 mc 皮肤站 little skin 的简单爬取

首先,找到一个皮肤网站,其中一个著名的皮肤网站就是https://littleskin.cn 。进入网站,我们就会见到一堆皮肤,这就是今天我们要爬的皮肤。给各位分享一下代码。

import requests
import re
import time
import json
download_sucess = True
time.sleep(1.5)
pictures = input('你想下载多少张皮肤:')
while pictures.isdigit() == False:
    print("请输入数字!")
    pictures = input('你想下载多少张皮肤:')
Path = input('请输入保存的路径:')
print("请稍等......")
pictures = int(pictures)
for i in range(1,pictures+1):
    url = 'https://littleskin.cn/skinlib/data?filter=skin&uploader=0&sort=likes&keyword=&page=' + str(i)
    response = requests.get(url).json()
    ids = re.findall("'tid': (.*?),",str(response))
    for id in ids:
        picture_url = 'https://littleskin.cn/preview/' + id + '.png'
    picture_name = picture_url.strip('https://littleskin.cn/preview/')
    picture = requests.get(picture_url).content
    try:
        with open(Path + '//%s'%picture_name,'wb') as file:
            file.write(picture)
    except FileNotFoundError:
        download_sucess = False
        print('路径不存在!')
        break
if download_sucess == False:
    print("下载失败!")
elif download_sucess == True:
    print('下载完成!')

最终效果:
python 爬取 mc 皮肤
皮肤爬取的原理是通过json格式来查看网站的每一张图片的id号,再用拼接的方式组成一个图片地址,最后再用二进制的方式把图片存放在我们的文件夹里。希望各位能通过这篇文章学到东西。

本作品采用《CC 协议》,转载必须注明作者和本文链接
coder Derek
附言 1  ·  4年前

喜欢的朋友点个赞吧!

讨论数量: 3

喜欢 mc 点的赞,哈哈

4年前 评论
Coolest (楼主) 4年前
小李世界 (作者) 4年前

噗…

LittleSkin 有什么好爬的…就算现在也只有 27K+ 份材质,资源相对来说还是太少了。

可以试试爬 Blessing Skin 演示站,现在有 34K+ 份材质。

BTW,你直接爬 https://littleskin.cn/preview/{tid}.png 不就好了吗…爬皮肤库干啥…

(利益相关:LittleSkin 创始人 & 现任站点管理员)

4年前 评论
小李世界 4年前
Coolest (楼主) 4年前
Coolest (楼主) 4年前

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容,与人为善,比聪明更重要!