博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Python爬取王者荣耀英雄图片及装备
阅读量:3952 次
发布时间:2019-05-24

本文共 1700 字,大约阅读时间需要 5 分钟。

在玩王者荣耀的时候一直想把装备合英雄的图片保存下来,但是官网的单个图片保存太慢一气之下写了个爬虫。

1.爬取装备

import requestsfrom bs4 import BeautifulSoupdef tupian(url):    headers = {        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.117 Safari/537.36'}    data = requests.get(url, headers=headers).content    soup = BeautifulSoup(data, 'lxml')    results = soup.find(attrs={"id": "Jlist-details"})    for res in results.select('li a img'):        #  图片的标题        title = res.get('alt')        # 图片的地址        url_img = res.get('src')        url_img = "http:" + url_img        print('开始下载='+title)        with open('F:\\input\\video\\装备\\'+title+'.jpg' , 'wb') as ouput:            ouput.write(requests.get(url_img,headers=headers).content);            print('下载完成=' + title)if __name__ == '__main__':    tupian("https://pvp.qq.com/web201605/item.shtml")

1.爬取英雄

import requestsfrom bs4 import BeautifulSoupdef tupian(url):    headers = {        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.117 Safari/537.36'}    data = requests.get(url, headers=headers).content    soup = BeautifulSoup(data, 'lxml')    results = soup.find(attrs={"class": "herolist"})    for res in results.select('li a img'):        #  图片的标题        title = res.get('alt')        # # 图片的地址        url_img = res.get('src')        url_img = "http:" + url_img        print('开始下载='+title)        with open('F:\\input\\video\\英雄\\'+title+'.jpg' , 'wb') as ouput:            ouput.write(requests.get(url_img,headers=headers).content);            print('下载完成=' + title)if __name__ == '__main__':     tupian("https://pvp.qq.com/web201605/herolist.shtml")

 

转载地址:http://lxkzi.baihongyu.com/

你可能感兴趣的文章
2017新生儿爆款名字出炉!90后的父母们最受欢迎的居然是.....
查看>>
全景图解高铁数据,谁是最有潜力的高铁城市?
查看>>
张小龙现场“约战”跳一跳,发布2018微信全新计划(内附演讲全文)
查看>>
爬取电影天堂的最新电影
查看>>
运维总监不会告诉你这些有趣但鲜为人知的 Linux 命令
查看>>
2017新浪微整形年度大数据报告
查看>>
实战 | 用 Python 选股票,据说可以多挣个20%
查看>>
重磅 | 数据挖掘之父韩家炜:文本语料库的数据挖掘(附视频+PPT下载)
查看>>
干货汇总 | 你可能不知道的 Python Web 部署方式总结
查看>>
技术人再不懂区块链,你就OUT了?漫画版
查看>>
快收藏!史上最全的 Linux Shell 文本处理工具集锦
查看>>
一小时爬千万数据的新浪微博爬虫
查看>>
简约而不简单的 Django 新手图文教程
查看>>
重磅!阿里首次全面公开展示AI布局(附布局图/成绩单/六产业详解)
查看>>
谷歌大脑2017技术研究总结 | Jeff Dean执笔(附论文 & 数据集)
查看>>
最新中国一二三四五线城市排名出炉!去这些城市买房准没错!
查看>>
BAT人工智能生态时局图:全面战争爆发前夜
查看>>
Python交互式数据分析报告框架~Dash介绍
查看>>
Chrome 浏览器 必知必会的小技巧
查看>>
Python奇技淫巧,看看你知道几个
查看>>