3秒爬取百度图片网站,批量下载各种图片
gaoyangw 2024-12-08 13:45 38 浏览 0 评论
前言
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。
作者:一行数据
PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取
http://t.cn/A6Zvjdun
这里想问大家三个问题:
- 你还在为表情包各种偷图吗?
- 你还在为找不到好看的图片素材在烦恼吗?
- 你还在为各种精美壁纸的挑选和下载找遍各大网站吗?
30行Python代码来帮你解决这个问题,现在你只要对代码进行复制、粘贴、运行三连就可以爬取你想要的图片。
import os
import requests
import re
keyWord = "杨超越" # 设置爬取图片的主题
number = 10 # 爬取图片数量
if not os.path.exists(keyWord):
os.makedirs(keyWord)
url = r'http://image.baidu.com/search/flip?tn=baiduimage&ipn=r&ct=201326592&cl=2&lm=-1&st=-1&fm=result&fr=&sf=1&fmq' \
r'=1497491098685_R&pv=&ic=0&nc=1&z=&se=1&showtab=0&fb=0&width=&height=&face=0&istype=2&ie=utf-8&ctd' \
r'=1497491098685%5E00_1519X735&word=' + keyWord
get = requests.get(url)
pciture_url = re.findall(r'objURL":"(.*?)",', get.text)
a = 1
for i in pciture_url:
p_type = i.split('.')[-1]
a += 1
try:
picture = requests.get(i, timeout=10)
name = "%s/%s_%d.%s" % (keyWord, keyWord, a, p_type)
with open(name, 'wb') as f:
f.write(picture.content)
print('第%d张图片正在下载' % a)
except:
print('第%d张图片下载失败!已跳过...' % a)
if a >= number:
break
代码逻辑主要是爬取百度图片网站的网页源码,然后从源码中提取每张图片的地址链接,使用循环保存每一张图片。
可以将这份代码直接拷贝到Python编辑器里,只需要修改keyWord变量和num变量,设置成自己想爬取的图片主题和数量就可以运行下载了。爬取的结果如下图所示:
爬取代码高级版本
上面的代码只能爬取一页,因为他只对一个网址里的图片链接进行提取,如果想爬取大批量的图片,需要提取图片网站下一页的链接,这个核心代码如下:
def get_url_one_page(url):
html = requests.get(url)
html.encoding = 'utf-8'
html = html.text
url_pic_this_page = re.findall(r'"objURL":"(.*?)",', html)
url_next_page_prefix = re.findall(r'<a href="(.*?)" class="n">下一页', html)
if len(url_next_page_prefix) != 0:
url_next_page = 'http://image.baidu.com' + url_next_page_prefix[0]
else:
print("已到达最后一页!")
url_next_page = None
return url_pic_this_page, url_next_page
在爬取关键词里输入想要爬取的图片主题,然后输入爬取图片张数,最后选择图片保存的路径并点击开始爬取就只需要静静等待即可(网速够快的话,一般来说一秒下载一张图片)最后下载后的结果如下
- 上一篇:百度搜索客户端新增图像识别功能
- 下一篇:PM小技术:图片随手找,原型快又好
相关推荐
- 招标公告-网络销售农资治理数据服务项目磋商公告
-
招标公告-网络销售农资治理数据服务项目磋商公告...
- 销售的几种方式(销售的十大方式)
-
以下是几种常见的销售方式介绍:传统线下销售-门店销售:在实体店铺中,销售人员与顾客面对面交流,介绍产品或服务,帮助顾客挑选合适的商品,促成交易。例如在商场的服装专卖店,销售人员会根据顾客的身材、喜...
- AI要干掉SaaS销售?(ai销售是什么意思)
-
随着AI技术的飞速发展,许多行业都在经历前所未有的变革,SaaS销售领域也不例外。最近,行业内关于“AI是否会取代SaaS销售人员”的讨论愈演愈烈,许多从业者感到焦虑不安。然而,SaaS行业老兵大D认...
- 网络上的性暗示广告泛滥,是商业营销手段还是道德底线的滑落?
-
刷到是缘分,感谢大家的阅读,希望您能动动小手帮忙点赞,关注,评论。你的支持和鼓励是我前进的动力。在此祝福大家天天快乐,日日开心!...
- 互联网上,怎么销售 销售是你必须掌握的创造财富的核心技能。
-
互联网上销售2个要点。销售是你必须要掌握的创造财富的核心技能,只有先促成交易才能获得利润。今天的内容非常重要,但是对于很多人来说并不容易理解,因为它和传统的教育理念有很多的冲突。我尽量慢一点,各位好好...
- 浅谈网站优化之站内优化(网站的站内优化)
-
网站优化分为站内优化和站外优化,今天我们只谈站内优化。在给网站做站内优化的同时,我们首先要做一个网站诊断,通过网站诊断,发现网站存在什么问题,然后进行优化。之所以需要优化,是发现网站没有排名,没有流...
- 想成为一个Web前端开发工程师,需要掌握的知识总结
-
前端工程师已经成为目前互联网企业极具竞争力的人才,企业不断提升薪资水平为了招聘到优秀的Web前端开发工程师。因此,越来越多的人想要学习Web前端。那么呢?Web前端的学习路线是什么?下面就和千锋武汉W...
- 合理站内优化-放你200米先跑(200米队伍能站多少人)
-
有一首民谣是这样说的:丢失了一个钉子,坏了一只蹄铁;坏了一只蹄铁,折了一匹战马;折了一匹战马,伤了一位国王;伤了一位国王,输了一场战斗;输了一场战斗,亡了一个帝国。从这首民谣中我们可以提炼出,一个微小...
- 教你分析竞争对手的网站,借鉴快速做好自己网站的SEO
-
关于seo爱好者来说,剖析竞争对手的网站是我们必需要做而且必需要做好的事情。但是很多SEO爱好者只晓得去察看,却不晓得应该如何剖析竞争对手的网站。...
- SEO优化重点在哪里?核心因素(seo的优化基础)
-
seo优化是一个长久的过程,也是一个持续坚持的过程。当然,了解了其中重点的核心因素,会让很多朋友少走很多弯路,所以,今天牵线的木偶想给大家分享下关于SEO比较核心的有些需要重点注意!(完全不了解SE...
- 站内SEO优化需要重视这16点才能提升网站排名!
-
1.H标签网站单个页面的H标签尽量控制在一定数量,常见的用法是h1标签1次,h2标签2次,h3标签用3词,也有很大部分的网站不用h1标签直接使用h2标签,这种情况常见于门户站、新闻站等。2.Alt描述...
- 广州网络包年推广 网络广告包年-易找网络服务中小企业
-
易找网络专注搜索平台关键词优化排名,信息流广告,朋友圈广告,网站建设等,专注于互联网广告业务,致力于帮各类行业广告主提供PC、移动的互联网效果资源,与国内主流媒体建立了深度战略合作。易找是在搜索引擎上...
- 网站建设公司背景与技术实力全面解析
-
今天我要给大家详细讲解一下网站建设公司的情况,这个行业里学问挺多。这些公司能够按照客户的具体要求和需求,制作出功能丰富、外观漂亮的网站,这在互联网领域非常重要。接下来,我们就从几个角度来详细探讨一番。...
- 全有家居朋友圈线上活动策划方案(附下载)
-
部分内容预览...
- 2025商业广场春季营销活动策划方案“春日放飞季”(附下载)
-
部分内容预览...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- 网站建设 (107)
- 网站开发 (47)
- 网络推广哪个平台好 (47)
- 百度收录 (50)
- 搜索引擎排名优化 (49)
- 关键词优化工具 (51)
- 外贸网站建设 (56)
- seo整站优化吧 (50)
- 广州seo (47)
- 苏州网站建设 (59)
- 百度搜索推广 (61)
- 关键词优化公司 (51)
- 网页制作 (47)
- 广州网站建设 (48)
- 电商网站建设 (49)
- 百度站长平台 (48)
- 网站收录查询 (46)
- 网站模板 (51)
- 厦门网站建设 (52)
- 百度快照推广 (51)
- 免费网页在线客服系统 (53)
- 雷神代刷网站推广 (53)
- 长尾关键词 (47)
- 手机网站建设 (53)
- 一键优化 (47)