动态网页实战| python爬虫+前端框架Bootstrap
今天我们来爬取动态网页-爬取猫眼电影实时票房数据首先打开猫眼专业版-实时票房可以看到黄色的电影票房一栏是实时更新的。
而当我们查看该网页源代码时,却并没有电影相关的票房等信息那么可以判断该页面可能使用了 Ajax(即“Asynchronous Javascript And XML”(异步 JavaScript 和 XML))技术,即动态网页(是指跟静态网页相对的一种网页编程技术。
静态网页,随着html代码的生成,页面的内容和显示效果就基本上不会发生变化了——除非你修改页面代码。而动态网页则不然,页面代码虽然没有变但是显示的内容却是可以随着时间、环境或者数据库操作的结果而发生改变)。我们可以利用浏览器的开发者工具进行分析:
我们可以发现每隔一段时间都会有一个新的请求,其请求类型都为 xhr,而 Ajax 的请求类型就是 xhr,这请求可能就是实时更新的票房信息,而我们需要的数据可能就在这些文件里,于是我们选择一个进行分析:
复制链接打开可以发现这是一个json格式的数据。
我们想要获取的信息
都包含在list里面。所以第一步,先获取所有电影信息
可以看到已经成功的获取到了全部的影片信息。
获取对应的 JSON 数据后,下面对该 JSON 数据进行提取:
接下来我们就将提取好的票房信息存储为格式化的 HTML 文件:
浏览器打开生成的piaofang.html页面这页面丑的跟我一样,不忍直视啊!
我记得前端框架Bootstrap里面有好多的排版和样式,咱们一起去瞅瞅传送门:
我们随便选一个
导入我们爬虫获取到的数据,最后的页面就是这个样子的。
或者是这个样子的
就酱紫。。。你也可以根据自己的需要给它加上颜色啦、改变字体啦、添加背景图片啦等等。目的只有一个,让你的页面更具有吸引力!
上一篇:上海电影节明星红毯璀璨集结,200多部展映影片福利大放送!
下一篇:原来狱警也有编制,薪资待遇还不输公务员,不靠关系也可以进入
最近更新影视资讯
- 韵府群玉
- 老年临终关怀护理集锦9篇
- 如何评价剧场版动画《和谐(harmony/ハーモニー)》原作:伊藤计划 ?
- 智人战胜尼人的决定性因素 是神灵崇拜与艺术品 在3万7千年前智人击败了远比自己强
- 沈阳参考消息(2017年1月11日)
- 密集架区密集架书库图书馆负一楼期刊阅览区中外文期刊图书馆一楼图书借阅区(A-H
- 费维光:脾胃病17方
- 土耳其身为伊斯兰国家,为什么允许“风俗产业”合法化?
- 高中教师教学反思
- 三观尽毁!90后公务员出轨50岁女上司,聊天言语暧昧,妻子怒举报
- 22应用心理学考研347 首师360有调剂院校吗?
- 铃木凉美女士,你仍期待同时收获怜爱与尊敬吗?
- 团建别墅 | 确认过眼神,是能疯一起的人!Boss,今年年会我们泡私家温
- 《归来》观后感
- 翻译伦理的重要性和译者荣辱观建设研究
- 高二语文期末考试测试题及答案
- 国医大师名单!在北京看中医该找谁,这下全知道!
- 这些年爱过的同人文(BG)
- 荷兰深陷风俗业?日本都要甘拜下风,为何能稳坐世界顶尖位置!
- 戴安娜25年前私密录像首次解密:自述性生活,全英国都被炸懵逼了
- 原创上官婉儿为什么必须死,她做的这件事太无耻,李隆基忍无可忍
- 「医药速读社」Paxlovid临床失败 礼来斥巨资引进Kv1.3抑制剂
- 她是韩国性感女神,靠出演“三级片”走红,今41岁韵味不减当年!
- 电影市场有望点燃 好莱坞大片排队上映
- 评荐《传染病(Contagion)》