首页 > Python教程 > Python应用 > 我用Python纪念了那些被烂片收割的智商税!

我用Python纪念了那些被烂片收割的智商税!

时间:2019-10-26    作者:徐麟   来源:数据森麟公众号

前言 

随着电影行业的蓬勃发展,越来越多的电影出现在了观众的视野中,丰富了大家的生活,好的电影也能让大家在放松自我的同时收获一些对人生的思考。

然而,也有那么一些“烂片”,让大家在看过之后“添堵”,后悔为这种“烂片”贡献票房,白白被收割了“智商税”,今天,我们就用Python来几年那些被烂片收割走的智商税。

数据获取 

这次的数据源也是大家的老朋友,被亲切地称之为“马蜂窝”的豆瓣网,现在有很多平台会对电影进行打分,包括了猫眼和淘票票,但是相较之下,豆瓣的评分更加全面,一些冷门的“烂片”只能在豆瓣中被大家挖掘出来。

诚然,豆瓣的评分会存在一些“文艺滤镜”,对文艺片比较宽容,对此我们认为,“豆瓣评分高的不一定是真的高,但是被豆瓣打了低分的是真的低”。此次选择的影片范围是 2010 年至今的国产影片:

最终获取到了 3000 多部电影的数据,代码如下:

image.png

整体数据 

首先要做的事情就是看一下豆瓣对国产电影的整体打分情况,以此确定之后对“烂片”的划分依据,首先看一下整体评分的柱形图:

可以看到豆瓣用户对国产片还是比较严格,大多数电影都是在 6 分一下, 8 分以上的电影可以说是“凤毛麟角”,因此后续对烂片的标准也要相应放低,下面看一下各个将分数向下取整后的统计数量:

2010 年之后获得 9 分的国产电影只有一部,可以说是非常的不易,大家可以猜一下是哪部电影,看看是不是你心中的 9 分电影

下面为大家揭开谜底:

唯一一部获得 9 分的就是 18 年上映的《我不是药神》,未来也希望能有更多这样的优秀影片,而且这种期望也是有依据的,我们看一下每一年烂片和非烂片的占比:

可以看到从烂片和超级烂片占比在 16 年达到顶峰之后,从 17 年开始烂片占比在逐渐下降,相信未来烂片的占比也会逐渐下降

人气榜 

有了整体的综述后,我们确定了烂片和超级烂片的划分依据,将 4 分之下的影片划分为烂片, 3 分以下的影片划分为超级烂片,下面就分别来看看各自的人气榜:

可以看到在所有的影片中,人气TOP10 的影片评分都还是不错,流浪地球,药神和哪吒也都在票房中有非常不错的表现,显然,这不是我们需要,我们下面就来看下烂片和超级烂片中的人气榜:

热烈恭喜《上海堡垒》凭借2. 9 分的评分和 217110 的评价数喜提两项人气榜的冠军,《爱情公寓》因为“大忽悠”式的营销也跻身榜单,不知道即将上映的《爱情公寓5》能否为这一系列挽回一些口碑

票房榜 

同样,我们来分别看下所有影片、烂片和超级烂片的票房排行,看看究竟是哪些“烂片”在疯狂收割着大家的智商税,首先看一下左右影片的票房榜:

排名第 10 的西虹市首富票房都已经到了 25 亿,可见票房市场发展之迅速,今年国庆档的两部影片《我和我的祖国》以及《中国机长》分列八九名,相信未来这份榜单会不断的发生变化。

《西虹市首富》同样以6. 5 分的评分在榜单中评分最低,看来《西虹市首富》已经成为了一个标杆,6. 5 分也是一部票房卖座影片的底线,下面进入重点了,看一下那些疯狂收割大家智商税的烂片和超级烂片:

烂片票房榜中的TOP10 都超过了2. 6 亿,大闹天竺和爱情公寓更是分别收获了7. 5 亿和5. 5 亿的票房,疯狂收割着大家的智商税,相信未来随着大家对影片要求的提高,疯狂收割智商税的现象会逐渐减少

令人意想不到的是,就连超级烂片的TOP10 都可以收割 5000 万以上的票房,更是有四部票房过亿,在此提醒大家“观影有风险,选片需谨慎”

演员榜

一部烂片的诞生想必也离不开“演员”的努力,下面就来分别看看所出演电影平均分最高和最低的演员:

评分高的演员就无须赘述了,都是经过了市场和观众的挑战,但是目前还没有一位演员在主演影片数量超过 5 部之后,分数可以上7,诚然有一部分是因为豆瓣对国产的严格要求,但另一方面也在敦促电影人不断进步

下面看一下评分排在倒数的演员,首先看下BOTTOM10:

看到这份榜单,有种恍惚的感觉,确认这不是主持人或者相声、小品演员的榜单,我们不禁要问:大家有事吗?快乐家族更是“霸榜”,杜海涛凭借精湛的演技和出众的外形在榜单中独占鳌头,相信他未来会给大家带来更为“惊艳”的作品,吴亦凡也代表说唱歌手在榜单中出现,填补了榜单中歌手的空白。

由于过多的“跨界”演员出现在了榜单BOTTOM10 中,导致很多大家心目中的演员没有上榜,于是我们继续看BOTTOM11-20,这份榜单似乎正常了一点,但是好多更加应该在电视剧中出现的名字也位列其中。

看来电影和电视剧还是有所区别,在电视剧中能够大放异彩的演员未必能在电影中有同样精彩的表现,考虑到电视剧演员们的加入,继续把榜单范围放大到BOTTOM21-30:

这份榜单终于正常了很多,很多大家心目中的“种子选手”都不负众望地出现在了榜单中,特别是黄晓明和Angelababy这对模范夫妻的上榜,进一步提高了榜单的公信力,未来也希望他们能够继续联袂为大家带来精彩作品,很多人可能会表示怀疑,对此我们的回复很简单:我不要你相信,我要我相信!

相关推荐
用Python爬取B站5000 条视频,揭秘为何千万人为它流泪!
Python教程:如何用xlrd和xlwt库读和写Excel表格?
Python安装MySQL-python:EnvironmentError的解决办法
分享:Python2和Python3有那些差异?
Python正在吞噬世界:它为何会赢又将走向何方?
Python 的内置对象都藏了哪些小秘密?
实战干货!用案例让你一文搞懂python网络爬虫
Python教程:图像处理模块ndimage用法实例分析
Python教程:代理IP爬虫的使用方法
Python教程:如何使用scipy模块实现一维卷积运算示例?
Python:关于内存分配时的那些小秘密分享
python技巧:global关键字的用法详解
Python教程:深入了解python在HDA中的应用
python技巧:SSLerror的requests证书问题解决方法
PyCharm教程:搭建Spark开发环境的几个步骤
分享:Django Admin中增加导出CSV功能过程详解
Python开发技巧:openpyxl读取单元格字体颜色过程解析
Python教程:面向对象之Web静态服务器
Python教程:如何为终端提供持久性历史记录
Python技巧分享:自动登录淘宝并保存登录信息的方法
Python数据分析:利用Flask动态展示 Pyecharts 图表数据方法
python3教程:如何搭建微型的web服务器?
python技巧:xlwt如何设置单元格的自定义背景颜色
Python开发:Django中间件拦截未登录url实例详解
如何解决Python字符串和正则表达式中的反斜杠('\')问题?
Python开发技巧:编写一个简单登录功能过程解析
Python编程:postman传递当前时间戳实例详解
Python爬虫教程:使用beautifulSoup4爬取名言网案例代码分享
python开发:动态迁移solr数据过程分享
python数据分析:用线性回归预测股票价格的代码分析
Python教程:数据分析模块pandas用法详解
Python3教程:pandas.merge用法详解
Python爬虫案例:如何爬取豆瓣电影信息?附代码实例
python开发:如何编写简单端口扫描器?
Django框架教程:Pagination分页实现代码实例
python爬虫实例:猫眼电影和电影天堂数据csv和mysql存储过程

精彩推荐

热门教程