前言
被我们寄予厚望的 Bang Dream! Ave Mujica 在短短两个月的连载生涯中给我们整了三个大活,无法预测的命运之舞台就这么成了臭水沟子,散发着阵阵恶臭。随着第 9 集的播出,Mujica 本就难绷的评分又迎来了雪上加霜的“骤降”。与此同时wsd、🍅、路边一条的海外观众和🐓🐘孝子还在坚持尽孝,令人忍俊不禁,堪称当代二十四笑典范。
本文希望以数据分析的方式和结论来打脸这帮脑子进🐘的阴湿耗子,并在此基础上对 Mujica 的整体制作进行一个阶段性的评价以及对后续发展的展望。
准备
数据来源
拟选取的平台是用户比较多的平台 B 站。那为啥不用权威性稍微强那么一点的番组计划(bangumi.tv)呢?因为人家有数据统计,我还统计个毛啊,直接上网看不香吗?
NOTEB 站的数据只能爬到附带评论内容的评价,只打分不评论的用户量由于没有相关 API 导致无法统计(毕竟我不可能为了统计这个把 B 站所有用户信息遍历一遍)。
数据爬取
B 站的数据主要分为短评和长评两个类型,主要通过 Web API 获取:
- 长评:
https://api.bilibili.com/pgc/review/long/list
- 短评:
https://api.bilibili.com/pgc/review/short/list
通过解析,可以发现这两个 Web API 都采用 GET 方式请求,并且请求参数的格式均相同:
{
"media_id": 23679586,
"ps": 30,
"sort": 0,
"cursor": 0
}
media_id
:媒体 ID,B 站的每个官方媒体资源都会分配一个媒体 ID,可直接通过 URL 查看。例如 Mujica 的官方界面 URL 为https://www.bilibili.com/bangumi/media/md23679586
,因此media_id
就为23679586
。ps
:获取评价数量。B 站的评论系统采用动态刷新机制,每次刷新只会获取最多 30 条评论(默认是 20 条)。sort
:排序方式。0
代表默认,即按照热度进行排序,1
代表按照时间进行排序。(这个参数对数据分析没多大用,反正最后要导出为表,排不排都行)cursor
:评论组的起始游标。如ps
参数所说,B 站的评论每次只能获取最多 30 条,而cursor
参数用来定位下一组评论的起始游标。他在每个评论请求响应的data.next
值中,每次请求评论后,需要获取此数据并传递给下一次请求。默认为 0,当所有评论都请求完后最后一组请求中会将data.next
重置为0
。
相应结构如下:
{
"code": 0,
"data": {
"count": 2571,
"folded": 0,
"list": [
{
"article_id": 1111111,
"author": {
"avatar": "https://i0.hdslb.com/bfs/face/xxxxxxxxxxxxxxxxxxxxxxxxx.webp",
"level": 5,
"mid": 11111111111,
"uname": "XXXXXX",
"vip": {
"avatar_subscript_url": "",
"nickname_color": "#FB7299",
"themeType": 0,
"vipStatus": 1,
"vipType": 2
},
"vip_label": {
"bg_color": "#FB7299",
"bg_style": 1,
"border_color": "",
"label_theme": "annual_vip",
"path": "",
"text": "年度大会员",
"text_color": "#FFFFFF"
}
},
"content": "XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX",
"ctime": 1739593421,
"is_origin": 1,
"is_spoiler": 0,
"media_id": 23679586,
"mid": 651845709,
"mtime": 1739593421,
"progress": "看到#05(18)",
"push_time_str": "2月15日",
"review_id": 328739,
"score": 10,
"stat": {
"likes": 5,
"reply": 34
},
"title": "XXXXXXXXXXXXXXXX",
"url": "https://www.bilibili.com/read/cvxxxxxxxxxx"
}
],
"next": 922337203675493,
"normal": 2571,
"total": 2571
},
"message": "success"
}
不难发现,这个结构中我们只需要获取 data.list
中的数据即可,其中主要是以下几个字段:
author.mid
:B 站用户 UID。author.name
:B 站用户名。content
:评论内容。ctime
:评论时间。score
:评分。
然后用 Python 爬取数据即可。
NOTEPython 脚本就不放了,规避一下风险。有了上面的解析写个脚本应该也不是什么难事。
然后我们获得了一个表头为 UID
用户名
评论内容
评论时间
评分
的数据表。直接导入到 SQLite 数据库里,方便后续的数据操作。
此外,我们还可以通过 https://api.bilibili.com/pgc/season/episode/web/info
API 来获取播放信息,统计观看人数,方便后续进行分析。结果如下:
集数 | 观看人数 |
---|---|
1 | 10228481 |
2 | 3854000 |
3 | 3731382 |
4 | 3562988 |
5 | 3427026 |
6 | 3180998 |
7 | 4534698 |
8 | 2463917 |
9 | 1285938 |
数据分析
分析方向
一部影视作品的数据分析方向大体可以分以下几种:
- 根据每集观看、评分情况做趋势分析
- 根据每集评分分布情况做画像分析
- 根据用户观看率做留存分析
分集评论数量
第七集的评价数量断崖式领先,第一、二集由于当时剧情尚未展开因此无人评价。
评分趋势
按分集统计
按日期统计
有具体的日期统计可以看到,即便是第七集播出后,评分依旧有些许的回弹。而第八集播出后评分看似回到了一个正常的水平,如果把第七集的数据去掉,第八集的数据可以无缝接在第六集后面,说明第八集是有观感回升的,但也有可能是观众预期调整的结果(不如说我觉得这个方面的影响更大)
评分分布统计
1星(2分)和 5星(10分)评价人数的统计
除第七集和第九集意外,Mujica 收到的 5 星评价是远比 1 星评价多的,侧面反应了 B 站观众其实还可以接受 Mujica 前期的叙事节奏和剧情展开问题,更加强力地证明了第七集是多屎才能让 B 站观众都觉得恶心开始大规模打低分。
各评分人数分布
观看人数统计
各集观看人数
第七集为什么会有这么多观看量我是不明白的,第六集应该没有好到会把普通观众吸引过来的地步,大概率是重复观看的结果。但是重复观看能看一百多万次吗?B 站的观众这么爱赤石?
另外即使是第七集屎到淋头第八集依然有相当一部分观众在看,这一点与番组计划的差异还是蛮大的,番组计划的数据显示第七集后有大量的观众弃番,而在 B 站这种情况规模要小得多。(虽然还是在降,但是与前期趋势是吻合的,没有出现断崖式的变化)
留存率统计
分析和评价
由上面 7 副图我们不难看出对于 B 站用户而言(或者说对在 B 站看 Mujica 的用户而言),整体的评价都是在下降的。一方面,前四集超速一般的叙事节奏已经搞得很多观众对剧情的接受度降低;另一方面,第七集拉了坨大的,给大伙儿恶心得够呛。第七集这个评分趋势图深谷的水平可见一斑。
同时,我要提出一个问题:是否真如某些群体所说,第七集的评分灾难是由部分群体恶意刷分的成果呢?
在除去第一集开播加持的情况下,第二集以后到第五集的观众留存率相对来说是比较稳定的。这个阶段的观众评分意愿是多少呢?我们不妨做个简单的统计:
集数 | 观看人数 | 评价人数 | 评价率 |
---|---|---|---|
3 | 3731382 | 2317 | 0.0621% |
4 | 3562988 | 1403 | 0.0394% |
5 | 3427026 | 3913 | 0.1142% |
6 | 3180998 | 2763 | 0.0869% |
NOTE第二集由于剧情问题导致没有什么讨论量,B 站的评论都是从第三集开始才出现的,因此这里只统计 3、4、5 集的数据。
可以看到评价人数不足千分之一。只有第五集达到了千分之一的水平。
但第七集又是什么情况呢?约为 0.498%,将近千分之五的水平。
集数 | 观看人数 | 评价人数 | 评价率 |
---|---|---|---|
7 | 4534698 | 22567 | 0.004977 |
而如果按照前几集的情况,按照 0.07%(取个近似平均值)的比例来算,这集的评价人数应该是 3431 人,而实际比这个值多出 19136 人,这集直接让评价参与人数翻了 5 倍多。
根据 NGA 用户@纱我纱你发起的投票结果,即使是最有争议的第七集,“某粉毛角色”的支持率也就 30% 多,更不用说其他集的支持率只有 15% 左右。这多出来的人总不能是凭空冒出来的吧?愿意来逛 NGA 猴区专版的几乎都是核心观众,核心观众突然来了这么多不再沉默开始发声的人群,那普罗大众的粉丝之间“路人”的角色转换数量绝对不是这 2 万的水平。
我们可以认为,第七集的灾难级演出吸引了(或者说恶心到)众多路人观众也加入了声讨作品和制作组的行列,而不是某个群体甩的锅说的那么简单。
另一个问题是第九集又算是一个小爆点(虽然是贬义的),这一集的叙事逻辑之混乱、剧情之想当然已经到达一个外星人都不太能看懂的程度了。B 站评分目前似乎锁定在了 6.5,但是根据评价数据实时计算的结果是 4.41 左右,而番组计划的评分也已经到了 5.2 这种“不过不失” 的水平,但以我个人见解很明显 Mujica 是有“过”的,这 5 分都打多了,得打 4 分。
后续展望
切割!狠狠地切割!
Mujica?Mujica 是什么?MyGO 啥时候出的续篇?不承认、不认可、不同意。柿本广大赶紧拽上赤坂明 Remake 去吧!
骂归骂,看还是要看的。我现在就想知道这个双子初华小姨说什么时候能兑现?以怎样的形式来演出?这番现在的作用就是每周给我找点乐子了。
十五年未有之——美少女乐队斗财阀,启动!