2468 字
12 分钟
原创的狂欢(雾)——Bang Dream! Ave Mujica 评分分析

前言#

被我们寄予厚望的 Bang Dream! Ave Mujica 在短短两个月的连载生涯中给我们整了三个大活,无法预测的命运之舞台就这么成了臭水沟子,散发着阵阵恶臭。随着第 9 集的播出,Mujica 本就难绷的评分又迎来了雪上加霜的“骤降”。与此同时wsd、🍅、路边一条的海外观众和🐓🐘孝子还在坚持尽孝,令人忍俊不禁,堪称当代二十四笑典范。

本文希望以数据分析的方式和结论来打脸这帮脑子进🐘的阴湿耗子,并在此基础上对 Mujica 的整体制作进行一个阶段性的评价以及对后续发展的展望。

准备#

数据来源#

拟选取的平台是用户比较多的平台 B 站。那为啥不用权威性稍微强那么一点的番组计划(bangumi.tv)呢?因为人家有数据统计,我还统计个毛啊,直接上网看不香吗?

NOTE

B 站的数据只能爬到附带评论内容的评价,只打分不评论的用户量由于没有相关 API 导致无法统计(毕竟我不可能为了统计这个把 B 站所有用户信息遍历一遍)。

数据爬取#

B 站的数据主要分为短评长评两个类型,主要通过 Web API 获取:

  • 长评:https://api.bilibili.com/pgc/review/long/list
  • 短评:https://api.bilibili.com/pgc/review/short/list

通过解析,可以发现这两个 Web API 都采用 GET 方式请求,并且请求参数的格式均相同:

{
    "media_id": 23679586, 
    "ps": 30,
    "sort": 0,
    "cursor": 0
}
  • media_id:媒体 ID,B 站的每个官方媒体资源都会分配一个媒体 ID,可直接通过 URL 查看。例如 Mujica 的官方界面 URL 为 https://www.bilibili.com/bangumi/media/md23679586,因此 media_id 就为 23679586
  • ps:获取评价数量。B 站的评论系统采用动态刷新机制,每次刷新只会获取最多 30 条评论(默认是 20 条)。
  • sort:排序方式。0 代表默认,即按照热度进行排序,1 代表按照时间进行排序。(这个参数对数据分析没多大用,反正最后要导出为表,排不排都行)
  • cursor:评论组的起始游标。如 ps 参数所说,B 站的评论每次只能获取最多 30 条,而 cursor 参数用来定位下一组评论的起始游标。他在每个评论请求响应的 data.next 值中,每次请求评论后,需要获取此数据并传递给下一次请求。默认为 0,当所有评论都请求完后最后一组请求中会将 data.next 重置为 0

相应结构如下:

{
    "code": 0,
    "data": {
        "count": 2571,
        "folded": 0,
        "list": [
            {
                "article_id": 1111111,
                "author": {
                    "avatar": "https://i0.hdslb.com/bfs/face/xxxxxxxxxxxxxxxxxxxxxxxxx.webp",
                    "level": 5,
                    "mid": 11111111111,
                    "uname": "XXXXXX",
                    "vip": {
                        "avatar_subscript_url": "",
                        "nickname_color": "#FB7299",
                        "themeType": 0,
                        "vipStatus": 1,
                        "vipType": 2
                    },
                    "vip_label": {
                        "bg_color": "#FB7299",
                        "bg_style": 1,
                        "border_color": "",
                        "label_theme": "annual_vip",
                        "path": "",
                        "text": "年度大会员",
                        "text_color": "#FFFFFF"
                    }
                },
                "content": "XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX",
                "ctime": 1739593421,
                "is_origin": 1,
                "is_spoiler": 0,
                "media_id": 23679586,
                "mid": 651845709,
                "mtime": 1739593421,
                "progress": "看到#05(18)",
                "push_time_str": "2月15日",
                "review_id": 328739,
                "score": 10,
                "stat": {
                    "likes": 5,
                    "reply": 34
                },
                "title": "XXXXXXXXXXXXXXXX",
                "url": "https://www.bilibili.com/read/cvxxxxxxxxxx"
            }
        ],
        "next": 922337203675493,
        "normal": 2571,
        "total": 2571
    },
    "message": "success"
}

不难发现,这个结构中我们只需要获取 data.list 中的数据即可,其中主要是以下几个字段:

  • author.mid:B 站用户 UID。
  • author.name:B 站用户名。
  • content:评论内容。
  • ctime:评论时间。
  • score:评分。

然后用 Python 爬取数据即可。

NOTE

Python 脚本就不放了,规避一下风险。有了上面的解析写个脚本应该也不是什么难事。

然后我们获得了一个表头为 UID 用户名 评论内容 评论时间 评分 的数据表。直接导入到 SQLite 数据库里,方便后续的数据操作。

此外,我们还可以通过 https://api.bilibili.com/pgc/season/episode/web/info API 来获取播放信息,统计观看人数,方便后续进行分析。结果如下:

集数观看人数
110228481
23854000
33731382
43562988
53427026
63180998
74534698
82463917
91285938

数据分析#

分析方向#

一部影视作品的数据分析方向大体可以分以下几种:

  • 根据每集观看、评分情况做趋势分析
  • 根据每集评分分布情况做画像分析
  • 根据用户观看率做留存分析

分集评论数量#

分集评论

第七集的评价数量断崖式领先,第一、二集由于当时剧情尚未展开因此无人评价。

评分趋势#

按分集统计#

评论趋势

按日期统计#

评分趋势-天

有具体的日期统计可以看到,即便是第七集播出后,评分依旧有些许的回弹。而第八集播出后评分看似回到了一个正常的水平,如果把第七集的数据去掉,第八集的数据可以无缝接在第六集后面,说明第八集是有观感回升的,但也有可能是观众预期调整的结果(不如说我觉得这个方面的影响更大)

评分分布统计#

1星(2分)和 5星(10分)评价人数的统计#

1星和5星人数

除第七集和第九集意外,Mujica 收到的 5 星评价是远比 1 星评价多的,侧面反应了 B 站观众其实还可以接受 Mujica 前期的叙事节奏和剧情展开问题,更加强力地证明了第七集是多屎才能让 B 站观众都觉得恶心开始大规模打低分。

各评分人数分布#

各评分人数分布

观看人数统计#

各集观看人数#

各集观看人数

第七集为什么会有这么多观看量我是不明白的,第六集应该没有好到会把普通观众吸引过来的地步,大概率是重复观看的结果。但是重复观看能看一百多万次吗?B 站的观众这么爱赤石?

另外即使是第七集屎到淋头第八集依然有相当一部分观众在看,这一点与番组计划的差异还是蛮大的,番组计划的数据显示第七集后有大量的观众弃番,而在 B 站这种情况规模要小得多。(虽然还是在降,但是与前期趋势是吻合的,没有出现断崖式的变化)

留存率统计#

留存率统计

分析和评价#

由上面 7 副图我们不难看出对于 B 站用户而言(或者说对在 B 站看 Mujica 的用户而言),整体的评价都是在下降的。一方面,前四集超速一般的叙事节奏已经搞得很多观众对剧情的接受度降低;另一方面,第七集拉了坨大的,给大伙儿恶心得够呛。第七集这个评分趋势图深谷的水平可见一斑。

同时,我要提出一个问题:是否真如某些群体所说,第七集的评分灾难是由部分群体恶意刷分的成果呢?

在除去第一集开播加持的情况下,第二集以后到第五集的观众留存率相对来说是比较稳定的。这个阶段的观众评分意愿是多少呢?我们不妨做个简单的统计:

集数观看人数评价人数评价率
3373138223170.0621%
4356298814030.0394%
5342702639130.1142%
6318099827630.0869%
NOTE

第二集由于剧情问题导致没有什么讨论量,B 站的评论都是从第三集开始才出现的,因此这里只统计 3、4、5 集的数据。

可以看到评价人数不足千分之一。只有第五集达到了千分之一的水平。

但第七集又是什么情况呢?约为 0.498%,将近千分之五的水平。

集数观看人数评价人数评价率
74534698225670.004977

而如果按照前几集的情况,按照 0.07%(取个近似平均值)的比例来算,这集的评价人数应该是 3431 人,而实际比这个值多出 19136 人,这集直接让评价参与人数翻了 5 倍多。

根据 NGA 用户@纱我纱你发起的投票结果,即使是最有争议的第七集,“某粉毛角色”的支持率也就 30% 多,更不用说其他集的支持率只有 15% 左右。这多出来的人总不能是凭空冒出来的吧?愿意来逛 NGA 猴区专版的几乎都是核心观众,核心观众突然来了这么多不再沉默开始发声的人群,那普罗大众的粉丝之间“路人”的角色转换数量绝对不是这 2 万的水平。

我们可以认为,第七集的灾难级演出吸引了(或者说恶心到)众多路人观众也加入了声讨作品和制作组的行列,而不是某个群体甩的锅说的那么简单。


另一个问题是第九集又算是一个小爆点(虽然是贬义的),这一集的叙事逻辑之混乱、剧情之想当然已经到达一个外星人都不太能看懂的程度了。B 站评分目前似乎锁定在了 6.5,但是根据评价数据实时计算的结果是 4.41 左右,而番组计划的评分也已经到了 5.2 这种“不过不失” 的水平,但以我个人见解很明显 Mujica 是有“过”的,这 5 分都打多了,得打 4 分。

后续展望#

切割!狠狠地切割!

Mujica?Mujica 是什么?MyGO 啥时候出的续篇?不承认、不认可、不同意。柿本广大赶紧拽上赤坂明 Remake 去吧!

骂归骂,看还是要看的。我现在就想知道这个双子初华小姨说什么时候能兑现?以怎样的形式来演出?这番现在的作用就是每周给我找点乐子了。

十五年未有之——美少女乐队斗财阀,启动!

原创的狂欢(雾)——Bang Dream! Ave Mujica 评分分析
https://blog.see2night.top/posts/原创的狂欢雾bang-dream-ave-mujica-评分分析/
作者
See-Night
发布于
2025-02-28
许可协议
CC BY-NC-SA 4.0