前言#

被我们寄予厚望的 Bang Dream! Ave Mujica 在短短两个月的连载生涯中给我们整了三个大活，无法预测的命运之舞台就这么成了臭水沟子，散发着阵阵恶臭。随着第 9 集的播出，Mujica 本就难绷的评分又迎来了雪上加霜的“骤降”。与此同时wsd、🍅、路边一条的海外观众和🐓🐘孝子还在坚持尽孝，令人忍俊不禁，堪称当代二十四笑典范。

本文希望以数据分析的方式和结论来打脸这帮脑子进🐘的阴湿耗子，并在此基础上对 Mujica 的整体制作进行一个阶段性的评价以及对后续发展的展望。

准备#

数据来源#

拟选取的平台是用户比较多的平台 B 站。那为啥不用权威性稍微强那么一点的番组计划（bangumi.tv）呢？因为人家有数据统计，我还统计个毛啊，直接上网看不香吗？

NOTE
B 站的数据只能爬到附带评论内容的评价，只打分不评论的用户量由于没有相关 API 导致无法统计（毕竟我不可能为了统计这个把 B 站所有用户信息遍历一遍）。

数据爬取#

B 站的数据主要分为短评和长评两个类型，主要通过 Web API 获取：

长评：https://api.bilibili.com/pgc/review/long/list
短评：https://api.bilibili.com/pgc/review/short/list

通过解析，可以发现这两个 Web API 都采用 GET 方式请求，并且请求参数的格式均相同：

{
    "media_id": 23679586, 
    "ps": 30,
    "sort": 0,
    "cursor": 0
}

media_id：媒体 ID，B 站的每个官方媒体资源都会分配一个媒体 ID，可直接通过 URL 查看。例如 Mujica 的官方界面 URL 为 https://www.bilibili.com/bangumi/media/md23679586，因此 media_id 就为 23679586。
ps：获取评价数量。B 站的评论系统采用动态刷新机制，每次刷新只会获取最多 30 条评论（默认是 20 条）。
sort：排序方式。0 代表默认，即按照热度进行排序，1 代表按照时间进行排序。（这个参数对数据分析没多大用，反正最后要导出为表，排不排都行）
cursor：评论组的起始游标。如 ps 参数所说，B 站的评论每次只能获取最多 30 条，而 cursor 参数用来定位下一组评论的起始游标。他在每个评论请求响应的 data.next 值中，每次请求评论后，需要获取此数据并传递给下一次请求。默认为 0，当所有评论都请求完后最后一组请求中会将 data.next 重置为 0。

相应结构如下：

{
    "code": 0,
    "data": {
        "count": 2571,
        "folded": 0,
        "list": [
            {
                "article_id": 1111111,
                "author": {
                    "avatar": "https://i0.hdslb.com/bfs/face/xxxxxxxxxxxxxxxxxxxxxxxxx.webp",
                    "level": 5,
                    "mid": 11111111111,
                    "uname": "XXXXXX",
                    "vip": {
                        "avatar_subscript_url": "",
                        "nickname_color": "#FB7299",
                        "themeType": 0,
                        "vipStatus": 1,
                        "vipType": 2
                    },
                    "vip_label": {
                        "bg_color": "#FB7299",
                        "bg_style": 1,
                        "border_color": "",
                        "label_theme": "annual_vip",
                        "path": "",
                        "text": "年度大会员",
                        "text_color": "#FFFFFF"
                    }
                },
                "content": "XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX",
                "ctime": 1739593421,
                "is_origin": 1,
                "is_spoiler": 0,
                "media_id": 23679586,
                "mid": 651845709,
                "mtime": 1739593421,
                "progress": "看到#05(18)",
                "push_time_str": "2月15日",
                "review_id": 328739,
                "score": 10,
                "stat": {
                    "likes": 5,
                    "reply": 34
                },
                "title": "XXXXXXXXXXXXXXXX",
                "url": "https://www.bilibili.com/read/cvxxxxxxxxxx"
            }
        ],
        "next": 922337203675493,
        "normal": 2571,
        "total": 2571
    },
    "message": "success"
}

不难发现，这个结构中我们只需要获取 data.list 中的数据即可，其中主要是以下几个字段：

author.mid：B 站用户 UID。
author.name：B 站用户名。
content：评论内容。
ctime：评论时间。
score：评分。

然后用 Python 爬取数据即可。

NOTE
Python 脚本就不放了，规避一下风险。有了上面的解析写个脚本应该也不是什么难事。

然后我们获得了一个表头为 UID 用户名 评论内容 评论时间 评分 的数据表。直接导入到 SQLite 数据库里，方便后续的数据操作。

此外，我们还可以通过 https://api.bilibili.com/pgc/season/episode/web/info API 来获取播放信息，统计观看人数，方便后续进行分析。结果如下：

集数	观看人数
1	10228481
2	3854000
3	3731382
4	3562988
5	3427026
6	3180998
7	4534698
8	2463917
9	1285938

数据分析#

分析方向#

一部影视作品的数据分析方向大体可以分以下几种：

根据每集观看、评分情况做趋势分析
根据每集评分分布情况做画像分析
根据用户观看率做留存分析

分集评论数量#

分集评论

第七集的评价数量断崖式领先，第一、二集由于当时剧情尚未展开因此无人评价。

评分趋势#

按分集统计#

评论趋势

按日期统计#

评分趋势-天

有具体的日期统计可以看到，即便是第七集播出后，评分依旧有些许的回弹。而第八集播出后评分看似回到了一个正常的水平，如果把第七集的数据去掉，第八集的数据可以无缝接在第六集后面，说明第八集是有观感回升的，但也有可能是观众预期调整的结果（不如说我觉得这个方面的影响更大）

评分分布统计#

1星（2分）和 5星（10分）评价人数的统计#

1星和5星人数

除第七集和第九集意外，Mujica 收到的 5 星评价是远比 1 星评价多的，侧面反应了 B 站观众其实还可以接受 Mujica 前期的叙事节奏和剧情展开问题，更加强力地证明了第七集是多屎才能让 B 站观众都觉得恶心开始大规模打低分。

各评分人数分布#

各评分人数分布

观看人数统计#

各集观看人数#

各集观看人数

第七集为什么会有这么多观看量我是不明白的，第六集应该没有好到会把普通观众吸引过来的地步，大概率是重复观看的结果。但是重复观看能看一百多万次吗？B 站的观众这么爱赤石？
另外即使是第七集屎到淋头第八集依然有相当一部分观众在看，这一点与番组计划的差异还是蛮大的，番组计划的数据显示第七集后有大量的观众弃番，而在 B 站这种情况规模要小得多。（虽然还是在降，但是与前期趋势是吻合的，没有出现断崖式的变化）

留存率统计#

留存率统计

分析和评价#

由上面 7 副图我们不难看出对于 B 站用户而言（或者说对在 B 站看 Mujica 的用户而言)，整体的评价都是在下降的。一方面，前四集超速一般的叙事节奏已经搞得很多观众对剧情的接受度降低；另一方面，第七集拉了坨大的，给大伙儿恶心得够呛。第七集这个评分趋势图深谷的水平可见一斑。

同时，我要提出一个问题：是否真如某些群体所说，第七集的评分灾难是由部分群体恶意刷分的成果呢？

在除去第一集开播加持的情况下，第二集以后到第五集的观众留存率相对来说是比较稳定的。这个阶段的观众评分意愿是多少呢？我们不妨做个简单的统计：

集数	观看人数	评价人数	评价率
3	3731382	2317	0.0621%
4	3562988	1403	0.0394%
5	3427026	3913	0.1142%
6	3180998	2763	0.0869%

NOTE
第二集由于剧情问题导致没有什么讨论量，B 站的评论都是从第三集开始才出现的，因此这里只统计 3、4、5 集的数据。

可以看到评价人数不足千分之一。只有第五集达到了千分之一的水平。

但第七集又是什么情况呢？约为 0.498%，将近千分之五的水平。

集数	观看人数	评价人数	评价率
7	4534698	22567	0.004977

而如果按照前几集的情况，按照 0.07%（取个近似平均值）的比例来算，这集的评价人数应该是 3431 人，而实际比这个值多出 19136 人，这集直接让评价参与人数翻了 5 倍多。

根据 NGA 用户@纱我纱你发起的投票结果，即使是最有争议的第七集，“某粉毛角色”的支持率也就 30% 多，更不用说其他集的支持率只有 15% 左右。这多出来的人总不能是凭空冒出来的吧？愿意来逛 NGA 猴区专版的几乎都是核心观众，核心观众突然来了这么多不再沉默开始发声的人群，那普罗大众的粉丝之间“路人”的角色转换数量绝对不是这 2 万的水平。

我们可以认为，第七集的灾难级演出吸引了（或者说恶心到）众多路人观众也加入了声讨作品和制作组的行列，而不是某个群体甩的锅说的那么简单。

另一个问题是第九集又算是一个小爆点（虽然是贬义的），这一集的叙事逻辑之混乱、剧情之想当然已经到达一个外星人都不太能看懂的程度了。B 站评分目前似乎锁定在了 6.5，但是根据评价数据实时计算的结果是 4.41 左右，而番组计划的评分也已经到了 5.2 这种“不过不失” 的水平，但以我个人见解很明显 Mujica 是有“过”的，这 5 分都打多了，得打 4 分。

后续展望#

切割！狠狠地切割！
Mujica？Mujica 是什么？MyGO 啥时候出的续篇？不承认、不认可、不同意。柿本广大赶紧拽上赤坂明 Remake 去吧！

骂归骂，看还是要看的。我现在就想知道这个双子初华小姨说什么时候能兑现？以怎样的形式来演出？这番现在的作用就是每周给我找点乐子了。

十五年未有之——美少女乐队斗财阀，启动！