提取哔哩哔哩(B站)视频中的字幕文件

发布于 2020-04-04  3.76k 次阅读


哔哩哔哩有些视频是通过外挂字幕文件来实现字幕的,但是当我们把这些视频下载下来之后,发现并没有字幕,是因为只下载了视频,或者视频软件没有识别到B站外挂字幕文件。

20200404152754.png

这时候我们可以用哔哩哔哩UWP版把视频下载下来之后,提取其中的外挂字幕文件即可。

下载B站视频可以参考这篇文章:下载哔哩哔哩(B站)里的视频(无论有没有版权)

打开B站下载的视频,然后打开文件夹“1”(即p1)
20200404153012.png

然后打开sub文件夹(字幕文件夹)

里面的zh-cn.sub即是字幕文件

20200404153148.png

打开后会发现B站的字幕文件不是用srt格式的标准实现的,那我们可以先查一查srt格式(视频软件普遍支持srt支持来外挂字幕)的规范是怎么样的。

srt格式的书写规范大概为:
20200404154224.png

那我们只要用Word的替换功能(Ctrl+H)即可。

20200404153224.png

比如:

{"from":15.95,"to":22.375,"location":2,"content":"单纯的词语不断堆叠着  让心灵更加坦率吧"},

只要把查找内容依次填为"from":,替换为这一栏不要填任何东西;

把查找内容依次填为,"to":,替换为这一栏填写为“->”;

把查找内容依次填为,"location":2,"content":",替换为这一栏填写为“^p”(段落标记)。

只要把查找内容依次填为"},,替换为这一栏不要填任何东西;
这样就可以了。

其他行依次按照上面来即可。

最后依次给各行加上“1”,“2”....就可以了,需要注意的是,每一句新字幕必须标明所属的序列,从1开始,依次往下列出。每一序列之间都有空行。

这是用Word替换后的字幕文件。

20200404154429.png

注:srt格式文件名应该与所对应视频文件名一样,即“96370545_1_0.srt”与“96370545_1_0.mp4”

这样用potplayer之类的视频软件就可以播放了。
20200404155000.png

ps:这里所用到的客户端版本为2.6.1.0,更高版本客户端可能会不可用。

参考:如何编写srt或txt格式字幕

用记事本写srt视频字幕文件

本文标题:《提取哔哩哔哩(B站)视频中的字幕文件》

本文链接:https://wnag.com.cn/1186.html

特别声明:除特别标注,本站文章均为原创,本站文章原则上禁止转载,如确实要转载,请电联:wangyeuuu@qq.com,尊重他人劳动成果,谢过~


正因为有要好好实现的梦想,所以今天也要好好加油。