蓝光字幕提取及处理

蓝光字幕提取及处理

ID:32363984

大小:910.50 KB

页数:11页

时间:2019-02-03

蓝光字幕提取及处理_第1页
蓝光字幕提取及处理_第2页
蓝光字幕提取及处理_第3页
蓝光字幕提取及处理_第4页
蓝光字幕提取及处理_第5页
资源描述:

《蓝光字幕提取及处理》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、sup部分1.提取工具:“tsmuxer”,命令行或gui界面。以gui界面为例:这里分离出了1个“264文件”即视频;1个“ac3音频”即音轨;另外一个就是本教程的主角“sup文件”即字幕文件。Sup文件为BDMV及HDDVD高清媒体专用字幕格式。不能直接avs加载,亦不能被常用视频压缩软件识别。须要转换成其他格式字幕文件。2.处理如何转换?目前比较统一的思路是:suptoidx+subtosrt。Suptoidx+sub:这里分2种情况:sup字幕来自于hddvd以及bdmv目前bdmv蓝光已经是绝对主流。以下已来自于蓝光盘的sup为例。工具:“BDSup2Sub”,系

2、统必须安装“java”软件。安装java后,在cmd下,进入BDSup2Sub.jar所在目录。键入“java-jarBDSup2Sub.jar”或“javaw-jarBDSup2Sub.jar”。File—Load打开需要转换的sup文件:然后:例如:为了提高识别率,可以移动字幕位置到黑边上,如图:然后保存为idx+sub格式。至此,我们就可以直接avs加载idx压制了。然而idx+sub字幕是图片字幕,受限于字体等因素。可能导致画面看上去不太美观。那就可能需要把sub转换成srt文本字幕了。srt部分概念:1.sub格式,由一个sub文件和一个idx文件组成。2.sub

3、文件中其实是一幅幅背景透明的图片,而idx则是index文件,引导显示每幅图片的时间。3.sub字幕不能直接转换,而是要通过一种叫OCR(OpticalCharacterRecognition)的方法,也就是光学字符识别技术。方法1:“subrip”+“SubToSrt”A。用SubRip将sub文件转换为bmp图片1.首先安装SubRip,选择安装所有。2.打开SubRip->文件->打开Vob文件3.打开文件目录->选定sub->语言数据流选Chinese->右面操作里选字幕图片保存为4bit的BMP文件,以及在加时间和尺寸上打勾->开始4.输入任意文件名->保存5.预

4、设里选I-Author->选取CustomColorsandContrast->把颜色#1-4全部选择成白色(#1-4分别代表字芯、字框、背景、消除走样,每个字幕的#1-4所代表的都不一样)->一一测试哪一个为字芯,设为黑色,其他3项全部为白色,重要!->点选确定6.SubRip自动将每一幅图片保存为BMP,并且加上相应时间顺序输出格式->设置输出格式->Textformats下的SubRip(*.srt)->转换成此格式文件->另存为->保存7.关闭SubRipB。SubToSrt3.11的使用1.绿色软件,直接解压开即可使用。2.运行SubToSrt.exe->文件->

5、打开SRT或SSA文件->选取刚才保存的srt文件3.图片处理->自动裁剪->确定(推荐使用此步骤,可以使识别更快)4.依照字幕调节空格检测设置、空格宽度设置、行高检测设置的灵敏度5.识别->开始识别当遇到不认识的字时,会自动跳出小窗口要求丰富字库,输入该字,按回车即可当遇到半个字的时候,如图,按扩展(Alt+E),即可显示全字如果前面一个字打错,可以在小框中修改该字,程序会自动从该字所在行开始识别6.识别完毕后,会自动替换已知错误词组。7.这时,可以随便看一下字幕,如有需要,可以略做修改(如:原sub字幕中就是错误的)8.文件->保存为SRT或SSA格式C.字幕修改校对1

6、.文件->打开可对照的字幕文件->选取已经转换好的srt/ssa文件2.修改左面或者右面的字幕都可以,修改完毕后,点击保存此方法的识别率及速度取决于字库文的大小。字库越多则越高效。方法2:“MODI”+“IdxSubOcr”(个人建议使用)所谓modi即“MicrosoftOfficeDocumentImaging”。(貌似只能在MicrosoftOffice2003下调用,反正我的2010是怎样也打不开)首先,必须安装MicrosoftOfficeDocumentImaging,建议在安装MicrosoftOffice2003时候把全部组件选上。然后,打开IdxSubOc

7、r(绿色软件):如下图然后:然后,短暂的过程,相对于第一个方法来说快了不知多少倍了:最后,这种方法声称是目前识别率最高的,可达到98%。然而余下的2%也是需要耗费大量的时间修正的。所以,如果不是对字幕有苛刻的要求,建议直接采用idx+sub的图形字幕压制。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。