← 返回首页

从STT到OCR 我如何为一句字幕来回死磕

发布时间: 2025-11-15 11:08(北京时间)

摘要: 作者描述了将视频字幕转换为文字稿的过程,从STT识别错误到使用OCR工具提取字幕,再通过LLM添加标点和分段,强调了对准确性的追求和手动校对的重要性。整体语调务实且反思。

标签: 字幕处理, STT错误, OCR工具, LLM应用, 准确性追求, 反思, 务实

字数: 284

原文链接: /7402396589/QdVK9nqZb

费了点功夫把视频《关于影视飓风近期舆情》(BV16YC3BrEDz)转成了文字稿。主要是没意识到原视频就有字幕,在加上tim讲话有时候会吞字,所以开始用STT的方式产生了很多识别错误,LLM也不太能救回来(不过大意还是基本准确的)。但我既然要做这个事,还是尽量做靠谱些比较好,于是又找来了一个基于OCR提取字幕的工具。导出的字幕是不带标点符号的,而加标点和分段的任务比较适合LLM来做,所以这个环节就偷懒了。我给LLM强调了不能删字改字,也自己对着文字稿再看了两遍视频,效果还不错。

传送门