-->
获得免费通行证,加入我们的流媒体连接-2月19日至22日; 现在注册!

视频:asr生成的实时字幕有多可靠?

了解更多关于广告插入的现场活动 流媒体的下一个事件.

观看这个演示的完整视频 流媒体西部, LS202:接触观众——直播字幕的进步和挑战, in the 流媒体会议视频门户.

阅读这段录音的完整文本:

约翰Capobianco: 自动语音识别的可靠性是每个人都会自然而然地提出的问题. 每个人都相信ASR能很好地提供字幕. It doesn't. 我们研究过这个. 我们在内部运行了几个ASR引擎,因为我们一直在寻找完成字幕的最佳方式. 它做得不够好, 我有证据,因为我每天都在测试全国各地发生的事情.

ASR很便宜

大多数ASR引擎问题的发生是因为人们使用它是因为它便宜. 这是人们真正关心的唯一原因:这样做几乎不需要花费任何成本. 你花的每一分钱都是值得的. 它做得不是很好. 它把大多数专有名词都弄错了. 它把大多数专有名称都弄错了. 它把大多数名字搞错了. 我把所有大供应商的平均值都算出来了. 我不会说出他们的名字,我不在乎他们是谁. 我看他们在电视直播上做什么. 目前的平均准确率不到68%.

每三个词中就有一个是错的. 三分之二的错误是错词或缺词. 想想看. 每三个单词中就有一个是错误的或缺失的. 这不是一种适当的沟通方式.

除此之外, 如果没有很好的连接,它的字幕就会很糟糕, 有背景噪音, 人们互相攀谈. 它真正起作用的地方是当人们被训练使用它的时候,他们像这样对机器说话,机器字幕,他们输入句号,字幕和逗号, 他们通过单调的声音和它说话,只有一个说话者.

培训ASR

你可以训练ASR做得很好. We do that. 这就是声优的工作, 但同时, 这不足以满足你的大部分广播需求.

除此之外,它不大写. 它没有标点符号. 人们总是说:“谁在乎标点符号?“如果我给你一本小册子,它没有段落、标点、逗号或其他任何东西, 你觉得你能从那份文件中读到什么? 你很快就会被弄糊涂. 人们不这么想. 拿一本平装书,想象它没有标点符号, no chapters, no indexes, no commas, 段落没有缩进之类的. 只是一连串的话语. 那太可怕了. 你可以看,但不是很好.

为什么是人类的标题

关于自动语音识别的另一个非常重要的事情是, 因为你说, "Well, 我看过字幕,人类写的时候也会缺字.“这倒是真的。. 他们有时会转述. 队长有时会被训练这么做, 尽管我们不愿意考虑不逐字执行,因为我们一直都想逐字执行, 在屏幕上逐字逐句并不总是最好的表达方式.

我们的字幕员被教导要改写,以便放慢速度,让单词在屏幕上停留足够长的时间,让人们能够阅读它们. 有时他们会为了更好的意思而省略一些词.

ASR引擎向外移动是因为它们被弄糊涂了. 人类省略单词是因为他们想要改善意思. 所以当你真正比较人类字幕和自动语音识别之间的情况时, 最大的区别在于所发生的事情的可读性. 它是人类的语境,知道如何有效地与所说的话进行沟通.

ASR什么时候准备好?

我们对此有很多疑问. 每个人都想知道什么时候能做好? 我们也是,所以我们每天都要测试. 我现在有58个测试,我刚刚对80个做了测试,000个单词,这就是我从67个单词中得到的统计数据.88%的准确率. 是32号.12分,不管是什么,都是不准确的. 其中三分之二是缺词和错词.

相关文章

基于机器学习的视频流字幕自动对齐方法

为了确保高质量的观看体验,同时遵守地区法规,音频和字幕必须保持一致. 这可以通过利用机器学习的自动校准系统高效且经济地实现. 其结果是一种满足当今全球观众高期望的观看体验,并推动了增长.

封闭字幕(终于)来到流媒体.com

是时候践行我们所宣扬的了. 字幕使视频以各种方式更易于访问. 这是我们在网站上为所有视频添加字幕的工作流程.

视频:如何开始使用实时字幕

VITAC首席营销官约翰·卡波比安科(John Capobianco)在2018年流媒体西部流媒体峰会上的直播峰会演讲中提供了一个直播字幕的入门教程.

视频:在字幕供应商中寻找什么

VITAC的John Capobianco在2018年流媒体西部流媒体峰会上的演讲中讨论了一个有效的直播视频和视频点播字幕供应商的基本产品.

如何得分,增强,并说明视频与YouTube创作者工作室

YouTube后台的编辑功能无法与Adobe Premiere Pro等非线性编辑器竞争, 但是有一些强大而独特的工具可以使简单的编辑项目变得更加简单.

新的FCC标题要求:你需要知道的

新的字幕要求于7月1日生效, near-live, 预先录制好的广播视频放到网上.

如何为在线视频添加字幕

我们距离实时视频字幕标准还有几年的距离, 可用的解决方案绝不是即插即用. 但这并不意味着它无法实现. 只需要一点点努力.

视频:直播字幕的最佳实践

领英的希瑟·赫福德和流媒体的蒂姆·西格林在2016年流媒体西部的采访中深入探讨了目前封闭字幕直播视频面临的挑战.

提及的公司及供应商