February 17, 2023
By James Broberg Founder and CEO of StreamShark
Blog

The Video Captioning Conundrum

今天，我们消费的视频比以往任何时候都多:

In 2022, 全球82%的互联网流量将来自视频流媒体或视频下载, according to Cisco.
84 minutes per day 全球视频消费的平均水平是多少 MediaSpot
据估计，到2027年，全球直播市场将超过2470亿美元 PR News Wire.

有了这样的统计数据，很明显视频是我们世界的重要组成部分，从个人到专业.

Unfortunately, 虽然我们大多数人在日常生活中经常接触视频, 从直播会议到工作中的内部会议, 以下数据证实，有几个常见的问题会干扰观众对录制视频的理解:

18-24岁的观众占80%，26-35岁的观众占64% 绝大多数人更喜欢看带字幕的视频内容(StageText UK的2021年研究结果)
80% of viewers 在英国使用字幕的人不是聋人或重听人(Ofcom的研究).

First, 当有多个演示者时，通常很难理解视频, or tech glitches disrupt the recording. 虽然很多人都试图用字幕来解决这个问题, 人工字幕是昂贵的，必须花费数小时来制作字幕. 这就是我们所说的字幕难题:视频字幕对于可访问性和理解性至关重要, but is time sensitive and expensive. 如果需要多种语言的字幕，转换字幕的时间和成本就会增加.

Why do we need video captioning?

首先，回答这个问题很重要:为什么你需要视频字幕? Today, 对视频的字幕和转录的需求至关重要，主要有两个原因:视频内容的可访问性和提高观众的理解力.

The Americans with Disabilities Act 于1990年通过，以保护残疾公民不受歧视. 许多人将《百家乐软件》的标志性法律要求与无障碍停车位联系起来, building entryways, and restrooms or water fountains. However, the ADA also requires “auxiliary aids,” like captioning or audio descriptions, 向残疾人士提供以下两类服务:

公共实体:国家和地方政府，在内部和外部视频通信.
公共场所:公共或私人企业供公众使用的场所. 私人俱乐部和宗教组织不受限制.

为预先录制的视频会议添加字幕, presentations, 而会议是最好的保证方式之一 everyone 能享受、学习和参与优秀的视频内容吗. 作为一个使用VOD进行内部和外部会议或活动的组织, 添加字幕就是为你的工作场所增加可访问性. Additionally, 在组织的视频点播中添加字幕对于提高观众的理解力至关重要.

As I mentioned before, it’s common for glitches in a stream, an issue with a presenter’s Internet, 或者口音或沟通风格的差异(想想:在与不同利益相关者的会议上使用许多行业特定的形容词)会干扰视频观众对演示或会议的理解.

在视频点播中添加字幕可以让观众更容易理解正在发生的事情, 尤其是当有多个演讲者或演示者的时候.

添加标题还有其他关键的不可访问的重点原因. 他们可以提高你的视频内容的有机覆盖范围, both internally and externally, 不仅仅是标准的视频标题元数据, description and tags. 它还可以提高观众在安静的办公室等对声音敏感的环境中观看视频内容的参与度, or public transport.

The captioning conundrum

Unfortunately, 许多组织都非常熟悉在视频中添加字幕所涉及的三大问题:高成本, the long, manual hours put in by a captioner, 由于字幕的质量不同，人为失误的可能性也各不相同.

Historically, after a video conference or meeting, 公司将雇佣一个人来听录音，并手动转录字幕. 后来，字幕被添加到录制的视频中，并作为书面转录提供.

虽然人工字幕很有帮助，但它远非高效或划算. 人工转录说明文字是相当昂贵的, 尤其是在聘请高质量的转录员时, which is what many of us want to do. 此外，手工抄录是一个耗时、乏味的过程. 此手动过程可能会延迟录制视频的发布, and render important information outdated. Then, there’s the problem of human error. 人类转录员容易出现不可避免的错误或打字错误，因为，他们是人!

因此，视频上的字幕对于用户的可访问性和理解性至关重要. But, 雇佣一名转录员来制作字幕是昂贵的，而且可能会拖慢视频的发布, 多亏了转录员必须投入的长时间工作.

那么，如何解决标题的难题呢?

In order to deliver high-quality, accurate captioning quickly, 我们必须利用人工智能和机器学习技术的力量，为视频自动创建字幕. 当今世界对视频的需求太大了，无法继续以其他方式解决字幕问题.

Machine Learning Captioning Feature

机器学习是自动为录制视频创建字幕的关键 minutes.

然而，并非所有的人工智能字幕服务都是一样的. 为了使字幕是最有效的, 字幕功能必须具备三个关键特性:可编辑的字幕, 能够适应不同的方言, and a customizable library of words, 所以机器学习可以被训练来识别关键术语，比如行业俚语, commonly used acronyms, and presenter names.

Editable captions

First, 所有优秀的机器学习字幕程序都应该提供自动添加字幕的选项. 这使得最快的周转，并确保视频内容可以交付，同时仍然相关和及时.

然而，一个优秀的机器学习字幕程序也将允许用户 edit captions before releasing a video. 当视频是高优先级并且需要在字幕中没有任何错误或错别字时，编辑字幕变得至关重要. 当敏感信息需要在发布前从视频中删除时，编辑字幕也很有用.

With editable captioning, users can download the captioning, fix errors, remove sensitive information as needed, then upload and distribute the most polished, fully captioned video.

Tailoring to dialects

您的ML字幕程序需要的另一个重要功能? 修改字幕以理解不同方言的能力

这个功能最适合帮助观众完全理解说话者, 当说话者说同一种语言时尤其有用, but have regional tweaks.

For example, 想想美式英语之间的细微差别和差异, British English, Australian English, Indian English, Irish English, Scottish English, and Welsh English. 而英国人在会议上说“knackered”, 而说美国英语的人会用“tired”这个词.” With a programmable ML captioning service, 不同的方言可以编入字幕, 最准确地反映在用词上的差异.

Customizable library

Finally, 在您的ML字幕平台中寻找的另一个关键功能是创建可定制的词汇库的能力.

这对行业缩写尤其有用, slang terms, 甚至主持人的名字，每个观看视频的人都可能不理解. 这种可定制的库功能有助于提高VOD观众的理解能力, 在有很多利益相关者的内部会议上特别有用.

Additionally, 特别定制的单词库将创建最准确的标题, 哪种方式可以减少编辑字幕和最终发布视频所需的时间.

**********

Captioning is a core part of video today. 如果使用得当，它可以增加视频的可访问性和可理解性. 创造性技术可以帮助组织以高效的方式生成清晰、正确的标题.

当涉及到字幕时，不需要难题.

James Broberg is the Founder and CEO of StreamShark, an end-to-end Live and On-demand video streaming platform for enterprises. 在加入StreamShark之前，James是 内容交付网络和云计算.

[编者注:这是来自 StreamShark. 流媒体接受供应商署名完全基于它们对我们读者的价值.]

Free

for qualified subscribers

Subscribe Now Current Issue Past Issues

The Video Captioning Conundrum

媒体行业AI配音的下一步是什么?

基于机器学习的视频流字幕自动对齐方法

如何有效地为流媒体视频点播部署自动字幕解决方案

封闭字幕(终于)来到流媒体.com

Best Practices: Video Conferencing Solutions

最佳实践:视频工程师和业务经理的编码和转码

More

现实世界中的实时:体育运动的超低延迟流媒体, Esports, iGaming, and Interactive Events

分析在行动:利用流数据来提高你的底线

More Web Events

在流动的海洋中航行:派拉蒙的大胆举动和未来的挑战

SMNYC Sneak Preview: Marketing You & 与LPG edu, JustWatch, LinkedIn，派拉蒙和摩根搜索国际保持联系

SMNYC预览:什么是Premium现在与2E6E6辩论, The Boxoffice Network, Totem Global, Team Whistle, and Quantum Media

Vevo在IAB新前沿:FAST, CTV, OTT和程序化的短格式优化

Real-Time Streaming at Scale

灵活的流媒体:经济高效的流媒体软件

More