找回密码
 立即注册
搜索

电竞赛事首个AI语音识别字幕——无障碍流直播间诞生



英雄联盟

近日,2021英雄联盟全球总决赛于10月5日在冰岛正式开幕。作为目前依旧最火爆的游戏赛事之一,为了照顾广大的游戏受众群体,在B站的赛事直播间出现了一个有人情味儿的直播间——无障碍流直播间。





无障碍流直播间页面





10月12日 EDG VS T1


这也是电竞赛事首个无障碍流直播间,直播间背后的B站引入了讯飞听见技术服务,推出了 AI 语音识别字幕,可以实时显示解说内容。在谷歌DeepMind(深度思维)公司实现首次盈利的消息之后,我们又可以在大型电竞赛事中看到AI落地商业化的应用,真是可喜可贺。




蜡笔小新式庆祝
谈及“讯飞听见”平台,就不得不说起基本是处于同一生态位的“网易见外”平台了。





网易见外官网
如上图所示,“网易见外”提供视频智能字幕、音频转写翻译、会议同传、文档翻译、字幕文件翻译和图像识别翻译等服务。曾经在2018年与人人影视(字幕组)达成合作,提供字幕协作翻译工作,后者只需进行人工校对工作便可完成视频翻译。在2020年3月20日关停部分功能前,网易见外一直提供在线免费自动制作字幕服务,还是惠及了不少视频自媒体等用户的。目前笔者没有搜寻到下次对外开放的确切消息。



网易见外通知
见识到了B站的无障碍流直播间之后,笔者不免回想起国内外厂商的一些人性化设计。
一、小米(Xiaomi)




小米MIUI系统
小米在MIUI系统中推出无障碍模式。视觉部分的TalkBack功能可以读出屏幕上的内容,听觉部分的小米闻声可以实时将语音转录为文字。想必2019年语音识别开源工具Kaldi创始人Daniel Povey的加入给了MIUI一定的助力。
二、锤子(Smartisan)




坚果TNT工作站

可能部分数码发烧友知道下面这条,已经被头条接手的锤子团队之前推出的坚果TNT工作站也是主要靠语音识别和触屏操作的,然而老罗的畅想终究只是昙花一现。
三、谷歌(google)




谷歌Chrome浏览器
谷歌的Chrome浏览器也内置了无障碍功能。其实时字幕功能可以自动为英文版音频和视频创建字幕。
●语音识别是人工智能的重要分支之一,如果有朋友对这方面技术感兴趣的话,可以私信我“资料”,获得笔者联系方式,免费领取资料哦~。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

大神点评3

易碎的琉璃 2021-10-14 07:05:15 显示全部楼层
撸过
回复

使用道具 举报

starcxl110 2021-10-14 20:14:11 来自手机 显示全部楼层
老哥,这波稳
回复

使用道具 举报

支持你哈...................................
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies