找回密码
 立即注册
搜索

清华大学郑方:语音仍是个小众行业,“内斗”压价会损害整个市场

编者按:在二十一世纪新十年开启之际,搜狐科技正式推出《中国创新公司100》系列榜单及报道,围绕5G、AI、芯片、制造、批发、出行、社交、企业服务等范畴内的技术创新和商业形式创新,对相关行业和优质创新公司停止深度价值发掘。

近日,在搜狐科技主办的《中国创新公司100》沙龙第二期中,清华大学人工智能研讨院听觉智能研讨中心主任郑方教授、声智科技结合创始人&首席知识官常乐、科大讯飞AI研讨院副院长陈志刚,讨论了智能语音技术和商业化的发展。本文为郑方教授在沙龙上分享的精彩观点。
出品 | 搜狐科技
作者 | 梁昌均

编辑 | 杨锦

“市场真正需求的是处理成绩的综合方案,要应用它的特点找到不同的技术来交融。这个交融应该是能处理成绩的交融,不能为交融而交融。”在本期沙龙上,清华大学人工智能研讨院听觉智能研讨中心主任郑方教授在谈到智能语音技术交融发展的趋向时说到。

郑方以为,技术的发展离不开市场的土壤,而如今用单一技术去处理市场的需求有很大的难度,这也是一些AI公司面临困境的重要缘由之一。

他还提到,不同的语音技术分支,发展程度不同,语音辨认、语音合成等相对成熟,但也有口音、低资源语种等成绩。但目前成熟的分支存在比较严重的同质化成绩,在技术上是方法同质化,并带来了市场的恶性竞争。
在智能语音企业商业化过程中,如何选择合适本身的发展形式?郑方以为,形式的好坏取决于三个要素:一由市场需求决议,包括痛点(处理最受关注的成绩)和痒点(打破创新的东西);二是由技术来决议,技术能否成熟,能否具有一定抢先性等;三是由竞争关系决议。企业最后采取什么样的商业形式,都需求根据这几个因从来综合决议。


清华大学郑方:语音仍是个小众行业,“内斗”压价会损害整个市场-1.jpg

清华大学人工智能研讨院听觉智能研讨中心主任郑方教授

对于目前智能语音行业的生态,郑方提到,虽然巨头在资金、人才、数据、算法、算力上都占据了优势,但随着第三代人工智能的到来,小企业仍有一定发展空间,把方向找对,把力气用对,就可以在竞争中处于有利地位。

他还呼吁,语音行业在中国照旧属于一个小众行业,要想做得好就要避免恶性竞争。一方面,语音企业需求找到本身定位,避免反复投入;同时技术研发人员和用户之间也要达成比较好的互动,前者专注在技术层面创新,后者则在场景方面有创新,两个结合起来才能构成比较好的生态。

他指出,目前市场上出现了一种不良竞争的状况,用户在发现提供商比较多后,就会经过让企业“内斗”压价,压得很低甚至没有利润。他以为,这会使得企业没有钱做研发,最后受损的是整个市场。

以下是郑方教授分享实录(经删减整理)

目前智能语音处在什么样的发展阶段?不同技术存在很大的差异,对于这种差距怎样看?

郑方:语音处理技术包含很多分支,语音辨认、语音合成、声纹辨认、情感辨认,信号分类等等。不同的技术处于不同的发展阶段,语音合成、语音辨认,目前相对比较成熟,但也有很多成绩需求处理,比如口音成绩,比如低资源的语种成绩。音频情感辨认、声响信号健康诊断等新技术,还在停止研讨。

但相对曾经成熟的分支存在一个成绩,就是同质化比较严重。方法同质化,带来恶性竞争。缘由在哪儿?我们有时分过多跟踪别人的技术,而疏于做深度分析。

不少观点提到,单一的技术无法让AI企业在激烈的市场环境中生活发展起来,那智能语音应该怎样去做交融发展?

郑方:不同的成绩能够需求用不同的技术综合来处理,比如身份认证,尤其网上远程或者无监督状况下的身份认证,能够会用到声纹辨认、语音辨认、鉴伪、情感辨认等技术。市场真正需求的是处理成绩的综合方案,要应用它的特点找到不同的技术来交融。这个交融应该是“能处理成绩的交融”,不能“为交融而交融”。

如今很多AI企业包括智能语音企业会出现很多转型,比如最末尾只是做语音技术,后来末尾去做AI芯片、操作系统等,怎样对待这种尝试?

郑方:从我个人来看,对技术也好,对产品也好,应该术业有专攻,坚持不懈地做技术改进,不断晋级打破。但在企业发展过程中,根据一些战略的需求或者市场的需求,做一些自动的转型,这是应该的,也是可取的。但有些转型,我觉得是在资本的压力下做的一种被动转型。假如一个次要做算法研讨的人去搞芯片,他其实没有那方面的专长,非要做,为什么呢?由于支出满足不了投资方的需求,被迫做转型,这种不可取,虽然可以了解。

AI企业经过转型后大概构成四种商业形式:卖技术、卖产品、卖服务、卖处理方案。智能语音企业如何选择合适本身的商业形式,哪种形式会更容易跑通?

郑方:形式的好坏有三方面的决议要素。第一取决于市场需求,痛点和痒点。痛点是处理基本的最受关注的成绩,痒点就是想要做一些打破创新的东西。第二,由技术来决议,技术能否成熟,能否具有一定的抢先性,能不能处理实践成绩。第三,由竞争关系决议,厂商之间的竞争关系是什么样的程度,假如竞争比较激烈,能够带来互相压价或者恶性竞争。

企业最后采取什么样的商业形式,都是根据这几个因从来综合决议的。比较成熟、市场也觉得比较容易接受的技术,那就可以用产品或服务的形式直接销售。一些不太成熟的,如用声响看病,那就能够用技术驱动,在单方合作的过程中去完善它,根据不同状况采取不同的形式来做能够比较好。

很多互联网巨头都在规划智能语音,如何对待和这些巨头的竞争,希望智能语音行业可以构成怎样的生态?

郑方:巨头在资金、人才、数据、算法、算力上都占据了优势,小企业是不是就没有空间了?我觉得不是。人工智能进入到第三代,就是把前两代的知识和数据结合起来,研讨可解释性,研讨鲁棒性(系统的稳健性)。但是可解释性不是完全靠大数据能处理的,有些成绩并不依赖大数据,反而是用小数据处理的。这个能够是巨头们不一定有的优势,小企业把方向找对,把力气用对,就可以在竞争中处于有利地位。

需求特别强调一点的是,我们要维护一个良好次序,技术人员(如科研机构、科技公司)专注在技术层面创新,用户企业(如银行等)则在场景方面有创新,两个结合起来才能构成比较好的生态,要杜绝恶性的竞争。

语音行业在中国照旧属于一个小众行业,要想做得好就要避免恶性竞争,企业都找好本人定位,在擅长的方面做得好、做到精、做到第一,甚至国际上拿到NO.1,避免反复投入。企业之间也需求良性竞争,如今有一种不好的情形,用户一旦发现技术、产品或服务提供商多了,就会经过让这些企业“内斗”来压价,压得很低甚至没有利润,企业没钱做研发,最后受损的是整个市场。在价格方面,用户应该有正确的观念和判别,就像不能用拖延机的预算去买奥迪。

在智能语音发展过程中,应该如何保护用户的个人隐私?

郑方:这需求多方努力才能处理,首先用户要有保护本人隐私的看法,在这个前提下还需求两方面的努力。第一是法律法规。我们国家最近刚刚颁布了《数据安全法》,对数据保护做了要求,也需求推进标准规范。当前哪些数据能传,哪些不能传,数据怎样留存,留存多长工夫必须销毁,能否要得到用户的明示赞同等,这些都要有明白规范。

第二,对企业一定要有技术下面的要求。企业应该有一些社会责任感,在做技术研发的时分,从源头阶段就要按照规范来做,做到从采集、传输、存储、运用到最后销毁的全生命周期都能保证用户隐私得到保护。
回复

使用道具 举报

大神点评3

爱吉吉次 2021-7-9 11:15:14 显示全部楼层
占位编辑
回复

使用道具 举报

书写人生 2021-7-10 09:17:09 来自手机 显示全部楼层
LZ是天才,坚定完毕
回复

使用道具 举报

wyflff2009 2021-7-11 09:49:19 显示全部楼层
大佬,这是大佬
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册