Google 是最早末尾研讨自然言语处理技术的团队之一,作为一个以搜索为核心的公司,Google 对自然言语处理更为注重。Google 拥有着海量数据,可以搭建丰富庞大的数据库,可以为其研讨提供弱小的数据支撑。Google 对自然言语处理的研讨侧重于运用规模、跨言语和跨范畴的算法,其成果在 Google 的许多方面都被运用,提升了用户在搜索、移动、运用、广告、翻译等方面的体验。
AI Lab 是腾讯的人工智能实验室,研讨范畴包括计算机视觉、语音辨认、自然言语处理、机器学习等。其研发的腾讯文智自然言语处理基于并行计算、分布式爬虫系统,结合独特的语义分析技术,可满足自然言语处理、转码、抽取、数据抓取等需求,同时,基于文智 API 还可以完成搜索、引荐、舆情、发掘等功能。在机器翻译方面,2017 年腾讯宣布翻译君 上线「同声传译」新功能,用户边说边翻的需求得到满足,语音辨认+NMT 等技术的运用保证了边说边翻的速度与精准性。
方法,基于统计的方法是目前的主流方法,概率上下文有关文法用的较多。完全句法分析存 在两个难点,一是词性歧义;二是搜索空间太大,通常是句子中词的个数 n 的指数级。浅层句法分析又叫部分句法分析或语块分析,它只需求辨认出句子中某些结构相对简单的成分如 动词短语、非递归的名词短语等,这些结构被称为语块。普通来说,浅层语法分析会完成语块的辨认和分析、语块之间依存关系的分析两个义务,其中语块的辨认和分析是浅层语法分析的次要义务。