下面简单引见“预训练模型”。上述的 word embedding 是静态的。比如 bank 这个词,无论什么上下文,它都是同一个 word embedding。但实践上 bank 在不同的上下文有不同的意思。为了表现动态信息,引入了一个预训练的自然言语模型,表现每一个词在不同上下文的意思。普通来讲,如今常用的是 Masked LM,即把某一个词盖住,根据上下文经过一个网络来猜这个词,猜得不准绳再调整网络。也可以加入一些别的义务,比如预测某一句话是不是当前句的下一句。基于这种信息可以训练一个网络,对输入的句子得到上下文关联的词的向量表示。基于这种预训练模型,对自然言语的上下文和单句都可以很好地建模。
第二是长大型的思想。人的思想有两个,固定型、长大型。人人都有这两个思想。固定型思想以为,人的特质和才能后天固定,后天无法改变,这种思想导致大家按部就班、随意而安、害怕失败,只情愿做本人擅长的事情。长大型思想以为任何技能、才能都可以经过不断地学习、发展,没有一个后天的框架说我数学不好,所以我就不搞数学,我英语不好,我永远不学英语。不是,而是要逆袭,应战本人,强化本人的相关的一些才能。比如说微软的 CEO 纳德拉就主张长大型思想,鼓励大家创新。微软公司从一个原来比较舒适的范畴,PC 和操作系统,走向不熟习但有更大发展空间的元计算和开源,给公司带来了更大的发展空间。
我以为,首先是人工智能非常重要,一是国家注重,二是如今有很大发展出路,包括软件硬件,各种运用例如安防、医疗、健康、交通等等,都有很多没有处理的成绩。但是,并不意味着一切人都要追求去搞人工智能。如今学习一些人工智能,包括编程,为将来做不是人工智能的一些方向也有一定协助。AI既是一个技能,也是一个思索方式,把思索方式运用在其他一些范畴内,也会加强你的才能,提高你的创新速度。Follow your heart,看你想做什么,不一定别人做什么你就要做什么。同时也要兼收并蓄,在大学时期把关键的技术,尤其是基础部分,数学、算法、编程弄好,将来可以很容易地调整本人。
回到脑迷信,脑迷信对自然言语处理,目前来讲没有证明有多么好的一些促进,将来有没有能够?有能够,由于能够会改进神经网络的一些算法或者结构。过去最早的神经网络也受脑迷信的启示,但是目前来讲又停滞了,看不出来脑迷信对 NLP 或其别人工智能有多么大的一个停顿。也许将来积累到一定程度,又有一个迸发的过程。我希望同窗要 keep an open eye,首先了解本人的范畴,同时也关注其他学科。试图捕捉将来的机会,但是不成熟之前,也不焦急,打好基础,不一定要急于成功。