请选择 进入手机版 | 继续访问电脑版
 找回密码
 立即注册
搜索

对话王小川:通用人工智能是一次文艺复兴

蝉子 2023-4-13 15:23:38 显示全部楼层 阅读模式
访谈|杨轩 邓咏仪 王与桐

文|邓咏仪

编辑|杨轩

ChatGPT火遍全球,国内兴起AI大模型创业风潮时,王小川在业内私下讨论中被频频谈起——从他的人生经历上看,似乎是做AI大模型的"天选之人":清华大学计算机系出身,创办搜狗搜索,而搜索、输入法、语音识别、同传……这一系列业务都植根于AI技术。

“只是你们都忘了搜狗是一家AI公司,”王小川对36氪说,“但我没有忘。”

王小川还是一名颇为灵验的“技术预言家”。AlphaGo展开人机大战之前,他曾经和几位AI大佬打赌,预测AlphaGo会赢。他在2016年的时候,就称“搜索的未来就是问答机器人”,还说“当机器掌握语言之后,强人工智能就到来了”。这些预测都对了,但是打开通用人工智能大门的那个人并不是他。

离开相伴21年的搜狗,他感到遗憾吗?在经历了疫情、淡出公众视野两年后,这个原本情绪浓烈的问题,变得似乎不再重要。在这次AI大模型浪潮中“回归”的王小川说,“没有什么遗憾的。AI的机会会超越搜索,这对我们来说反而是一个机会,一个重来的时刻,包袱更轻了。”

王小川的新公司“百川智能”沉淀着他的旧历史:与他一起创业的有不少搜狗的老班底,比如前搜狗COO茹立云,还有老同事想带资加入;已获得5000万美元天使轮启动资金,来自王小川与其业内好友的个人支持。

“我们有信心,在年底做出中国最好的大语言模型。”王小川强调。不过,在“听说北京就有二十家大模型公司”的当下,他也需要帮助,“你们能在文章里放上我们的招聘邮箱吗?”他问36氪。(见文末)

带着许多问题,36氪专访了王小川。但近期关于AI大模型的采访都有其尴尬的一面:在ChatGPT的热潮中,基础的认知鸿沟已经迅速被抹平;而在36氪近期密集访谈AI创业者们时,由于大家都刚刚起步,可讨论的话题范围相当有限——要么过于初阶,要么过于遥远。

对于眼前,王小川展示了一种实干家的态度——与其讨论困难、失败,不如撸起袖子、把事做成——对于未来,他带着一种技术派的浪漫,“每个人都成为自己更想做的人。这会是一次文艺复兴。”

以下为36氪与王小川的对话,经编辑整理:

“复出”背后的故事


36氪:ChatGPT火遍业界的时候,我们当时就讨论,王小川不应该缺席这次机会。果然,你就入场了。

王小川:是的,确实已经准备一段时间了。

36氪:但我们2月问你做不做大模型的时候,当时王慧文已经喊出说要做大模型了。你宣布要做的时间比他晚,为什么?

王小川:我觉得双方心态不一样,每个人性格不一样。我是更多去论证这件事情该怎么做,找谁做。当你知道得更多的时候,你可能心中的要求、包袱也会更多。

36氪:如果不能确定自己能不能成,你就不入局?

王小川:我要找到跟这件事的连接感。王慧文的做法就是招英雄,直接敲门就行了。但我一想到要做,可能会立刻想,这和我过往经历、搜狗团队、国内最精英的人都是怎么样的关系?这个时候,大家的决策路径就不一样。

当你什么都没有的时候,你就不害怕失去。

36氪:有没有想过会失败?

王小川:不用这么想。我觉得要笃定,是我做就能成的。这是我们做事情的一种心态。我们应该要想,怎么尽量做成,做成的话,该长什么样?这些问题更有意义。

36氪:离开搜狗前后,这几年你逐步淡出公众视野,都在忙些什么?

王小川:我就在研究怎么把生命问题变成数学问题,所以我读了上千篇医学论文,创立生命科学公司。我研究生期间当时是做基因测序拼接算法的,基因变成蛋白质的过程,我们都知道是有相关性的,但是这个过程没有被数学化。

2021年的时候,AI在医药行业的落地有很大的突破,Deepmind的AlphaFold系统把从基因到蛋白质这个环节变成了数学问题,以前用20亿美金、10年时间去做款药还可能失败,就像是“炼丹”一样,但今天有了AlphaFold,帮助很大。

其实我们一直都在做AI。之前的生命科学公司,在做的一个事情其实是希望把生命和健康变成数学问题,用AI建立对世界认知的范式。

36氪:决心要回来做AI大模型的时刻或者决策过程,是怎么样的?

王小川:过程中我有试用过一些大模型,但当时我的重心是在把健康这个事情变成数学模型。在过程里,GPT模型的进展就像雨滴一样,一滴滴滴下来,不过我确实没有被深刻打动,直到看到ChatGPT的时候。

36氪:ChatGPT怎么打动了你?

王小川:比如,我问ChatGPT一个问题,里面很多有歧义的、复杂的语法,它能读懂你在问什么,完全知道你说的内容,你还能追问——对做搜索的人来说,这就是基础技术的突破,到了一个实用阶段。

我特别激动,因为科学家们真的把这事给突破了。2019年的时候,我在搜狗写过我们的使命和愿景,是帮助大家更简单地表达和获取知识,提高大家工作生活的效率。ChatGPT的理念跟这个是完全一致的。

36氪:相当于把你当年想做的事情完美地实现了?

王小川:对。这是一个超级APP,一个超级输入法和获取知识的超级引擎,在表达上远超过输入法,在问题的理解深度上也超过搜索。

36氪:你有没有一拍大腿,觉得ChatGPT这个事儿应该由你来做?

王小川:没有。其实当时以搜狗的能力和资源,是远远不够的。

36氪:哪些方面不够?

王小川:无论是资源还是人才都不够。ChatGPT把这个道路探通了,比如里面基础的网络结构,这从底层Transformer到上层的语言模型 LLM,再到现在的ChatGPT,这种探索首先是个科学问题,也是一个疯狂的工程。OpenAI走通了,甚至Google也跟在他们后面。

搜狗在2021年的时候,就已经训练了一个百亿模型,然后蒸馏出了一个搜索引擎,做了问答,放在线上。当时我们在国内的大模型评测Clue里拿过两次月度第一,甚至超过了华为盘古的千亿模型。当时我们已经往问答这个方向上走了。

但搜狗后来情况比较复杂,这个事儿就暂缓了。

36氪:如果搜狗继续做这个事儿,对比OpenAI,你觉得搜狗能做到他们的投入程度吗(投入七年,烧数十亿美金)?

王小川:不可能。就算投入也不会到OpenAI那么多。你有搜索作为你的目标,使得你会在研发时候,把AI变成搜索的一部分。

我觉得没有什么是遗憾的。我们的团队现在很兴奋,毕竟AI的机会会超越搜索,这些事情对我们来说反而是一个机会,一个重来的时刻,包袱更轻了。

36氪:那你的新公司想做什么事?

王小川:我们希望做一个带有搜索增强的大模型,也有其他的东西。现在,我们已经在训一个超过500亿的模型。我们认为到今年年底的话,会有一个对标GPT-3.5的模型,效果应该会是国内最好的。

36氪:新公司筹备得怎么样了?

团队方面,基本已经组建完成了,算是以搜狗班底为核心,也有来自搜狗、百度、华为、微软、字节、腾讯的同学,50个人左右。另外,我们也已经有几位“少帅级”的,90年左右的,打过仗的人才。

在搜狗的时候,当时最厉害的人还是在搜索,AI不是最当红的事。这次我能说,我们把最好的人才会放到