找回密码
 立即注册
搜索

为什么用Go编写机器学习的基础架构,而不是Python?


全文共2626字,估计学习时长8分钟
来源:blog.sina






Python是机器学习项目中最盛行的言语,这点是无须置疑的。




虽然像R言语、C++和Julia这样的程序文语有其特有的运用群体与用例,使它们经久不衰,但Python仍是运用最广泛的言语,并用于每个次要的机器学习框架中。




但是,你能想象?在Cortex(将机器学习模型部署为API的开放源代码平台之一)代码库中,87.5%的代码都是运用GO编写。



图源: Cortex GitHub






Python引以为豪的机器学习算法只是消费环境机器学习系统的一个组成部分。如要实践大规模运转消费环境中的机器学习API,您的基础结构需求完成以下功能:




· 自动缩放,确保流量波动不会毁坏API

· 实行API管理,以处理API同步部署

· 滚动更新,确保更新模型不会中缀用户服务




Cortex旨在自动完成一切上述基础架构,以及其他一些成绩,例如日志记录和成本优化。




出于以下思索,Go是构建满足上述需求软件的理想之选:



1. Go生态系统非常合适基础设备项目



来源:zcool






开源的好处之一就是您可以从本人欣赏的项目中不断学习。例如,Cortex存在于Kubernetes(本身用Go编写)生态系统中。很侥幸,我们可以在该生态系统中参考许多出色的开源项目,其中包括:




· kubectl: Kubernetes CLI

· minikube: 一种在本地运转Kubernetes的工具

· helm: Kubernetes软件包管理工具

· kops: 管理消费Kubernetes的工具

· eksctl: 亚马逊EKS的官方CLI




以上一切工具不只仅是Kubernetes项目,并且都是用Go言语编写。无论是查看CockroachDB还是Hashicorp的基础设备项目(包括Vault, Nomad, Terraform, Consul和 Packer),您将发现它们均是运用Go言语编写。




Go在基础架构范畴的盛行还有另一个影响,那就是大多数对基础架构感兴味的工程师都熟习Go言语。所以,很容易经过GO吸引这些工程师。实践上,Cortex Labs最优秀的工程师之一就是经过在AngelList上搜索Go职位找到我们的。他找到了我们,我们感到非常侥幸。



2.并发对于机器学习的基础架构至关重要




用户可以将许多不同的模型部署为不同的API,并把一切模型都在同一个Cortex集群中以便管理。而Cortex Operator也需求经过一些API来管理这些不同的部署。举例:




· Cortex调用Kubernetes API在集群上部署模型。

· Cortex调用各种AWS API(包括EC2 Auto Scaling,S3,CloudWatch等)来管理AWS上的部署。




用户不会直接与这些API停止交互。相反,Cortex以编程方式调用这些API来提供群集,启动部署和监视API。




以一种高效、牢靠的方式交叉调用API是一项严重应战。采用并发的方式运用API是最高效的方法,但也引发了成绩,由于如今我们不得不担心竞态条件之类的事情。




Go提供了一个处理该成绩的简便方案:Goroutines。




Goroutines是Go以并发方式执行代码的普通函数。我们可以另写一篇长文深化讨论Goroutines背后的工作方式,但是概括而言,Goroutines是Go运转时自动管理的轻量级线程。多个Goroutine可以放置在一个OS线程上,假如Goroutine阻塞了OS线程,则Go运转时会自动将其他Goroutine移到新的OS线程上。




Goroutines还提供了一个称为“channel”的功能,此功能允许用户在Goroutines之间传递音讯,协助用户调度央求并预防竞态条件。




当然,用户也可运用asyncio等最新工具在Python中完成这些功能,但Go在设计时就思索到了这些状况,运用GO可以减轻我们的工作和生活负担。



3.运用Go言语编程是一种享用



来源:Pexels






我们运用Go构建Cortex的最后一个理由就是:Go言语真的非常好。




相对于Python,Go的入门有点痛苦。但是,Go的包容功能为大型项目带来温馨感。我们照旧在严厉测试软件,但静态输入和编译(Go初学者的两大难题)充当了我们的护栏栏,有助于我们编写(相对而言)没有错误的代码。




您能够会说其他言语也会提供特定的优势,但总的来说,Go最大限制地满足了我们的技术和美学需求。



4.运用Go构建跨平台的CLI更容易




Cortex CLI是一个跨平台工具,允许用户直接从命令行部署模型并管理API。以下动图显示了运转中的CLI:



图源: Cortex GitHub






最后,我们运用Python编写CLI,但理想证明,跨平台分发CLI太困难了。而Go可以编译二进制文件(无需依赖管理),为我们提供了跨平台分发CLI的便捷易行方案,而无需停止额外的工程工作。




Go编译的二进制代码与解释型言语相比,具有不言而喻的功能优势。根据计算机基准测试结果,GO的速度远胜Python。




许多其他的基础设备CLI工具也是用GO编写,这能够并非偶然。




Python适用于机器学习,而Go适用于基础架构




我们也很喜欢Python,它在Cortex中占有一席之地,特别是在处理推理方面。




Cortex服务于TensorFlow,PyTorch,scikit-learn和其他Python模型,这意味着与模型的接口,推理之前和之后的处理均在Python中完成。但是,即便Python代码经过打包部署到了Docker容器中,这些容器是由用Go编写的代码精心编排的。



来源:Pexels






假如您有兴味成为一名机器学习工程师,那么必须熟习掌握Python。但是,假如您对运用机器学习的基础结构感兴味,仔细思索一下Go言语,一定会播种满满~

留言点赞关注

我们一同分享AI学习与发展的干货

如转载,请后台留言,遵守转载规范

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

大神点评3

李艺丹 2020-2-23 15:24:33 显示全部楼层
支持,楼下的跟上哈~
回复

使用道具 举报

lingling8880 2020-2-24 11:23:53 来自手机 显示全部楼层
LZ敢整点更有创意的不?兄弟们等着围观捏~
回复

使用道具 举报

快乐林涛 2020-2-24 22:27:40 显示全部楼层
元芳你怎么看?
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies