将AI打造成服务 英特尔与金山云如何携手共进

毫无疑问,人工智能的火热,使得企业要么已经部署了AI,要么在赶往AI的部署之路上,英特尔与金山云也不断从各自擅长的层面满足着企业日益增长的AI需求。

从至强E5系列到至强可扩展再到最新的二代至强可扩展处理器,英特尔所提供的数据中心级处理器除主频、核数的提高外,同时引入AVX-512、VNNI加速指令集、DAAL、nGraph等库组件或编译器,从软件角度提升深度学习、机器学习等高密度计算负载时所需的单精度浮点数能力。

金山云则借助这些不断升级的数据中心级处理器,与内存、网络等模块适配、结合、优化,提升整体架构的稳定性及性能,为用户提供更加适用AI场景的云主机平台。

此外,在AI场景上,英特尔所做的软件工作,除对底层指令集、库组件及编译器的优化外,同时也优化了对TensorFlow、Caffe、MXNet等深度学习开源框架的支持,通过借助MKL-DNN核心数学加速库技术,充分调用AVX-512指令集,以支持该场景下较为普遍的计算机视觉、语音识别、自然语言处理等应用。

不难发现,从底层云平台设施到开源框架优化,金山云与英特尔其实已为AI场景提供了有效支撑,但在“AI as a Service”新解决方案推出之前,这一系列工作却没能完全满足用户日益多样化的需求。

从用户角度而言,尽管各行各业大大小小的公司都在应用AI,但即便是互联网公司,在部署金山云的硬件平台后,由于并不具备相应的深度框架优化能力,平台的性能并不能得到充分发挥。据英特尔相关技术人员介绍,“我们此前也遇到过一些互联网公司,做人脸识别,虽然也是在至强可扩展处理上作部署,用了Caffe,但实际获得的性能并不理想”。“而基于我们与金山云长期在业务上实际的交流以及针对实际案例做调优积累的经验,我们可以合力帮助客户在金山云的云主机上针对深度学习的框架进行创新与调优。”

而这,也是困扰金山云的问题。“客户以前买我们的云主机拿去做计算,会反映CPU使用没有达到预期,但再怎么加压也跑不上去了,继而直观判断整个云主机的处理能力已经达到上限了”,金山云计算研发总监杨峰说。在这样的情况下,企业若想完成整个模型的学习或训练,只能部署更多的机器,或者,寻求英特尔提供框架优化上的帮助。

对英特尔而言,由于金山云客户众多,针对每一个客户安装优化过的TensorFlow和Caffe,对其技术人员也是一项挑战。

【声明】:芜湖站长网内容转载自互联网,其相关言论仅代表作者个人观点绝非权威,不代表本站立场。如您发现内容存在版权问题,请提交相关链接至邮箱:bqsm@foxmail.com,我们将及时予以处理。

相关文章