亚马逊云科技顾凡:对企业成功应用机器学习的四点建议
作者:亚马逊云科技大中华区云服务产品管理总经理 顾凡
随着机器学习不断向纵深发展,越来越多的传统企业也开始应用机器学习进行业务创新,实现业务重塑。麦肯锡此前刊发的针对人工智能对世界经济的影响专题报告显示,预计到2030年,人工智能将为全球经济贡献13万亿美元。零售、运输、物流、制造业和农业等传统领域在人工智能和机器学习赋能之后,带动的经济贡献或将远超软件和信息服务业。而且,对比软件与信息服务业,这些行业也更需要被赋能,以帮他们更好地部署和使用人工智能和机器学习。
结合亚马逊全球20年机器学习的创新实践,以及亚马逊云科技帮助逾10万客户在云上使用机器学习的经验,我们对传统企业成功应用机器学习总结了四点建议。
一、制定明确的数据策略
机器学习三要素包括数据、算法和算力,三者缺一不可。
对于多数行业来说,收集和处理数据是一个难题。因此,企业开始应用机器学习之前,首先需要充分了解自己的数据现状并制定数据策略。什么数据现在可用?什么数据通过一定的工作可以变得简单易用?如果已经确定几个想尝试利用机器学习的场景,就可以采用逆向工作法,根据目标进行倒推,推算出需要的数据、目前已经具备的数据和依然缺失的数据,以及从现在开始需要搜集的数据。解决了这些问题,制定了明确的数据策略,才会有真实、准备充分的数据去应对基于机器学习的业务创新需求。
部分客户虽然搜集了很多数据,但数据的就绪程度较低,数据质量不高。例如,如果传感器送过来的数据有异常值或缺失值,那么以此为基础应用机器学习,训练出来的模型大概率是不够精准的。
二、从合适的场景切入
企业在应用机器学习的时候往往千头万绪,那么开展机器学习应该从什么项目切入呢?这里给大家一个决策参考框架,可以从数据就绪状态、业务影响和机器学习适用性三个维度进行评估。企业可以选择数据就绪度高、有业务价值但是业务影响低、机器学习适用性高的应用场景作为机器学习试点和示范项目。
具体从三个方面入手。第一,在开展机器学习的早期阶段,公司内部可能对其带来的作用还有些疑惑,因此需要从一个投入相对小的创新项目开始实验,它不会影响公司的核心业务,一旦成功可以帮助企业积累经验,同时赢得内部的信任。
第二,这个项目既需要有业务价值,还要适用于机器学习,取二者的交集。第三,找到一个场景机器学习只是作为辅助去自动化加速工作的某一个环节,而不是替代人。例如,医生对病人的诊断由非常多的环节组成,其中看心电图、X光片的过程可以利用机器学习实现自动化,加速医生的诊断过程,但机器学习不会取代医生的工作,对治疗过程本身带来的影响比较小,更容易得到医生的支持和配合。
在成功交付了几个3到6 个月可以完成的小型项目后,企业就会有足够的信心和动力去获得领导团队的支持,加大机器学习项目投入,逐步应用机器学习来改造核心业务。
以嘉实财富管理有限公司为例,它是嘉实基金旗下的独立财富管理机构,在全国主要城市均设有财富管理服务中心,2020年为客户创造回报超过31亿元。作为金融企业,嘉实财富以媒体平台作为切入点,借助亚马逊云科技提供的标准AI 能力,包括开箱即用工具以及机器学习服务平台上定制的 AI模型,形成了集媒资入库、语音转录、短视频生成、个性化推荐为一体的媒体处理平台,让金融企业有机会将客户需要的金融视频,精准的推荐给客户,从更多的渠道触达客户。
三、数据科学家业务化
针对企业成功应用机器学习的第三个建议是要让数据科学家业务化。以亚马逊构建机器学习团队为例,在亚马逊,我们没有将数据科学家单独放到一个中央团队,而是将数据科学家与产品、业务团队放在一起,让数据科学家业务化。亚马逊致力于以客户为中心,我们的机器学习科学家首先要以提高客户体验为出发点,而不是从研究机器学习算法开始。
数据科学家业务化是亚马逊的重要经验。我们把这一经验复制到亚马逊云科技的客户项目中。当客户缺乏数据科学家时,亚马逊云科技的数据科学家和工程师会加入项目团队,与客户的业务开发团队一起工作,凝聚数据科学家和领域专家的力量,为提高客户体验而进行创新发明。
传统企业通常没有既精通业务又精通机器学习技术的专家和数据科学家,因此也可以把数据科学家/机器学习技术专家与业务领域专家放在一起实现技术创新。山东淄博市热力集团就成功地通过亚马逊云科技的赋能,将其业务领域专家和机器学习技术专家拧成一股绳。淄博热力利用亚马逊云科技丰富的人工智能和机器学习技术和服务,双方联合研发一套基于机器学习的智慧供热专家系统,根据气象、SCADA工控数据、建筑物维护结构等信息计算出最佳的供热模式,并给出具体的操作指令,实现精准供热,既让用户室温始终保持人体最佳热舒适温度,又做到节能增效。
四、应对技能差距
当前,多数企业部署和应用机器学习最大的瓶颈之一是机器学习人才的缺口。新兴公司争抢机器学习人才,同时各类传统企业也需要机器学习人才。在这种情况下,企业寻找能够对其提供帮助、为企业赋能的服务商是解决这一问题的最佳途径。
我们在与行业客户交流中发现,很多行业问题需要对算法进行大量的迭代和优化,不断提高精准度。一些行业难题,甚至需要研究新的算法进行破解。面对这些复杂的行业问题,不能停留在只教会客户使用工具上。亚马逊云科技的做法是“扶上马、送一程”。我们集合了解决方案架构师、人工智能实验室、数据实验室、快速开发团队和专业服务团队,根据客户的项目需要,参与到项目的生命周期当中,与客户共同寻找适用于机器学习的业务场景,跟业务人员、技术人员在一起开发出产品原型,然后快速迭代进行实施。让客户以尽可能小的试错成本完成产品原型开发,弥补客户的技能差距。
通过这样的方式,我们授人以渔,赋能客户创新,并且一直坚持平台思维,让更多的人使用亚马逊云科技进行创造和发明,让人工智能和机器学习普惠。亚马逊创始人杰夫•贝佐斯说过,创新有多种形式和各种规模,最激进和最具变革的创新是帮助他人释放创造力,实现其梦想。
亚马逊云科技的一大核心目标,就是将机器学习能力交付至每一位开发人员手中。借助Amazon SageMaker能够帮助客户快速构建、训练以及部署机器学习模型的能力,我们得以更进一步,将机器学习能力交付至更多希望基于机器学习创新的用户手中。
总之,企业客户应用机器学习大有可为,建议企业制定好明确的数据策略,寻找适合机器学习的应用场景作为切入点,先突破创新业务,再改造核心业务。同时让数据科学家深入业务,避免闭门造车。希望越来越多的企业通过机器学习实现不断创新和发展,在激烈的竞争之中立于不败之地。