“在人工智能领域,机器学习是一个非常有意思的话题。包括亚马逊CEO杰夫·贝索斯在内,很多人都会经常谈论它。”谈起人工智能与机器学习,已经在亚马逊云服务(AWS)工作了15年的AWS副总裁Swami Sivasubramanian(以下简称Swami)这样向趣味科技表示,“对于整个世界来说,我们正在开启一个人工智能和机器学习的黄金时代。在未来很长一段时间,我们都会看到机器学习带来的众多创新。”

打开网易新闻 查看更多图片

Amazon SageMaker机器学习服务的诞生

随着近年来人工智能技术的飞速发展,越来越多的人工智能应用也开始在自动驾驶、欺诈检测、呼叫中心、生产制造、语音转录和机器人技术等各个领域,以及金融、零售、医疗等各行各业百花齐放,带领人类加速迈进一个前所未有的智能时代。但是与此同时,人们也发现人工智能算法需要大量的计算和数据资源。幸运的是,同一时间云计算的发展与普及,让普通开发者也可以从云端获得充沛的计算和数据存储资源,从而大力推动了人工智能应用的开发。

不过,即使在云计算技术的帮助下,要为人工智能应用开发机器学习算法和构建模型,仍然是一项门槛非常高的工作。在很长一段时间里,只有那些比较高端的研究实验室,以及拥有硕士甚至博士学位的机器学习领域专业人士,才有可能从事相关工作。

这种尴尬的局面,使得Swami诞生了一个想法:AWS能不能将机器学习加以简化?这样就可以大幅降低人工智能与机器学习开发的门槛,并帮助开发者极大地简化工作流程,让更多的人们从机器学习中获益。

在用四个星期的假期中深入研究了各种深度学习算法和机器学习框架后,Swami撰写了一篇名为《AWS应如何实现人工智能和机器学习》的论文,其学术价值和商业意义获得了AWS内部人员的高度关注。于是Swami被授权带队将人工智能和机器学习构建为云服务产品,打造机器学习服务的基础架构、平台及服务。如今在全球开发者中大受欢迎的Amazon SageMaker机器学习服务,正是在这样的背景之下应运而生。

Amazon SageMaker带来的变革

在Amazon SageMaker诞生之前,机器学习模型的开发是一件非常繁琐和冗长的过程。从模型的开发、训练到调优、部署,往往需要耗费好几个月的漫长时间。

然而Amazon SageMaker的出现,提供了在不断更新和完善的创新功能,极大地提升了开发者的生产力与工作效率,降低了应用机器学习的门槛。譬如在Amazon SageMaker的帮助下,财务软件公司Intuit将机器学习的部署时间从过去的6个月缩短到了1周;金融初创公司Coinbase则将机器学习模型的训练时间从过去的20小时缩短到了10分钟。就连对机器学习完全没有知识储备,也完全没有丝毫机器学习行业经验的企业,也可以通过AWS的Amazon SageMaker来为客户提供服务。

与此同时,Amazon SageMaker还帮助用户大幅降低了构建机器学习系统的总拥有成本(Total Cost of Ownership,简称TCO)。有数据统计,采用Amazon SageMaker之后可使系统总拥有成本降低54%,让用户能够更好地聚焦于自身业务。

“打个比方,SageMaker对整个机器学习生态系统带来的变革,就像是AWS云计算对整个IT行业带来的变革。所有机器学习系统建构方面的苦活、累活,包括架构、训练、调优、部署等,都可以交给SageMaker一站式完成,这样开发者和数据科学家们就可以把所有精力都投入到解决业务问题方面,帮助客户更快实现价值。”Swami说道。

打开网易新闻 查看更多图片

疫情加速了人工智能创新的步伐

2020年肆虐全球的新冠疫情,给人们的工作和生活方式都带来了巨大的变化,许多企业也因此加快了数字化转型的步伐。越来越多的企业放弃了自建数据中心的传统模式,将更多的业务迁移到云端,并且在云端进行机器学习建模和部署等工作,从而使得企业对云的需求大幅增加。

Swami指出,目前越来越多的企业都在向云端迁徙,使用AWS的Amazon SageMaker机器学习服务来打造人工智能应用,具体来说可以体现为三大趋势:

第一大趋势是大规模部署企业通信系统。譬如柯基数据联合中国疾控中心的权威专家,利用来自中国疾控中心、卫健委等官方渠道的权威信息,结合专业文献和词库,再利用机器学习和自然语言处理、知识图谱技术对专业信息进行结构化、整合归类并建立新冠肺炎防护的知识图谱,开发了新冠肺炎智能问答小助手。这套准确率很高的新冠肺炎智能问答系统上线以来,平均每天为数千名患者和医生提供服务,累积解决了数十万个问题。

第二大趋势是使用机器学习来进行新冠病毒治疗方案的研发。譬如在新冠疫情爆发后,晶泰科技很快对近3000个已通过美国药监局(FDA)审核的上市药物、以及超过1万种中药成分分子,进行了老药新用的扫描,成功找到了183个可能对新冠病毒有潜在治疗效果的药物并对其活性进行排序,然后通过更加高精度的计算方法最终锁定了38个药物。而在大量药物筛选的背后,基于AWS GPU计算实例的机器学习框架,以及Amazon SageMaker机器学习服务都功不可没。

第三大趋势是使用Amazon SageMaker机器学习服务开发远程医疗解决方案,使得很多社区医院和小的医疗机构可以通过远程医疗平台问诊,让病人无需到医院就可以进行诊疗,极大地降低了社区疫情爆发的风险,同时也帮助中小医疗机构解决了专业医生资源不足的问题。

“总的来说,疫情激励我们发挥每一点可能的技术创新,同时也促使企业更加快速地加强对人工智能、机器学习等创新技术的应用,包括建立大规模的通信服务,更好地理解新冠病毒的传播路径,以及加速治疗方案的研发等等。可以说正是因为这次疫情,使得人工智能和机器学习的步伐进一步加快,让人们更加愿意去使用这些创新技术,来更好地适应不断变化的外部环境。”Swami表示。

无独有偶的是,在第三届WAIC世界人工智能大会云端峰会开幕式上,马云也在演讲中发表了与Swami类似的观点,可以说是“英雄所见略同”。

机器学习将是所有应用的必备成分

“机器学习目前还处在一个非常早期的阶段,在亚马逊我们有一种说法,就是‘Day 1’(第一天)理念。机器学习毫无疑问正处在它的第一天。”Swami表示,“不过我相信假以时日,机器学习将会成为所有应用的必备成分。”

Amazon SageMaker从2020年4月开始在中国提供服务,已经在不少行业都有了应用案例。除了文章前面提到的在药物研发方面大展身手的晶泰科技之外,在视频直播领域打造出AI主播的虎牙,以及在自动驾驶领域可实现高精度自动驾驶货运服务的图森公司,都是其中的典型代表。

在本届WAIC世界人工智能大会的主题演讲上,Swami提到,目前机器学习的最大挑战在于数据。“有许多科学家在做模型开发时,需要花费大概一半的时间来做数据准备工作,Amazon SageMaker就是为了在这方面为他们提供帮助。不管是中国还是美国,在数据底层面临的问题都是一样的。这种数据准备工作是机器学习模型开发的必备阶段,也是AWS不断推出各种机器学习工具和服务的原因。”

“对于初创公司,我的建议是首先要找到自己的客户是谁,然后再去做产品和技术创新,这个过程中再结合AWS提供的工具平台,譬如通过Amazon SageMaker这样的机器学习服务平台,来完成模型的构建、训练、调优、部署等苦活累活,这样就可以将主要精力都投入到企业自身的业务上,还能够加快人工智能和机器学习的创新速度。”Swami说道。