对话山世光:AI需要傻瓜式的平台 学AI到"蓝翔" | AI英雄

subtitle 网易智能01-12 10:17 跟贴 102 条
《AI英雄》第58期对话嘉宾为中科院计算所研究员、中科视拓创始人、董事长兼CTO山世光,过去一年,他双跨学术和工业两界,有哪些感悟和思考?又如何看待人脸识别的发展?
打开网易新闻 查看更多精彩图片

本文系网易智能工作室(公众号smartman163)出品,此篇为AI英雄人物第58期。

文 | 丁广胜

人物观点:

希望人工智能的研发可规模化,易于扩展,基于傻瓜式的AI研发平台,我们期望五到十年之后甚至高中学历的人都可以研发AI那时候我们或许会开玩笑说AI到蓝翔

人工智能落地的商业模式,我个人认为其实现在没有人能看透至少目前为止我个人的想象里,如果不结合应用场景AI这个领域恐怕很难有机会可以发展出像BAT这样的大公司。——山世光

周末的中科院显得严肃安静,有不少研究员还在伏案潜心钻研。

虽然在北京银谷大厦和杭州滨江区都设有办公室,但已经双跨学术和工业两界一年的山世光仍然习惯在这里办公,他的办公室不大,桌子被一排排书籍环绕着。

他也逐渐习惯了自己的双重身份,既是中科院计算所的研究员,也是中科视拓的CTO,他认为工业界还是需要非常强的理论和方法作为支撑,所以对实验室依然非常倚重

山世光有着超过20年的计算机视觉研究经验,在国内外刊物和学术会议上发表论文200余篇,论文被谷歌学术引用12000余次,研究成果获2005年度国家科技进步二等奖,2015年度国家自然科学二等奖等。

对于只是担任公司CTO职位,他坦言,“我并没有全职出来创业,而是我的几个研究生毕业后全职创业,我更多是支持和辅助他们的角色。特别是公司CEO刘昕博士,他是冲在创业最前线的,实实在在地担负着首席执行官的角色”。

在山世光看来,研究员和创业的不同在于,做研究的时候往往会更关注新问题、新理论和新方法。很多时候是在寻找新的理论问题,即使是问题明确之后,也需要很长的时间去摸索,而且很多时候可能都不一定做成,今天解决1%,明天解决5%经常是个渐进的过程而且做成了也未必马上有用。而在工业界则首先需要理解用户的需求,考虑可以满足需求或者说马上可以落地的方法和技术。从学术界到工业界,更接近应用落地了。

他还希望让人工智能的研发可规模化和可扩展,利用技术服务平台为B端客户赋能。或许我们可以期待几年后基于傻瓜式的AI开发平台,高中学历的人都可以研发AI“那时候我们或许会开玩笑说AI蓝翔”山世光笑着说到。

此外,当网易智能问到如何看待AI领域的商业发展模式时,山世光表示,我个人觉得其实现在没有人能看透至少到目前为止我个人的想象里,不结合应用场景单纯的AI科技领域恐怕很难有机会可以发展成像BAT这样的大公司。

对于当前的行业现状,他建议不要“过度承诺”,不要在宣传的时候故意“隐藏前提条件”,政府、媒体的宣传不要让公众产生误解,比如人们看了AlphaGo,然后就说什么都可以解决了,这是泡沫风险,从投资的角度,会导致资本杠杆的失衡

以下根据山世光问答实录整理,网易智能(公众号Smartman163)做了不改动原意的删减:

应对AI人才稀缺 打造新的技术发展模式

网易智能:作为一家非常年轻的公司,您如何定位自己和自己的团队?

山世光:目前我们在北京有30多人,杭州子公司有20多人,总共接近50人的规模。

现在公司大概在做三个层面的事情,首先,杭州子公司主要做直接落地的产品,直接面向客户,比如说一个单位,它要人脸闸机,人脸考勤门禁和访客系统,我们会从硬件到软件提供全套解决方案

第二个层面是北京团队的算法和技术服务,主要是to B,包括我们跟华为平安科技电信、移动等大客户合作,主要形态是深度的技术服务的形式,相当于把技术和算法以SDK甚至源码的方式授权给B端的客户,他们又会拿着这些算法,再去开发针对某一个具体需求业务系统。

第三个层面,也是我们和其他公司非常不同的一点,我们不满足于做项目制的技术服务,而是进一步往后端做to B“技术服务”产品,或者说“赋能型”的产品。具体地说,我们开发了一个平台型的AI研发产品可以更多B端客户服务,特别是面向难以组建AI研发团队的中小微企业服务,我们把这个平台称之为SeeTaaS

网易智能:深度学习的平台开发工具很多,那为什么还要做SeeTaaS

山世光:打个比方,现在深度学习的开发,有点类似于照相领域,曾经的胶片时代,照相需要昂贵的专业相机、胶片、专业的相纸、相片冲印室,还需要一个懂曝光、对焦、取景的专业摄影师。这件事需要专业的基础设施才能做,需要专业人士才能照对应到AI就是,只有所谓的AI算法工程师,深度学习算法工程师,才能够TensorFlowCaffeMXNet等等这些专业的深度学习开发工具上去生产用户需要的一个某种AI引擎。

我们现在进入了读图看脸的时代因为我们有傻瓜相机有了更智能的拍照手机,按一个键你就可以拍一张照片,我认为这个变迁同样适用于AI引擎的开发,从只有专业人士可以AI技术,到越来越多非专业人士也可以开发AI技术的时代但这需要一个新的平台这种平台不能是像TensorFlow这样专业化的工具,而应该是一个更傻瓜式的AI开发工具,这就是我们为什么做SeeTaaS的原因。

不仅如此,做这个平台还有AI人才稀缺的考虑,专业的AI开发人员现在极度稀缺,直接表现就是AI人才奇贵,大多数公司要么找不到这样的人才要么雇不起这样的人才。而另一个令人尴尬的现实是:AI应用落地的需求是非常碎片化的,现在还不存在一个包打天下的算法,很多看起来相似的需求背后的技术也有差异。更要命的是,往往A需求需要A的数据,B需求需要B的数据,C需求需要C的数据,何况背后的AI算法还需要根据数据情况进行调整所需要的时间动辄数月需求千变万化,如果每个需求都分配几AI专业人才去满足,必然导致公司成为人力成本极高的企业我们希望能够把AI需求满足过程变得更加自动化,而不是说每一个需求来了之后,都是一推专业人士去做

我们重视SeeTaaS业务还有一个重要原因,那就是数据的敏感性。因为法律的原因很多企业客户对数据是非常敏感的。如果没有SeeTaaS我们就只能派AI研发工程师到客户那里进行客户需要的AI引擎的开发,这就变成了一个非常繁重的研发模式。也就是说,针对很多需求我们其实没有数据,而客户自己有数据却不能或不愿给我们有了SeeTaaS我们就可以提供给客户一个私有的SeeTaaS云平台,让客户自己放心的研发自己的AI当然,也会有很多客户对数据不敏感,可以把数据共享出来,那当然更好,我们只需要为他们提供共有的SeeTaaS云服务就可以了。

AI将迎来规模化普及 学AI蓝翔

网易智能:您的目标是什么?想把公司打造成一家怎样的企业?

山世光:中科视拓的愿景我们用两句话概括,即“知人识面辨万物,开源赋能共发展”。前一句对应公司名字视拓中的“视”字,概括的是我们主攻的技术范畴,即以计算机视觉技术为主,特别关注图像或视频中人的识别,人的意图和情绪的感知,以及对其中万事万物的识别和理解。我们相信“会看的AI更智能”。

第二句话则概括了公司名字中的“拓”字,即我们期望不仅仅提供人脸识别行人识别、车辆识别这样的计算机视觉技术,这个其实能做的人很多我们更希望以更高效的方式与大量B端客户合作AI的研发可规模化和可扩展即有更好的可拓展性。

我为什么强调现在AI技术的可扩展性不好?以让机器人自动检测小区里的垃圾为例,实际的需求是五花八门的,可能今天需要检测狗屎,明天则需要检测矿泉水瓶子,后天就是塑料袋或者烂白菜,你想想垃圾有多少种?

实际应用中可能会有数万种物体要去识别如果每认一样物体要搜集大量样本数据的话,这是非常高的代价。所以,长期来说我们希望能够一种可规模化、可扩展的方式去提供这种技术服务。未来五到十年我们相信会有大量的劳动力进入AI研发市场,采用的就是傻瓜式的平台,或许到时候我们会开玩笑说AI蓝翔。

当然,短时间内寄希望于这样的平台解决所有问题也是不现实的。还需要针对不同的问题,开发全新的算法,特别需要解决现在深度学习不能解决的问题。这也是我还花费很一部分精力从事前沿学术研究的原因

此外,关于AI领域的发展模式,我个人觉得其实现在没有人能完全看透,至少目前为止我个人的想象里,如果不结合应用场景,AI这个领域恐怕很难有机会可以发展出像BAT这样的大公司。纵观国内外,做to B公司是非常少的。

网易智能:一年多以来,您有哪些创业感想?自己从研究员变为创业者,如何看待自己的这一转变?

山世光:必须强调的是我的身份双重,而且是学者为先企业家在后。我们实现的三个层次使命中(第一个问题中提到的三个层次:产品落地、AI技术服务、SeeTaaS第二层和第三层都需要非常强的理论和方法支撑,所以我在中科院计算所的实验室的支持是不可或缺的

更重要的是中科视拓的CEO并不是我,而是我去年毕业的博士刘昕另外我还有几个毕业生也全职在公司工作。我在公司的身份是CTO,主要专注技术。特别值得强调的是,刘昕博士不仅仅懂技术,也懂商业和管理,他作为公司的CEO,是冲在创业最前线的,实实在在地担负着首席执行官的角色。

当然,这一年,因为更多的接触工业界和关注应用问题,我对技术落地的认知是有提高的。毕竟做基础研究时,很多时间是在寻找新的学术问题,即使是问题明确之后,也需要很长的时间去摸索,而且很多时候可能还不一定做成,今天解决1%,明天解决5%经常是个渐进的过程。而在工业界则首先需要理解用户的需求,考虑可以满足需求或者说马上可以落地的方法和技术。从学术界到工业界,肯定要更重视可以应用落地的技术和方法了。

网易智能:中科视拓现在有什么最新进展,新的计划是什么?

山世光:大家对我们可能有误解,我们不只是一家人脸识别公司,我们以人脸识别为出发点,然后是在技术服务方面发力,特别会主推SeeTaaS服务这是我们2018年的重点

营收方面,中科视拓2017年已经有千万级的收入,明年计划是三倍以上的营收预期规模方面我们也需要招募更多的人才,希望到明年底的时候公司规模可以扩大一倍。当然,在大家都没有摸索的非常清楚的情况下,我们比较谨慎的控制着规模。

“没有绝对的安全,人脸识别支付也是如此”

网易智能:人脸识别领域是AI非常火的细分门类,国内有很多类似的公司深耕其中,都在持续发力,您如果面对竞争因素?

山世光:显然是有竞争的,人脸识别就是一个红海市场了另外一个角度来,这个市场非常大,现在至少还有一定的时间窗口,每一个公司都有成长的空间。

整个人类社会其实就是以身份识别为基础的,如果一个社会每个人都不能知道对方是谁,这个社会是没法儿运行几乎所有的信任关系,所有的交换,所有的交易,全都要基于大家知道谁是谁这个条件。

网易智能:您如何看待目前人脸识别技术的发展?是否足够成熟?

山世光:人脸识别技术肯定会非常快速的在相对成熟的领域落地,现在最成熟的就是1:1的人脸认证成熟度可能高达98%或者更高。

比如说iPhone X手机里面,它就是典型的1:1认证应用场景其实也是人脸识别领域最容易的一个场景这款手机的摄像头和普通摄像机是不一样的,它可以看到近红外图像深度图。

近红外图就是它上面有一个近红外的光源,会发近红外光,因为是近红外,我们人眼是看不到的还有一个是深度图,它测量的是摄像头离你脸上的每一个点的距离,这信息综合起来进行人脸识别。

网易智能:您觉得人脸识别绝对安全吗?这些技术在安全领域会有哪些问题?

山世光:没有绝对的安全例如苹果官方表示iPhone XFaceID错误率是百万分之一但苹果也建议同卵双胞胎最好不要用FaceID如果有人愿意花上足够的成本,是可以攻破它的,已经有一些案例了。恶意攻击者虽然可以偷到一个人的手机,但有手机主人精确的面部信息的可能性并不大,所以其危害基本是可控的。

现在很多车站都开始应用人脸识别进站了。错误识别的风险当然也还是有的,但这个风险是极低的:因为拿别人的身份证冒充他刷脸,成功的概率可能只有千分之一。换句话说,不法分子得“偷”1000个人的身份证,试刷脸1000次才有一次可能成功,显然不会有人这么去做的

相对不成熟的应用是黑名单人员的监控,即用大街上等各种公共场所的监控摄像头来识别犯罪嫌疑人,由于摄像角度、光线环境、伪装和老化等诸多因素,导致这种场景下人脸识别的难度比较大。当然,这方面技术的进步也是非常快的,越来越多的人脸识别系统已经开始在公安实战中发挥重要作用。

网易智能:您认为人工智能行业有泡沫吗?健康的行业环境应该是怎样的?会议邀请一个接着一个,您会感觉这个大环境浮躁吗?

山世光:从技术的角度来讲,所谓的泡沫就是过度承诺”,所谓的过度承诺是你只能做到60%,你说成做到90%或者是宣传的时候故意隐藏必要的前提条件,非技术人员可能过分解读你展示的数据。

此外,从政府媒体大众解读的角度,语言其实是不统一的,这种不统一可能会导致对技术的误解,特别是过度泛化比如有些人看了AlphaGo之后,就说什么都可以解决了,这是有泡沫风险的从投资人的角度讲,大家都看好AI,谁都不想落下,也可能会导致资本的杠杆作用失衡。

从人才价格的角度,如果说按照商业规律、经济规律的话,物以稀为贵,所以现在人才贵也正常但从这些人才短期内可创造的价值的角度看,恐怕是有泡沫,我个人判断会有回调的可能性。(完)

点击查看《AI英雄》专题,往期内容一步直击!

注:《AI英雄》专访隶属网易智能工作室,每周围绕人工智能领域讲述一个人物故事,洞察技术趋势,捕捉行业机会,关注人的价值。转载请注明出处,违者必究!

打开网易新闻,阅读体验更佳
大家都在看