前段时间的热播剧《长安十二时辰》里,由靖安司的八品主事徐宾发明的“大案牍术”可以说是长安城里最为先进的科技之一。近年来,大数据概念的普及使得人工智能越来越被人们所接受和认可。
达观数据做了如下统计:普通人一秒钟的阅读量大约是20~30个汉字,普通计算机一秒钟的文字处理量是一万字。也就是说一台普通电脑处理信息的能力,相对于人脑大约有500倍的效能提升。
“我们的工作是让计算机能够代替人来进行文字的自动化的阅读理解,分析写作等这些工作,能够让我们各行各业的从业者从繁重的文字处理工作当中解脱出来。”达观数据CEO陈运文言简意赅地介绍了自己的企业。
陈运文在复旦大学计算机系读完博士以后,先后在百度、盛大、腾讯等几家公司从事数据挖掘相关的技术工作。在百度负责搜索引擎的算法研发工作时,陈运文发现了一个很有意思的现象——每到年底,全国人民都在百度上搜年终总结,搜索量能够飙升到百度后台搜索量前十。
“这是一个非常惊人的数字,当时我们就想像年终总结写作这样的事情,能不能让计算机帮我们来完成初稿的写作?把我们要写的要点列出来,让计算机用特定的模式写成一个内容很丰富的文本。我当时觉得这个就是需求所在,我们未来能不能开发这样的系统,代替人工来完成这些枯燥的文字写作工作。”
直到2015年,陈运文开始创业,他直接把目标定在人本智能化的方向。让机器代替人做枯燥的工作,这是陈运文创业的初心,也是达观数据一直坚持的核心。
达观数据最早的融资金额是1000万,这让陈运文有足够的资金甩开手脚做技术研发。“我们是命运的幸运儿。”回忆起第一次融资经历,他这样说。
在过去的三年多时间里面,陈运文团队一点一滴地把最初的想法付诸实施,比如教计算机系统认识汉字、认识词、造句子,最后写文章。“2018年,我们参加了最高人民法院的司法裁判文书的自动化处理比赛。用达观提供的系统,代替法官去进行案件阅读,再根据法律法规条款,让计算机系统给出一个案件判罚的预测。越接近法院的判罚结果,系统的质量就越高。未来书面文字的阅读处理工作,像法官、律师、会计师、审计师、白领公务员等等,都可以逐步让计算机作为助手。”这是人工智能时代的大势所趋。
作为新兴的创业公司,达观数据的优势分三块:第一是数据,尤其是文字资料数据。第二是优秀的算法模型。第三是对每一个行业客户的理解。为全球企业提供技术服务、做出多语言文本,这也是大观数据的发展目标。
“千里马总会遇到伯乐。”陈运文经常这样与自己对话。创业之路必然披荆斩棘,然而这位年轻的CEO心里从未打过退堂鼓,“既然走上了这条路,就一定要走到终点,一定要到达我们心中的绿洲。”