近期,一项保护并传承阳江方言的人工智能科研项目在广东海洋大学阳江校区取得初步成果,该项目通过AI技术建立阳江方言识别模型,以应对互联网时代下面临的传承挑战,同时让搭载了阳江方言的AI更好地服务于阳江人的日常生活。

打开网易新闻 查看更多视频
阳江话AI助手将上线,海大博士团让“土话”变智能

记者了解到,目前由于在互联网背景下,方言保护面临诸多挑战,而阳江方言种类繁多,加上本地新生代在日常交流和学习中主要以普通话为主,这对阳江话的传承造成一定的不利影响。

打开网易新闻 查看更多图片

为应对这一挑战,去年下半年,广东海洋大学阳江校区计算机科学与工程学院教师邓超与校内其他4名博士组成科研团队,启动了阳江方言大模型系统研究课题。

打开网易新闻 查看更多图片

广东海洋大学阳江校区计算机科学与工程学院教师 邓超:

我2019年4月份来到阳江工作,在这个过程中我发现本人作为一个新阳江人,在日常的交流过程中,听不懂阳江话。还有,我团队成员有从小在阳江长大的,对阳江话他是有一定的情怀的,那么他作为一个学成归来的AI领域的博士,他也愿意用AI技术对阳江方言的保护传承,做一定的努力和贡献。

打开网易新闻 查看更多图片

邓超表示,开展该课题首先要采集大量的数据样本,对数据进行标注分类,接着对模型进行训练调参优化,让模型达到一定的准确度和识别率,并在这个过程中不断循环迭代,一旦模型达到应用的成熟度,将会在线部署模型,例如将其运用于智能客服的热线电话,进行实地的测试训练和迭代优化,并且不断调试,最终交付出产品级的应用系统。在研究中,数据采集和算力资源是项目难点。数据采集需要具有人群代表性,算力资源则依赖于大厂和运营商的支持。团队正在与华为等厂商协调,并得到我市相关部门的支持意向。

打开网易新闻 查看更多图片

同时,广东海洋大学阳江校区也在建设人工智能实验室,团队也将争取相应的资源支持。目前,团队已经收集了中文文字数据集上万条,音频数据已录制5000个词语、1000条句子。

打开网易新闻 查看更多图片

广东海洋大学阳江校区计算机科学与工程学院教师 邓超:

因为我们现在的人工智能技术,其实它就跟我们原来的发明蒸汽机、电力、互联网是一样的。它是一个通用型技术,其实它有一个特点是对行业所有的发展起到一个助推器、引擎作用的,我相信这个模型的上线,应该对阳江的社会发展和经济产业发展一定起到很大的助攻作用。

打开网易新闻 查看更多图片

科研团队表示,目前也做出了许多实用性设想,例如可以开发阳江方言智能助手,服务于本地政府12345热线服务、医疗及教育服务等,实现技术普惠;还可通过方言社交内容生成促进本土文化传播,增强阳江人的文化归属感;同时结合文旅产业开发方言文创IP等,为乡村振兴注入新动能,形成文化保护与区域经济发展的良性循环。

来源 | 阳江新闻

文字 | 李茵

摄像 | 陈伟良

编辑 | 刘帝森

审核 | 梁剑华 梁胜

终审 | 黄刘生

打开网易新闻 查看更多图片