打开网易新闻 查看更多图片

【网易智能讯 8月1日消息】不要怀疑:机器学习是当下的热点,而且会越来越热。

在过去的两年里,公众对构建复杂算法的兴趣不断增长,这些算法可以自动“学习”和改进自己的操作,或者是亲身体验(而不是直接编程)。我们可以称之为“人工智能”或(更好的)“机器学习”。事实上,这类工作已经进行了几十年。(例如,人工智能发展协会在1979年就成立了,一些人将这些想法追溯到古希腊,或者至少是在可编程数字计算机的早期阶段。)

最近,投资者Shivon Zilis和Bloomberg Beta一直在列举一个清单,来显示机器学习在其他行业领域中的应用。教育就是这个清单的内容之一。一些技术专家担心其风险。例如,正如 New Yorker所写的那样,Elon Musk对其的预测一直持悲观态度。他在过去的一周中与持乐观态度的Mark Zuckerberg进行了激烈的争论。

尽管如此,投资者仍在加速前进:本周,中国创业公司英语流利说利用机器学习算法向4500万名中国学生教授英语,并筹集了1亿美元的资金来加速其工作。

为了探究机器学习在教育中可能意味着什么,EdSurge在旧金山与Adam Blum(OpenEd的首席执行官)、Armen Pischdotchian(IBM Watson的一位技术导师)、Kathy Benemann(EruditeAI的首席执行官)和Kirill Kireyev(instaGrok 的创始人,TextGenome 和GYANT的技术主管)一起举行了一次会谈,EdSurge的Tony Wan主持了会议。

以下是谈话的几段摘录:

EdSurge:人工智能一直以来都承诺要改变下一代的教育方式。这种改变多久才能实现?现在有什么不同?

Benemann: 现在的数据比以往任何时候都多。对我们EruditeAI来说,数据比收入更宝贵。有了更好的数据,我们就能更好地训练算法。但要记住的重要一点是,人工智能的制造者最终是我们人类。

Pischdotchian:如果你回想一下你早年的教育模式,我们称之为“工厂模式”。老师对所有学生教授一样的内容。这不是我们今天要讨论的问题。像Chan Zuckerberg Initiative这样的公司组织正在寻求彻底改变这种模式。学习不能再按照工厂模式继续进行下去了。这种方法是不可持续的。对于如今的孩子来说,在我们称之为“New Collar”的工作中,产业需要什么?

Kireyev:我们看到教育内容出现了爆炸式增长——无论是关于学生的数据还是来自学生的数据。我们可以看到学生们在做什么,速度比过去要快得多。例如,当孩子们在Scratch上学习时,他们的学习是基于网络的:你可以看到他们开始看视频的时间,停止的时间和他们感到无聊的时候。你可以更多地了解他们的行为。透明的数据收集是非常宝贵的。而且,这种技术还有更大的实用性——你可以直接用这个数据盒子里的内容。所以越来越多的人尝试用人工智能和机器学习来做事情。

好吧,我们已经听说了数据爆炸和改变学校模式的必要性。还有什么要讨论的?

Blum: 有两大趋势正在发生——而我们才刚刚开始。我们与IMS全球学习联盟合作。某些技术标准,如卡尺和xAPI(或经验API)正在起步。其次,包括教育的很多领域,你都没有长期的数据。所以,如果你想为一个学生选出下一个最好的问题,你必须使用一种不同的方法,这种方法称作“强化学习”。所以,如果我没有一百万个数据记录,我可以一边工作一边探索。这就是谷歌解决阿尔法Go挑战的方式。

我们在教育中看到的人工智能应用是什么?我们已经在使用它了吗?

Pischdotchian:这是关于在学习经验中寻找模式的问题。我们可以注意到,如果一个人的数学能力更强,系统该如何识别挑战并向老师开放,从而更好地辅导学生?关于这一方面,IBM正在与芝麻街合作——这一合作将大学作为机器学习发展的试验田。这对老师们也有益:我们在麻省理工学院举办了一场黑客马拉松,所有的教室都装有摄像头(学生们都知道)。如果一位教授正在讲课,而他却不抬头看看是否有一半的学生睡着了,我们可以用面部识别系统来描述学生的情绪(比如无聊),然后给教授发一条信息。

Benemann: 无论你看向何处,人们都在问教育(或其他东西)什么方面可以为人工智能所改变。这在教室里是什么样子的?它能让学生的一天都自由吗?人工智能会取代教师吗?人工智能会帮助老师腾出时间,让他们成为学生的“导师”吗?适应性平台(如ALEKS或Knewton)能够帮助学生了解事实,并让老师们能够指导他们吗?

这是否意味着,如果没有人工智能,市场上的“适应性”技术其实不具备适应能力呢?

Benemann:这是一个光谱。有些工具是具备适应能力的,但它们说自己是“人工智能”,但我们还有很长的路要走。

Kireyev:Instagrok是一个视觉搜索引擎。我们用机器学习来识别重要的事实和概念,然后让学生去学习有关任何方向的内容。他们可以合成它并组织它。TextGeonome是另一个项目。我们正在建立基础设施,来进一步开发以人工智能为基础的词汇。我们的问题是:考虑到学生和年级的水平,他们接下来要学的单词是什么?

Blum: 在ACT(已经收购OpenEd),我们关注的问题是:如果你已经发现了学习差距,什么是帮助学生最好的教学材料?我们想提供给你的不仅仅是ACT的材料,还有我们能够找到的最好的教学资源。我们用机器学习来精确定位。

在某些领域,如果你不使用机器学习预测模型,你就会再次错过这些资源。以大学招生办公室为例。

当你从统计评估模型转换到深度机器学习[涉及神经网络]时,无法跟上发展速度的是“解释能力”。你可能有一个无法解释的神经网络。所以当预测算法变得更好时和当你进入多层神经网络时,一个关键的挑战是解释能力就会下降。在一些受到严格监管的市场——比如教育和医疗——需要研发更多的解释性工具。

假设你在一所很大的大学里:他们使用统计模型来挑选即将进入的班级。现在,假设你有一个神经网络或者一些机器学习程序,便能更好地预测学生的结果。当然,也有大学这样做。他们不会谈论此事,因为风险太大了。但你可以确定,他们是在用机器学习来挑选即将到来的课程。我们需要某种总结工具来解释这些选择。尽管深度学习是复杂的,为了让这一点得以讨论和接受,我们还是要提出一些重要的解释因素:他们是如何做到的?

人们担心“人工智能”这样的词汇是否会成为销售产品的标签。假设我是一名教师,一家教育科技公司说:“我的数学工具是由人工智能支持的。”我应该问什么?

Blum:这个问题与发现能力和解释能力有关。如果你要打上人工智能标签,那么我想知道更多的内容:你是在说受到监督的符号系统吗?还是自然语言处理?如果你只说“人工智能”,没有再提到其他的,那就降低了你的可信度。如果你使用了人工智能标签,它就会邀请你进行一次关于它背后的对话。

Benemann: 供应商应该谈谈学生的学习成果和教师实践。而不是谈论人工智能。这只是让学生学习和老师实践的另一种方式。你最好了解这个领域然后说:因为你用这个产品,我可以做一个案例研究,表明效率得到了提高,在课堂上浪费的时间也更少。

在保护敏感学生数据的隐私和安全的同时,如何平衡人工智能工具对数据的需求?

Blum:我们处在一个没有PII(个人身份信息)的时代。如果你有足够的知识,你就可以结构这个人。因此,我们需要制定行业标准。如果我们说,“这是允许你收集和分享的东西”,这将会改善教育研究开发人员的工作。我提出的一点是,有必要对隐私制定更好的标准,这样就没有人会因为遵守这些标准而被起诉。

Benemann:谁拥有这些数据?看看医疗保健。这是一个零散的市场,但有一种趋势是,患者拥有越来越多的数据。我想知道我们是否能接触学生们的数据,而这取决于他们(学生和他们的父母)的回答,“是的,你们可以通过学校接触。”

工作自动化是许多人所担心的一个威胁。这会对教师和其他职业产生怎样的影响?

Kireyev: 我看到老师的角色在发生奇妙的变化。领导能力,引导…我对这些从老师身上学到的东西感到兴奋。然后,越来越多的老师开始更深入地与孩子们一起学习,而不仅仅是解释怎样解开方程式。

Blum: 一直在努力为职业技术制定学习目标。但它没有得到充分利用。我们需要更进一步地思考。10年后成为卡车司机意味着什么?这将如何影响整个行业的供应链?我们要努力改善职业教育。

Pischdotchian: 因此我们要强调STEAM(科学、技术、工程、艺术和数学)的重要性,而不仅仅是STEM(科学,技术,工程和数学)的重要性。大脑的右侧思维能力——比如艺术、创造力、心理学,不再是分析能力和数学能力——将变得更加重要。心理学。历史。辩论课。幽默和戏剧。至少在我们的有生之年,这些方面(对人工智能来说是可以接受的)是很重要的。

人工智能擅长于让某些事情变得简单,但这也是令人担忧的。对事情认真思考对我们来说并不是自然而然的事。成长和舒适是不能共存的。

【英文来源:Edsurge 作者:Tony Wan 编译:网易见外智能编译平台 审校:Simone】