打开网易新闻 查看更多图片

作为跨学科领域,人机交互已成为推动信息时代发展、将计算技术惠及大众的重要动力。本文在回顾当下人机交互领域进展的同时,探寻技术背后的思想演化路径,尝试阐述一个更为宏观地看待人机关系和未来创新的哲学认识,其中包括:简述人机交互的定位和贡献;从人机交互的历史分析当下技术现象的演化过程;通过理解人机之间的相克问题,提出“人机共协计算”理论,讨论人与技术的理想关系。基于以上认识,从学术思想、研究教育、人类社会影响、信息传播和产品技术5个方面提出建议,以期为未来人机交互和相关信息技术的发展提供一些方向性启发。

随着近年来数字化浪潮延展至人类生活的各个场景,人机交互(human-computer interaction,HCI)逐渐从一个陌生的专业名词潜移默化进入人们的视野,“交互”“体验”“设计”等词汇越来越普遍地成为技术报道的切入方式。用户对数字产品的使用评价也更多集中在对交互的直接感受,而非具体的技术参数或算法。当今社会,绝大多数人都可以随时随地使用智能手机,其中就包括各种人机交互理论和技术,从用户可见的窗口菜单系统(WIMP)到看不见的交互系统可用性和易用性设计等,人机交互与人类现代生活深深绑定。

本文通信作者自20世纪80年代末知晓人机界面(human interface)开始,至今仍身处人机交互领域,结合自身30多年的研究,希望借此文整体性综述本领域发展。但由于人机交互包罗万象、发展迅猛,甚至每个关键词都可作为一个研究热点和领域,在此描述具体的技术细节反而会对人机交互“只见树木不见森林”,所以本文试图通过探寻当下技术现象背后的人机交互思想演化路径,阐述一个更为宏观的人机交互和未来创新的哲学认识,重塑人机交互之于人类生存未来的问题意识,并基于此提出人机共协计算(human-engaged computing,HEC)理论和创新路径,以期为人类能力提升与可持续发展创造更多、更好的从0到1的技术形式,为学界和业界带来启发。

人机交互领域的定位和贡献

根据美国计算机协会(Association for Computing Machinery,ACM)的定义,人机交互是关于为用户如何使用计算资源而设计、实现和评估,以及解释交互系统周边现象的综合领域;交互设计基金会(Interaction Design Foundation)将人机交互描述为“一个关注于计算机技术的设计,特别是在人(用户)与计算机之间的交互方面的多学科研究领域”;而从计算机的冯·诺依曼结构来看,人机交互就是在展开理解到底什么是输入和输出。从直观生活经验来讲,人机交互体现在如何更简单、有效、愉快地将软件界面、计算机硬件等呈现给用户。从产业成果来讲,从早期图形用户界面、个人计算机等理念的实现,到引领移动化浪潮的多点触控、物联网、社交网络、扩张现实等具体交互技术形态的发展,人机交互如空气和水一样存在,是人类数字化生活的最直接推手之一。而相对于以上的狭义定义和具体例子,广义上计算作为今天的社会基础设施,人机交互所需探讨的也必然包括现实世界(人类整体)与虚拟世界(计算技术产生的数字空间)的相互关系。

从研究层面来讲,同聚焦于某一类专业知识的领域相比,从“人机交互”一词中就可见其广泛性和跨学科性——研究“人”“机”和“交互”。因为涉及到“人”,人机交互从早期设计计算机的人体工学因素出发,到1980年代初认知心理学、社会学和人类学等领域的陆续介入,再到当下与人文社会科学、哲学、医学、教育,甚至宗教研究的普遍交叉,关于“人”的领域多样性在人机交互研究中越来越丰富。即使一些工作在不冠有“人机交互”名称的核心会议或期刊上发表,但结合信息化这样一个世界性趋势,自然而然也存在共通性。例如,近年来面向老龄化、可持续发展等社会议题的设计,也都逐步成为了人机交互中的“显学”主题。此外,涉及到“机”,除了传统计算机科学、软件工程、电子工程之外,设计、材料、传媒、游戏等领域或媒介的加入也都成为研究人机交互的重要手法。最后,涉及到“交互”,除了通过结合前两者寻求设计,进而实施用户研究或实证实验等评估方法外,延伸探讨设计理念、广义的人与人工物(artifact)间的哲学关系等也成为重要议题。

尽管相比其他传统领域,人机交互仍相对年轻,但在一个信息化的社会中,几乎所有专业领域都可以和人机交互产生交集并提供看法,也能在技术语境里找到或扩大其意义。而在调和这种复杂的广泛性和跨学科性过程中,人机交互的独特视角和贡献也逐渐凸显:通过结合人文社会科学、哲学、医学等领域对人的理论性解释和计算领域的实践性技术,为改善人的存在状态和服务真实需求探索解决方案,帮助人通过计算技术认识自身、社会和自然。

从人机交互的历史发展来看,苹果、微软等各大信息与通信技术(ICT)公司的商业成功有相当权重建立在基于人机交互的研发和产品创新上。但首先要认识到,人机交互并不只是技术层面的问题,更是技术背后的观念价值问题。近年来,人机交互在国内外学术界和工业界得到了长足发展,但在思想观念、社会福祉、负面效应等方面仍需研究和探索。相比于国际上人机交互研究的普遍化,中国国内研发更多集中在头部高校和企业,其观念、思想、理论等还是以西方认识方法论为主。但正是由于国内科研人员同时面对西方认识经验与身处东方文化环境的冲击,实际上可以拥有更为全面的视角去理解人和技术的关系,进而反映在人机交互理论和技术上。

人机交互的历史演化及当下现象

总体来看,尽管人机交互的整体发展愈发迅猛,但不管是以图形用户界面(GUI)概念构建的主流人机交互体系,或近来生成式人工智能(generative artificial intelligence,GAI)对未来交互产生的影响,还是例如苹果公司初代扩张现实产品Vision Pro为行业所增添的预期,这些具体的技术现象和创新都需要被放在更深的背景下解释其为何演化至此。

从人机交互的历史演化过程来看(图1),其动力一方面来自于对人的深入认识而产生的应用方向,另一方面来自于关键性技术思想对平台性技术的推动,二者的结合构成了具体的交互式系统和研究。本文从人机交互的3个要素——“人”“机”和“交互”分别简述人机交互的思想演化和最近的交互研究成果。

图1 人机交互的历史演化过程

01

从人出发的范式迁移:人机交互的研究基础

从学界的角度来看,人机交互的历史发展大体可分为4次范式迁移,而范式迁移的核心并非从技术视角切入,更多来自于对人的渐进式认识(图1)。人机交互的第1次范式关注早期计算机的人体工学设计,这也呼应着当时整体学界以行为主义范式观察人类的倾向。1980年代初,强调人机信息处理相似性的认知心理学开始成为人机交互第2次范式的主导力量之一,并组织建立了国际会议(如CHI-The ACM Conference on Human Factors in Computing Systems,HCI International等),带动了其他人机交互或相关国际会议的陆续出现,包括世界华人华侨人机交互协会的年会Chinese CHI等。其中CHI作为ACM旗下第二大学术会议,也被视为人机交互领域的代表性国际会议。根据CHI 2024数据显示,在将近13000名投稿者中,来自中国的作者占比不低于13%,相比往届增长率超过80%,这也反映出人机交互在中国国内学界的意识发展。这一时期,“可用性”、“可触计算”(tangible computing)、“普适计算”(ubiquitous computing)等理念陆续被提出,社会学、人类学等学科的加入也使人们对人机交互的理解从单人单机向多人多机发展,孕育出“社会计算”(social computing)、“计算机支持的协同工作”(CSCW)等方向。

人机交互的第3次范式迁移发生在1990年代末,一方面受欧陆体系下的现象学影响,另一方面受人本主义心理学影响,在行为和认知之后开始讨论主观意义对人的重要性,“需求层次”(hierarchy of needs)、“具身交互”(embodied interaction)、“自然交互”(natural interaction)、“可供性”(affordance)、“情感计算”(affective computing)、“多模态交互”(multimodal interaction)、“用户体验”(user experience)、“无障碍设计”(accessibility)等概念陆续被人机交互引入或提出。第4次范式和当下进一步围绕人的内在和身份理解而持续展开,由此发展出基于积极心理学的“积极计算”(positive computing),面向解释诸如什么是“Well-being”,并引申至心理疗愈等具体课题;同时关注于社会思潮的“人文人机交互”(humanistic HCI),将人文思想和哲学批判方法引入交互理论,关注于为用户身份认同启蒙后的社会议题而设计,反思传统人机交互研究者视角(WEIRD-western,educated,industrialized,rich,democratic)所带来的偏差,延伸至更多身份群体上讨论交互问题:包括更倾向情感与共情的女性主义视角、智能适老化交互、面向失能群体的设计、社区与宗教的情感支持等,通过深入不同群体从而认识更加具体的人,真正从工学的、可用的交互向个性的、体验的理念方式发展。此外,此次范式由于同时受到认知神经科学及人工智能(artifical intelligence,AI)发展的影响,发展出“计算交互”(computational HCI),引入更具预测性的计算模型(computational model),与传统更具解释性的行为模型(behavioral model)互补。

在宏观背景上,以上4次范式也来自哲学意识、文化、社会、时代精神等诸多力量的推动(图1)。这些范式实际上都在尝试回答同一个问题,即根据当下的认识水平,哪些人类因素是第一性的或哪些至少从现象上观测是更加真实和科学的。由于人机交互的交叉定位,这些关于人的理解并不是割裂于其他领域的,也反映出整体学界在理解人的问题上的演化。越进一步理解,其内核就越可能倾向于不可用语言表达,而需更多基于个人的感性体会。联系到当下的交互技术和产品形态创新,一言以蔽之,人能意识到就可能做到,问题就在于,甚至人对自身也缺乏了解。所以,对人有一种怎样的认识和体会,实际上就为会出现什么样的产品提供一个基本前提;但另一方面,由于人长期将技术(甚至更广义的环境)视为一种客体与工具,却没有意识到自身思维和感受已被技术的操作或设计方式所限制,以致更多停留在技术消费者的视角上看待交互和技术的发展和价值。

02

关键性技术思想对人机交互的推动

当下以ChatGPT、MidJourney为代表的产业成果,包括了多模态大语言模型、人工智能生成内容(AIGC)、知识增强等技术和交互方式的实践,体现了GAI在自然语言处理、计算机视觉等方面的技术发展。而物理学、新材料等领域的技术突破,更多的技术可能性也将在人机交互领域中展开。例如,可穿戴领域“织物电子”等概念的提出,Neuralink的介入式脑机接口临床试验得到美国食品药品监督管理局(Food and Drug Administration,FDA)批准。

值得注意的是,虽然人们看到的是具体的技术或交互,实则是其底层关键性技术思想的延伸。这些关键性技术思想包括计算理论、物理理论及一些底层技术概念的突破,对人机交互、计算机科学,乃至整个社会层面都产生了非常重大的影响(图1)。而能否达成这种“关键性”,在于从基础研究、思想,到在线会议、购物这类平台性应用或技术的可复制性、自动化程度和兼容性等能否支撑一个大的生态,为新的交互方式创造场景和支持。回溯人机交互领域历史,无论是当下的深度神经网络,还是多点触控屏幕、万维网、图形用户界面、编程语言与软件、通信,乃至整个摩尔定律体系背后的这些关键性技术思想,都为人机交互的进一步发展提供了重要支持。

关键性技术思想并不是独立形成、突然出现或能够被明确定义的。结合2.1节人机交互领域对于人的理解,这些思想也都有一定的演化过程。例如,在万维网的诞生上,从约瑟夫·利克莱德(Joseph Licklider)提出人机共生到开发阿帕网,再到后来道格拉斯·恩格尔巴特(Douglas Engelbart)的超文本、互联网、社会计算之间的渊源;也包括类似于神经网络受到人类认知和生物学的启发等,思想观念与技术发展相互促进的复杂关系最终以某个现象节点来概括。总之,这些关键性技术思想及其衍生的各种技术对推动人机交互发展产生了巨大作用。这为具体技术的教育和研究提供了借鉴,即当多领域的思想相互发生作用,其爆发出的观念和技术潜力将远远大于单领域发展,这也是交叉学科、交叉研究院的建设意义所在。

03

创造交互式系统——人与技术的结合

如果说对人的认识演化拓宽了技术意义的广度,一代代关键性技术思想提高了技术的上限,那么透过人和机的发展变化,就推动了种种交互形式的出现(图1)。整体来看,当下人机交互领域的重要关键词集中在大模型和由苹果公司Vision Pro产品化为扩展现实所激发的预期上。沿用人机交互学者的总结,将最近的交互工作分为以下3类:旨在体现思想方法的理论概念、旨在设计系统方案的交互建构,以及旨在发现人类行为现象和交互属性的实证研究。

1)理论概念期待发展一种新愿景、新生态,涉及到对于整体发展思路的理解和解释,包括而不限于理论范式、原理、模型、概念、方法等,并期待以先进技术之力完成对某种理想科技生活的外向投射。在阶段性技术浪潮渐入瓶颈期后,理论概念的提出能够为业界提供一个方向选择,激发业界的预期和信心。但因此类概念很难在短期内完全实现,所以可能更考验其理念建构的系统性和合理性。最近的理论概念可关注以下3点。

(1)对于人机关系的上层认识。从2016年开始,学界陆续提出人机共协计算(human-engager computing)、人机统合(human-computer integration),到2020年以来相关思考进一步增多,包括人智合作(human-AI collaboration)、以人为本人工智能(human-centered AI)、以人为本机器学习(human-centered machine learning)、“AI亲友论”,以及工业界的有效加速主义、超级对齐等概念。在国际会议上关注人与技术关系的各类研讨会(如CHI 2017 Panel、CHI 2021 Panel等)几乎已成固定项目。从斯坦福大学成立以人为本人工智能研究院,到本文通信作者受邀参加由美国国家科学基金会(National Science Foundation,NSF)于2021年5月举办的“Human-Technology Interaction Workshop”、剑桥大学2023年成立的技术与人文研究所等,也可以看出这些上层认识对人机交互和人工智能发展路线的重大影响。虽然这些思想概念简单来看都可理解为某种以人为本的提案,同时也面向未来技术在数据、隐私、虚假信息等方面的潜在风险问题,但从深层次来讲,具体到如何理解人、人机交互及关系、解释视角和实现路径等,彼此可能存在着相当大的差异,且进一步涉及到之后不同的方法论。人机关系的理论思想对产品开发是一种持续性的影响,尽管当下可能与终端用户体感相距较远,但从观念自顶向下所产生的系统性形态,最终会产生新的交互范式。

(2)对于由计算机生成的虚拟空间的预期。伴随着可穿戴设备、机器人、通信技术、区块链等技术手段的成熟,如何以此重塑过去的交互体系必然成为理论概念的关注重点。由Web3.0/元宇宙、扩展现实、数字孪生等技术所组成的虚拟空间生态系统被持续讨论。

(3)方法(论)的扩展。学界从满足人类当下需求、以人为中心的“设计思维”“设计2.0”等方法,过渡到主动运用“以未来为中心”的设计构想(design fiction)、设计未来(design futuring)等方法(论)。这些方法通过推测和想象未来元素,创造具有未来特征的原型或场景来探索可能的发展,帮助人们思考和探讨技术、社会和文化的潜在影响、挑战和机遇。

总体而言,有关宏观交互概念的讨论促进着一个整体性人机交互哲学的建构,也可被视作当下时代精神对人类未来理想的一体多面投射。

2)方案建构旨在促进人们对基于计算机的交互式人工物、传统概念或任务流程的重新理解与数字化转型,又上升成为更加泛化的思想或原则,而非停留在设计本身。在当下人工智能浪潮中,更多传统交互也在经历新一轮的转变(车机座舱、智能家居、机器人等),并与教育、医疗、健康、设计等垂直领域方法相结合。最近的方案建构可关注以下2点。

(1)基于GAI的建构。AI智能体(AI agent)以其更为完整的信息获取和处理方式,作为人在“知”(intellect)能力层面上的补充,有望在未来以更完整的决策、规划和记忆机制结合传统应用,使人以更小的精力代价完成任务。而结合具身智能(embodied AI)、机器人等概念的相互补充,朝向最终愿景的类人智能体发展。此外,GAI/大语言模型对人机交互的影响是全方位的,包括以大模型生成可用交互研究数据、移动终端中应用大语言模型的对话式交互研究、可解释性人工智能(explainable AI)在增强现实和人机合作中的应用、多模态交互机器人等。

(2)围绕交互范式的建构。大模型、扩展现实、可穿戴等技术在交互场景与实现方面相互助力,也为交互范式从平面向空间转变加快节奏,体现出从设备为中心到以人的活动为中心的转换趋势。如合姿计算(heads-up computing)通过智能眼镜与手环的搭配,以及人工智能在语音、计算机视觉等方面的支持,解除设备范式对人身体位置的约束,实现日常活动无缝协同的系统性方案。

3)实证研究关注特定交互技术环境和属性干预下所呈现出的人类因素现象,并与大量其他领域,如心理学、社会学与文化研究等相交叉,是人机交互的可靠性基石。在此层面,人机交互的4次范式迁移所甄别出的人类因素都有可能成为评价技术与人之间相互作用的定性或定量指标。最近的实证研究可关注以下2点。

(1)跨领域结合上的人类表现。随着人工智能的普及,面对普通用户如何上手使用人工智能及其周边现象问题,人机交互研究者在自动化及可解释性人工智能方面展开工作,包括自动化人工智能在真实世界用户应用中的表现,用户对可解释性人工智能、具身化形象、数字孪生的体验反馈,以及GAI对人的行为影响等。对应到垂直领域,在精神健康方面的实践是近年来的关注重点之一,研究人员利用智能化多模态交互(如智能对话、生成式绘画等),结合疗愈方法的流程及领域知识(如叙事疗愈、认知行为疗法等),能够更高效地探查、预测目标用户精神状态,为精神困扰乃至孤独症等群体带来普惠关怀。此外,随着硬件技术与游戏交互技术的发展与应用,近年来基于心理学、认知科学和脑科学等领域开发的“数字药物”(digital medicine)得到了广泛关注与急速发展,如改善老年认知健康的虚拟现实严肃游戏,以及基于移动设备的注意力改善数字冥想应用等。

(2)对基础交互属性的探索。当下人机交互基础研究(如虚拟环境中的目标选择、目标操作、环境导航等基础任务)开始倾向与人工智能领域(机器学习方法等)相结合,如最新Apple Watch的手势检测等;包括建立进一步的多模态行为模型,去匹配、预测高效合适的人类行为与感知体验。而在基础交互硬件设计上,从静电力反馈笔式交互,到热驱动液晶弹性体纤维、可持续气动计算系统、流体形变触觉显示器等研究可以看出,伴随着新材料创新所展开的交互可能性在未来可穿戴触觉反馈、可持续计算系统设计、可形变触摸屏等场景都有很好的应用前景,探索构建更加符合于人“身”(biophysics)的特征和场景的输入输出方法。

人机交互技术可预见地越来越多地融入人们的生活空间。随着不断反思过往交互中的观念和技术局限,更具突破性的技术潜力和产品形态有待释放。然而如何迈出面向“身”与“知”设计的下一步,从现象中看到对于技术背后的潜意识及问题,进一步认识人和人类社会在技术影响下的变化,是需要深入讨论的问题。

04

人机交互的新挑战与价值方向

从人机交互的历史演化到为当下社会带来的技术成果,发展背后的价值方向驱动着知识成为看似中立的技术实践,实则决定了人机交互的本质意义。然而,在当今社会强大的计算技术支撑背后,一些人直观感知到,而更多人甚至没有意识到因技术所加剧的不平等、电子成瘾、网络暴力、注意力衰退等问题。广泛又无数的交互对人意味着什么:工具、消费或是一种消遣?结合当下信息过载而非匮乏、应用外在体验的边际效应递减、人工智能对人类智能的潜在替代等问题,技术之于人类物理性和精神性的生存扮演一个什么样的角色?

在计算机发展的早期,领域先驱们就有过对技术价值判断的思考,以约翰·麦卡锡(John McCarthy)等学者所主导的“人工智能”和恩格尔巴特等学者所提出的“提升人类智能”(intelligence augmentation,IA,也就是现在的HCI)就在关于人与技术的理想关系上给予了不同的期待,分化出人工智能和HCI 2条历史演化路径(图2)。基于图灵机模型的成功,人工智能一派尝试进一步理解人的认知系统,从而通过数理逻辑形式化“造人”的愿景,以机器智能解决现实问题,也可以说是今天生成式人工智能,乃至数字永生的思想前提。而提升人类智能一派则以如何通过计算机提升人类自身能力和集体智慧为使命,构建出如今所看到的计算机原型,包括鼠标、图形用户界面及许多专业软件的早期设想,以及后来个人计算、移动计算等理念的开启,成为人机交互领域的奠基石,也加速了计算机普及到每个人的过程。

打开网易新闻 查看更多图片

图2 人工智能(AI)与人机交互(HCI)的历史发展关系

当人工智能发展到今天,新的担忧也随之而来,例如,“奇点”何时发生或人类被人工智能所控制等观点,加上当下世界林林总总的问题,人类仍需不断为自身规划新的价值意义。面对这些挑战,恩格尔巴特给予通信作者的赠言“Let's focus our HCI attention on increasing human capabilities to develop,integrate and understand the knowledge required for improving society's survival probability.”(让我们将人机交互的注意力着眼于提升人类能力上,去开发、整合及理解为改善社会生存概率所需的知识),似乎可以为打开超越技术性争论的新视角提供线索,即从造福人类、提升人类生存概率的本质上思考人类和技术的关系和未来方向。为此,希望人工智能和人机交互两者携手走出“此起彼伏”的历史阶段,以更加统一的解释方式来看整个人机关系及衍生问题,为各个方向的相互合作探寻共同目标,进而探寻超越方向。这也是人机共协计算的出发点所在。

人机共协计算——

面向人与技术的理想关系

基于对以上问题的思考,人机共协计算旨在建立一套清晰且系统性的思想理论框架去思考人与技术的理想关系,进一步探索未来人机交互的研究和价值。通过认识基于西方思维的围绕人的“身”和“知”层面在科技研发上的意义和局限,将东方思想中对“心”(xin)的思考引入人机交互技术、ICT设计,以求对人类的能力和需求、未来计算机的可能形态、人与技术的理想关系有进一步理解。人机共协计算思想不仅期待促进形成人机交互的第5次范式转变,更在于思考如何用超越的技术观念提升人类的心智能力,完善人的整体性,进而促进人类生存的可持续发展,而非被人工智能替代人的存在意义。

人机共协计算理论框架提出了5个主要概念成分(图3):相克态(antibiosis)、共协用户(engaged human)、共协态(engagement)、共协交互(synergized interaction)、共协计算机(engaging computers)。

图3 人机共协计算示意

人机共协计算首先确定问题意识所在——相克态,将传统人机交互研发所忽略的对人类能力的负面影响纳入问题范畴。总体来看,人机交互通过关注人的生理性“身”的层面去解决信息获取的带宽和体验问题,又通过计算重新理解某一具体事物的“知”的层面帮助构建人类知识库。然而,对这2个层面的过度工具理性——推崇高效、愉悦服务于“身”最终演变出孕育诸如成瘾、网暴极化、虚假消息的注意力流量经济(信息流过载、虚假消息传播等),而对“知”的扭曲则强化了隐私问题、信息茧房、身份认同的混乱与消费主义等问题。用户在高度的信息服务中看似主动,实则被动接受着标签化塑造,名实不符下导致个人和社会幸福感的偏失也就不足为奇。对这些问题的关注当然不止人机交互,但交互设计却是为这些问题的产生和放大营造了一个结构性的技术干预和环境前提。相克态本质上反映了业界对人不完整的认识和由此而来的异化,其所指射的本质并不是人的个别现象,而是因人在自然人的“身”与理性人的“知”这2种人类的“元能力”上的高度不自觉,它们暴露于各种交互乃至社会干预后的一体多面投射。而相克态的产生可能在相当微妙的粒度(如对用户念头产生的影响)上就已经展开了,而不是非要违背成文的伦理限制。

为应对相克态,人机共协计算提出共协用户概念,从思想史的演化中寻求对于更完整的人的理解,并不可回避地落脚在东西方思想的异同上。参考历史学家余英时“外向超越”与“内向超越”的总结,如果说对传统人机交互“身”和“知”的探索来自西方式的外向延伸式超越,东方式的内向超越则在于如何寻找那个剥离掉外在物质、身体、念头和情绪等后所保留的高度抽象的第3种“元能力”——“心”(xin)(图4),将其视为人的真正主体,并作为道德、思想和行为等基本概念的正当性来源。展开解释“心”(xin)的定义、范畴及优缺点等已超出本文的目的和范围。简略来说,本文从东方思想(尤其从儒释道思想及其产生背景,历史、社会文化及语言演化等视角)所理解的“心”(xin)和西方哲学、心理学以及认知科学的“心”(mind)及其所涵盖的情感(affect)和情绪(emotion)存在不同,其主要差异来自于东方对超越语言的人原初状态的内向体会和知行高度统一性的追求和西方以柏拉图理性论为基础的唯理论/经验论的外向分析,故选择用“心”(xin)来表达。共协用户意在通过研究“心”(xin),从而为技术探索新的超越性方向,而这是传统西方人机交互范式下所忽略的重要人类经验。尽管东方对“心”(xin)的解释并不能单纯从现象学、心理学或精神分析体系下展开,但“心”(xin)或与此相关概念的理论位置却逐渐升高(如社会学对“原初状态”的描述和冥想乃至“心理健康”背后的哲学意义等)。进一步来说,“心”(xin)反映的是人超越性的一面,在外在不断强调“身”和“知”的现实性下,人如何以自身能力从那些外在的负面影响中再回归到一个高度自觉的意识——从“身”的看山是山,到“知”的看山不是山,最后回归到“心”(xin)的看山还是山。作为具体的设计方向,希望将对正念、审美、共情等软能力(soft skills)的理解融入日常交互中。这些软能力的重要特性在于其拥有无法否定的以人作为发展目的的一面,而非仅是手段,这也是区别于人工智能的、人类存在的重要意义,而我们所提倡的共协态则反映了人在交互中的高度心灵体验。“身”(biophysics)、“知”(intellect)、“心”(xin)三者共同构成了对于共协用户的建模,也是对人的完整性的一种理解:既要从这三者出发看到对于同一交互概念的不同面向解释,又要在最终设计中调和这3种解释,不忽略人的任何一面,并最终融为一体。结合东方的整体性思想,面对从当下到未来的技术世界,技术对人的影响会贯穿人的一生而非仅其工具层面意义,这种对人的完整性和存在质量的理解也由此需具备从“局部使用体验”过渡到“整个生命体验”的终极关怀。

图4 在“心”(xin)的语境下,结合“身”与“知”,思考共协计算机形 态

共协交互代表了对实现共协用户概念的价值方向,即人(或人类)和技术(包括人工智能等任何交互式技术、广义人工物或任何由技术产生的虚拟空间)之间达到“中庸”式的动态平衡,达到共同提升的结果。人的全面提升——不仅是身体的强健、感官的敏锐或是知识建构的体系化,而且是在“心”(xin)的本质层面找到安定和原则,突破“有限身体”与“无限知识”的局限与束缚,最终达成外向超越(为“知”与“身”设计的现实需求)和内向超越(为“心”而设计)的中庸结合。通过探索人自身的超越性和能动性,我们希望为走出“技术双刃剑”的困境寻求一种方式。从“心”(xin)的角度反思,会发现“慢”相对“快”等传统评价体系同样有意义。工业时代以来的评价标准只是一种方便之法,尤其在业界习惯性向下兼容“人性”的问题上。结合近年经常提到的“科技向善”,可能只有通过意识和激发人“心”(xin)性善层面的超越性,才能确保技术越发达越不会被滥用,产生更多从0到1的创新。

最后,能够与人共协交互、提升,乃至超越的共协计算机(计算机只是一个代词,包括不限于结合任何一种信息交互技术或人工物)应具备一种怎样的形态?计算机区别于过往机器的本质在于软件的诞生,而在过去50年,软件形态仍主要依托于桌面隐喻(desktop metaphor)体系中。桌面隐喻本质上符合了认知范式所理解的人与计算机信息处理逻辑上的相似性,并选择将贴近人现实生活的各种事物符号化达到易用目的。但这并非唯一答案,从桌面隐喻,乃至对其他数字内容的体验中,人们可能也意识到使用习惯和偏好实际上又反向塑造了自身,人对世界的理解方式和技术形态如何,很可能是人类能力外在表现的一体两面。而如果说当下火热的种种技术形态(人工智能、扩展现实、元宇宙等)及其他宏观概念代表了人类对未来理想的一种外向投射,那么共协计算机的基础就是对“心”(xin)的结构及其与“身”“知”关系的体会和内向投射,而人们日常所经验的时间、空间,以及各种符号的表达都会需要一个新的(但可能是很朴素的)诠释方式,此处值得一提的是本·施奈德曼(Ben Shneiderman)提出的以人为本人工智能,其强调“机器智能不能取代人类智能、创造力与责任”。这一观点与人机共协计算相似,但其以人为本的基本立场来自西方的经验主义传统。参照余英时的归纳,经验主义仍归属于一种外向超越的思考方式。共协计算机的本质贡献在于,如果用户自身难以克服瓶颈问题,那就尝试创造一种每个人都能接触到的环境,潜移默化地帮助用户回归人应有的感受结构,提升观念意识,隐喻心的空间,使现实世界和虚拟世界也能实现一种共协发展。这是人机共协计算对下一阶段“计算机”(及任何交互式人工物)、科技范式超越的思考。

面向未来人机交互的发展思考

人机共协计算的精神实质在于如何从人类思想根基上看待技术的发展和局限,尤其在引入东方思想视角后,从人的终极生存语境上思考交互问题(特别联系到人与交互式技术高度连接的当下和未来),探索为人的超越性而设计,并进一步延伸至思考广义的人与技术、人工物、他人、社会和自然的理想共协关系。结合人机共协计算的视角,为人机交互的未来发展提供若干思考。

1)学术思想层面,多领域共建理论框架,重塑评价体系。(1)人机交互的独特视角脱胎于不同领域和思想的交叉,但面对日益增长的理论、知识和技术,应反思这些研究视角,以及随之而来的各种数字方案背后希望达到的大目标是什么,而非止于离散性的交叉或协同,这也关系到价值问题。人机交互的领域交叉背后应致力于整合、建构并更新一个关于人的共识模型,将偏向具体的交互研究建立在这样一个基础上,本身也是技术研发的前提。尤其考虑到面对技术瓶颈期和过往技术过快发展所带来的历史遗留问题,人机交互也应存在一个从“为学日益”到“为道日损”的周期性统合和标准化阶段,而从中可能找到更健康的发展灵感。(2)由于过往价值目标的模糊性,导致人机交互的主流评价体系仍局限在工业时代的性能维度中,受限于“好用”“快速”“高效”“愉悦”“满意度”等标准。而其造成的问题在于,现实世界不像虚拟世界一样可以无限延伸和轻易改变,但这种评价体系却强烈影响着现实世界的人的观感,从而导致看似“无缝”,实则幻想与现实之间的巨大脱节。人机交互需要建立一套更加中庸的方式去调和现实世界和虚拟世界的优势和局限。针对以上2个大问题,人机共协计算是一个基础选项,但更加完整的顶层架构需要多领域学者的共同努力。

2)研究教育层面,把握概念本质,注重人文精神。人机交互研究与教育并非单靠技术、逻辑、公式传递,而其中相当一部分概念涉及到对更深层次背景的思想把握。最明显的例子可能就是“用户体验”和“以人为中心”,尤其对缺少西方经验论、现象学、实用主义等思想基础的研究者和学习者来说,单纯根据概念描述很容易将其窄化为情绪感受或与自然对立的人类中心主义(anthropocentrism),而忽视背后的理论建构,乃至不能用语言或量化表达的本意。这进一步又联系到人机交互的定位。人机交互设计并非传统单纯面向硬件或实体的理工类设计,它会很大程度影响人外在和内在的生活方式。站在多领域交叉点上,如果没有对人文精神(而非教条)的基本敬畏,人机交互乃至广义的技术创新一定会陷入瓶颈。因为这些精神本质上首先同理于人的普遍问题和价值,而非将人作为一种想象中的符号看待,这也是解释并进一步解决人类需求、探索出创新空间的基础,同样也是理解人机共协计算的前提。基于人机交互在跨学科领域交叉和融合中所体现的重要位置,期待有更多关于人机关系、人机共协的学科、学院或研究院的建立。

3)人类社会影响层面,以交互建设社会软环境,提升人类能力。人机共协计算提倡计算系统乃至未来更多先进技术的设计,不能只围绕自然人“身”和理性人“知”的面向,因为如果没有对冲的力量去探寻人的完整性,无处不在的数字环境将无意识地促进人类欲望和工具理性的极化,并逐渐解构社会凝聚和道德价值体系,构成人类生存危机。尤其考虑到人工智能对传统交互“知”的层面的进一步放大,这也是从社会意义上讨论面向超越人“心”(xin)的设计的必要性。在此背景下,计算系统可作为相对于现实世界的结构性软环境,通过建立一个“心”(xin)的平台性隐喻,使人能够在日常交互中潜移默化地提升其感知和观念能力的下限。结合学术思想层面的目标和评价体系,当下的计算表现形式有可能从硬件、日常应用到操作系统等各方面找到新的解释方向,但更重要在于通过建立一个面向人类能力提升的、可持续发展的环境,与现实世界相互带动、共协发展。

4)信息传播层面,“知”的体系搭建和超越“知”的高度自觉。人机交互领域一直以来关注信息效率,但需考虑信息到达人后又发生了什么。一方面,借助作为外化知识库的计算系统,人类如何获取知识在当下实则不构成瓶颈,瓶颈在于人身边的信息更多以碎片化经验的方式存在,而缺乏被人组织内化成为思维的条件。结合上一条创建结构性环境,进一步构建“知”的载体和传播是面向人的超越性的重要步骤,至少也能通过提升人的信息素养去缓解电子成瘾和网络暴力等问题。另一方面,“知”也并非最终目的,而是面向发展出高度自觉的“心”(xin)的一种工具——不被思维框架所束缚,也能去还原经验所带来的真实感受。总之,在“心”(xin)的语境下面向人类能力的提升和超越,为人类创造、传播、接收、内化信息的整个周期设计新的交互方向。

5)产品技术层面,回归价值体系,寻找创新可能。随着新一轮技术浪潮逐渐覆盖到日常事物的各个角落,无论是体验还是效率,边际效应递减的趋势都愈发明显。如果人机交互将其注意力都放在局部细节优化上,自然也无法延展成支柱型平台;而执着以流量为主的注意力经济背后实则也付出了大量被忽略的社会代价。无论是日常应用还是操作系统级别的交互建构,本质上都是以计算为媒介的研发者的价值体系和世界观的反映和延伸。对于人机交互研究者来说,创新的核心首先在于其对人自身的体会和理想是怎样的,进而以“心”(xin)体会需求的正当性,避免落入“为技术而技术”的陷阱。反思这些问题,会发现长久以来,国内对于人机交互产业的思考和创新仍然过于被动。如果向上追溯,可能最表层在于缺乏类似于苹果、微软等公司因设计和交互所取得的商业成功与信心,进一步地,缺乏对交互的系统和前瞻思考,而这些讨论又潜移默化继承于领域先驱者们,例如恩格尔巴特、艾伦·凯(Alan Kay)等在计算领域发展早期积累的大量整体性上层思想但却在传播过程中逐渐被技术细节讨论所掩盖)。再进一步联系到西方外向性的思想传统、个人计算机等成果诞生背后的跨领域交叉和社会文化时代浪潮,这其中很多并不直接是技术问题,而是观念刺激了某些底层技术的诞生。但即便如此,国内的人机交互仍然有很大的发展空间,因为正是在调和当下所处时代、文化环境、世界观间冲突的同时,认识东西方思想因历史、地理、文化等经验因素所造成的差异、意义和局限,在技术现象之外认识到人的真正需求和问题。通过对“心”(xin)这一元能力的理解,去探索一种新的设计方向,例如,可持续发展/交互是什么:其不光是外向性的,因种种原因所激起的对于环境保护的看法,而是一个人真正意识到向外索求并非心的本质,在超越“身”和“知”的能力之外,发展出高度自觉的克制,而这也同理于当今如何面对强大技术所做的方向选择。

结论

当人工智能的崛起成为一种发展现象,Web3.0、脑机接口、量子计算机等技术也正在纷至沓来,人类会从硬核技术的外向延伸中受益;但另一方面,近年来自经济学、神经科学、脑科学等领域的研究也显示了技术给人类带来的诸多负面影响。由此看未来,单纯以技术为指向的发展对人类和社会的影响实则难以评估,所以人机共协计算倡导未来的人机交互通过认识全面的人,并以提升其能力,特别是提升“心”(xin)的能力为轴心发展共协技术,向内通向人的自身福祉,向外寻找更健康的技术设计模式,由人的提升进而激发社会能力。在将人机交互回归到面向个人、集体、社会、超大社会的内求和外求、礼与法、超越与现实之间高度复杂的中庸平衡问题后,将产生对于基础理论和应用研究的巨大需求,这不仅需要本领域研究者的自身体会,也需更多其他领域、产学研的加入和共同建构。当下的信息技术发展带动了人类文明的巨大进步,但仍可有更好的交互形态,并减少各方面代价。而计算系统作为观念系统的投射,只有人,尤其是技术研发者的自身超越才能带动科技范式的超越,帮助更多人不被技术和环境所困。人机共协计算期待以上视角能够为人机交互的未来,乃至包括人工智能在内的整体技术方向的思考带来一些启发。

作者简介:王晨,高知工科大学信息学院,世界华人华侨人机交互协会,博士研究生,研究方向为人机共协计算;任向实(通信作者),高知工科大学信息学院,世界华人华侨人机交互协会,教授,研究方向为人机交互和人机共协计算。

原文发表于《科技导报》2024年第8期,欢迎订阅查看。

内容为【科技导报】公众号原创,欢迎转载
白名单回复后台「转载」

锂资源全球治理体系历史演变、现实困境与中国参与策略 | 科技导报

《科技导报》创刊于1980年,中国科协学术会刊,主要刊登科学前沿和技术热点领域突破性的成果报道、权威性的科学评论、引领性的高端综述,发表促进经济社会发展、完善科技管理、优化科研环境、培育科学文化、促进科技创新和科技成果转化的决策咨询建议。常设栏目有院士卷首语、智库观点、科技评论、热点专题、综述、论文、学术聚焦、科学人文等。