知识图谱和认知图谱之发展

知识图谱是由谷歌（Google）公司在2012年提出来的一个新的概念。本质上是语义网的知识库。知识图谱由节点和边组成，节点表示实体，边表示实体与实体之间的关系，这是最直观、最易于理解的知识表示和实现知识推理的框架，也奠定了现代问答系统的基础。从20世纪80年代的知识库与推理机，到21世纪初的语义网络和本体论，其核心是早期版本的知识图谱，要么侧重知识表示，要么侧重知识推理，但一直苦于规模小、应用场景不清楚而发展缓慢。2012年，谷歌发布的570亿实体的大规模知识图谱彻底改变了这一现状；同时，深度学习技术的发展也推波助澜，掀起了知识图谱领域研究的新热潮，特别是以Trans为代表的知识图谱嵌入，以及使用大型知识图谱增强其他应用，如推荐系统、情感分析等。
然而，当知识图谱在诸多应用中取得成功的同时，其方法论始终笼罩着几朵“乌云”，如歧义问题、链接困难、关系的冗余与组合爆炸等。虽然针对这些问题的一些修补工作取得了不错的效果，但是想要真正解决这些问题，或许需要在深度学习时代重新考虑知识表示的框架与方法论，因此，认知图谱应运而生。
认知图谱可以被解释为“基于原始文本数据，针对特定问题情境，使用强大的机器学习模型动态构建的，节点带有上下文语义信息的知识图谱”。认知图谱的应用框架遵循认知心理学中的“双过程理论”（dual process theory），系统1负责经验性的直觉判断，这一黑盒过程提取重要信息，并动态构建认知图谱；系统2则在图上进行关系推理，由于认知图谱保留了实体节点上语义信息的隐表示，所以在符号逻辑之外，比如图神经网络等深度学习模型也可以大显身手。
1. 早期知识图谱与逻辑推理
知识图谱的理论发源于20世纪下半叶的人工智能热潮中，多组研究者独立地提出相似的理论。它脱胎于众多著名认知心理学家提出的语义网络（semantic networks）理论，最为著名的有Sowa等人在1984年提出的ConceptNet。在符号主义的思潮中，许多早期知识图谱将关系局限为几种特殊的基本关系，如“拥有属性”“导致”“属于”等，并定义一系列在图谱上推理的规则，期望通过逻辑推理实现智能。
2. 大规模知识图谱
2012年发布的谷歌知识图谱再次将这个领域带入聚光灯下，然而，构建庞大而高质量的知识图谱并不容易。Freebase是谷歌知识图谱的前身，它整合了包括许多私人维基在内的大量网络资源。另一个常用的知识图谱是DBpedia，它从维基百科中抽取结构化的知识再进行本体的构建。通过结构化,用户可以使用SPARQL语言进行查询。YAGO也是开源知识图谱，被应用于IBM Waston问答系统。
NELL是卡耐基梅隆大学教授汤姆·米切尔（Tom Mitchell）带领开展的知识自动学习。NELL项目开启了一个机器学习实现知识图谱构建的浪潮，目标是持续不断地从网络上获取资源并进行事实发现、规则总结等，里面涉及到命名实体识别同名消歧、规则归纳等关键技术。
ArnetMiner是清华大学知识工程实验室构建的面向科技领域的知识图谱，项目实现了高精度学者画像、同名消歧、智能推荐、趋势分析等关键技术。该工作获得了ACM SIGKDD的时间检验论文奖（Test-of-Time Award）。

3. 深度学习时代的知识图谱
深度学习时代的知识图谱拥有大量的实体和关系，然而大量不同的关系上很难定义逻辑规则，在知识图谱上“推理”也转入黑盒模型预测的范式。Bordes等人叫的知识库结构嵌入和Socher等人的Neural Tensor Network（NTN）率先将神经网络引入知识图谱的研究，特别是NTN将知识图谱中实体和关系的单词嵌入的平均值作为该节点的表示，训练神经网络判断（头实体，关系，尾实体）的三元组是否为真，在知识图谱补全（推理）任务中取得了很好的效果。
4. 知识图谱的缺陷
知识图谱的缺点本质上都是“二元一阶谓词逻辑”作为知识表示本身的缺陷带来的。长久以来，知识表示是研究者孜孜不倦追寻探索的话题，完全依靠（头实体，关系，尾实体）这样的命题，尽管能表示大部分简单事件或实体属性，但对于复杂知识却束手无策。在对知识理解的细粒度要求原来越高的今天，这一缺点成为了知识图谱的阿喀琉斯之踵。
李政道和杨振宁共同提出宇称不守恒的理论”，这个事实如果要计入知识图谱，通常不得不记作（杨振宁和李政道，提出，宇称不守恒理论）”，而这样头实体就无法与两位科学家的其他信息链接；如果将头实体拆开，则无法反映“共同提出，与事实不符。归根结底，“······和······共同提出······”是一个三元关系，无法被知识图谱直接记录。
如果说这个例子可以通过在知识图谱中引入超边（hyperedge）来改进，那么下面的二阶谓词逻辑的例子则完全超出了现有框架。“克隆羊的各项属性都与本体相同”，在知识图谱中，各项属性都由不同关系刻画，因此这句话无法被知识图谱所记录；在更宽泛的知识库理论中，这通常被列为“规则”，然后执行大量枚举操作，去“推理”出克隆羊的各项关系属性，而对于规则的理解和形式化往往带有浓厚的人工色彩，一条高阶逻辑也可能涉及到海量的实体，使得图谱十分冗余。

知识图谱和认知图谱之发展

官方回应社保缴满15年就坐等退休

工信部征求意见：电动自行车拟禁用车载充电器、完善永久性标识

“阻拦春耕副书记”纪云浩大学学历来自政法系统定向培养？相关部门回应：2016年前确有专项招录

许钟豪重伤任骏飞后！孙铭徽讽刺发声：“人不行了快点急救”

大V断定：只要中国拿下芯片中低端产业，就可以把欧美日都饿死！

很多地方把“为人民服务”变成“为大局服务”，这两者有啥区别？

哈马斯高官：若落实"两国方案" 愿放下武器解散武装

神舟十八号航天员顺利进驻中国空间站

4元拿下5600亩地承包权，开鲁“张氏兄弟”身份曝光，果然不一般

杭州名校学区房价格已回到5-7年前成交势头生猛

“穷鬼套餐”席卷餐饮业？连米其林都下场分一杯羹了

曼城4-0双杀布莱顿！76分升至英超第二，福登双响，德布劳内破门

上海这些业主操碎心：小区交房不到半年，开出50多家民宿！只因地理位置极佳？

记者实测苹果手机输入"发现石油"会自动定位:安卓也是

新华社快讯：以色列公共广播公司25日报道，以总理内塔尼亚胡批准在拉法开展地面行动的计划

美国指责中国新能源产能过剩？周鸿祎：不指责服装却指责战略新兴行业

亚洲杯大冷门！印尼13-12淘汰韩国，首次参赛便进4强，黄喜洪染红

杭州西湖有人组团往水里放生甲鱼等外来物种？景区管委会：属实，他们避开了监控

美远程导弹系统秘密运抵乌克兰可覆盖克里米亚全境

村民称村支书往麦田排放污水，村支书：我也想火一把

知识图谱和认知图谱之发展

官方回应社保缴满15年就坐等退休

工信部征求意见：电动自行车拟禁用车载充电器、完善永久性标识

“阻拦春耕副书记”纪云浩大学学历来自政法系统定向培养？相关部门回应：2016年前确有专项招录

许钟豪重伤任骏飞后！孙铭徽讽刺发声：“人不行了 快点急救”

大V断定：只要中国拿下芯片中低端产业，就可以把欧美日都饿死！

很多地方把“为人民服务”变成“为大局服务”，这两者有啥区别？

哈马斯高官：若落实"两国方案" 愿放下武器解散武装

神舟十八号航天员顺利进驻中国空间站

4元拿下5600亩地承包权，开鲁“张氏兄弟”身份曝光，果然不一般

杭州名校学区房价格已回到5-7年前 成交势头生猛

“穷鬼套餐”席卷餐饮业？连米其林都下场分一杯羹了

曼城4-0双杀布莱顿！76分升至英超第二，福登双响，德布劳内破门

上海这些业主操碎心：小区交房不到半年，开出50多家民宿！只因地理位置极佳？

记者实测苹果手机输入"发现石油"会自动定位:安卓也是

新华社快讯：以色列公共广播公司25日报道，以总理内塔尼亚胡批准在拉法开展地面行动的计划

美国指责中国新能源产能过剩？周鸿祎：不指责服装却指责战略新兴行业

亚洲杯大冷门！印尼13-12淘汰韩国，首次参赛便进4强，黄喜洪染红

杭州西湖有人组团往水里放生甲鱼等外来物种？景区管委会：属实，他们避开了监控

美远程导弹系统秘密运抵乌克兰 可覆盖克里米亚全境

村民称村支书往麦田排放污水，村支书：我也想火一把

许钟豪重伤任骏飞后！孙铭徽讽刺发声：“人不行了快点急救”

杭州名校学区房价格已回到5-7年前成交势头生猛

美远程导弹系统秘密运抵乌克兰可覆盖克里米亚全境