认识人工智能、机器学习、深度学习和神经网络，有干货

1950年10月，被誉为“计算机科学之父”的图灵（冯诺依曼是“现代计算机之父”）发表了一篇题为“机器能思考吗”的论文，成为了划时代之作。在这篇论文里，图灵第一次提出了“机器思维”的概念，同时给出了一种判断机器是否具备“智能”的方法，即“图灵测试”。简单来说就是，人们在和机器进行沟通时，如果有一定比例不能认出这是一台“机器”，那么就说明这台机器已经具备了一定的“智能”。正是这篇文章，为图灵又赢得了“人工智能之父”的称号。之后，1956年在达特茅斯学院召开的一个夏季讨论会议中，人工智能的概念被确定下来，而这也被认为是人工智能的正式起点。

长久以来，在 “人工智能”领域，主流观点分成了两派，一派认为实现人工智能必须用逻辑和符号系统，基于预设和反馈，搞清楚应该如何让机器思考，并将思考的过程演化为具备明确程序设计的专家系统，自顶向下地仿造大脑；而另一派则认为，实现人工智能应该从模仿生物学大脑入手，让机器自主形成意识，自底向上，通过不断实践，促进机器的自我成长和进化。不过，随着2016年谷歌阿尔法狗的大放异彩，深度学习已成为目前人工智能最受关注的领域，暂时终结了“人工智能”的方向之争，并开启了人工智能飞速发展和全面产业化的新时代。

在媒体报道中，人工智能、机器学习、深度学习和神经网络是非常热门的四个词汇，很多人甚至将四者看成是一种等价的关系，在很多报道中，会混杂使用。事实上，这四者之间既有一定的联系，但也有明显的区别。如下图所示，最外面的大圆代表人工智能，中间一层表示机器学习，而基于多层神经网络的深度学习处于中心位置。也可以简单理解为：机器学习是人工智能领域中的一个重要分支；深度学习是实现机器学习的一种重要方法；而深度学习通常都是基于多层神经网络的（存在多种神经网络模型）。

深度学习（Deep Learning）的概念虽然是在2006年由Hinton等人首次提出的，但在20世纪50年代，人工神经网络的第一个实验就完成了，而类似深度学习的方法，在20世纪90年代就已经成功用于某些商业应用中了，可为什么直到2016年，基于深度学习的人工智能，才被广泛应用起来呢？

第一：随着互联网及移动互联网的发展，在各个行业中，可供训练的数据样本不断增加，这使得深度学习变得更加有用。一个粗略的经验法则是，对于监督学习算法，在每给定约5000个标注样本的情况下，人工智能程序将达到可以接受的性能；而当至少有1000万个标注样本的数据集可用于训练时，人工智能程序将达到甚至超过人类表现。

第二：随着云计算的发展，针对深度学习的计算机软硬件基础设施得到了极大的改善，基于现在的计算资源，可以运行更复杂更大的深度学习模型。人工神经网络的规模大约每2.4 年扩大一倍，这种增长是由更大的内存和更快的计算驱动的。预计到本世纪50 年代，人工神经网络将能够具备与人脑相同数量级的神经元。

第三：在以上两点原因的作用下，基于深度学习的人工智能，已经开始着手解决人们生活中的实际问题了，从简单应用到复杂任务，如文本识别、声音识别、人脸识别、图像识别、自然语言处理等等，而其处理的精度也在不断提高，从而逐渐形成正反馈效应，带动了该领域中人才、资本和应用的全面发展。

现在的工程师们发现，其实20世纪80年代就存在的一些算法，也能工作得非常好，但是直到在2006年都没有体现出来，就是因为当时的训练数据太过匮乏、计算代价也太高，所以在很长一段时间，人们普遍认为多层神经网络是难以训练的。由此可见，目前人工智能领域的蓬勃发展，并非是从天而降突然出现的，而是技术、数据和资源均准备就位后，水到渠成的结果。

下面再通过一个简单的例子，说说基于多层神经网络的深度学习是如何工作的。例如现在需要识别出一张图片中的物体是一个人、一辆车还是一只动物。

我们把一张图片传给计算机程序后，计算机接收到的可能是很多基本像素值的集合，每个像素值对应图片中每个最小的像素块。让计算机直接基于这些基本像素去识别图片中物体的特征，其函数将是非常复杂的，直接处理几乎是不可能的。而深度学习会将所需要的复杂映射，分解为一系列嵌套的简单映射，通过多层渐进式的探索来解决这一难题。在输出层和输入层之间的各个数据层，它们的值不是从原始数据中直接给出的，所以将这些层称为“隐藏层”，并与输入层和输出层一起，共同构成了一个多层神经网络。以下图为例，通过包含三个隐藏层的神经网络，最终实现了对图片中物体类型的识别。

输入层：可见层，输入的数据为所有最小像素块的像素值

第一层：隐藏层，识别出所有的边缘数据。根据输入层提供的像素数据，通过比较相邻像素块的亮度，可以识别出图片中所有实体部分的边缘，每个边缘数据可能是由多个像素数据组成的。

第二层：隐藏层，识别出所有的轮廓数据。根据第一层隐藏层提供的边缘数据，可以识别出图片中所有实体部分的轮廓，每个轮廓数据可能是由多个边缘数据组成的。

第三层：隐藏层，识别出各个组成部分。根据第二层隐藏层提供的轮廓数据，可以识别出图片中实体部分的各个组成部分（如人的头发、衣服等），每个组成部分，可能是由多个轮廓数据组成的。

输出层：对各个组成部分的特征进行综合分析，确定图片中物体的类别，并给出结论。有了第三层隐藏层提供的各个组成部分的信息，就可以识别出整体对象的分类特征了，例如有头发、穿衣服的是人，有轮胎、有车架的是车，有犄角、长尾巴的是动物。

以上只是对深度学习的简单介绍，希望系统学习相关知识的朋友，这里两本电子书[深度学习中文版]和[深入浅出深度学习：原理剖析与python实践]，有兴趣的朋友可以根据下面线索获取。

创作不易，欢迎朋友们关注、评论、转发。如企业转载或其它，请联系：keji5u（科技无忧订阅号）

认识人工智能、机器学习、深度学习和神经网络，有干货

穆雷压哨绝杀！掘金20分神逆转湖人2-0！詹皇26+8+12尽力局

胖东来售卖以色列进口橙汁惹争议，有网友表示不会再买

俄外交部：波兰境内出现的美核武器将成合法打击目标

台媒：与台军张骞舰在台海相遇，解放军丽水舰喊话警示“注意你的位置”

F1上海赛道背后的楼越来越多！国外网友惊叹上海的发展速度

中国游客在印尼“地狱之门”景点坠亡

深圳卫健委“霸总”短视频上热搜！对话编导：团队多是年轻人，走红并不意外

以军中央司令部司令请辞

辽宁副省长回应扭转人口流出局面：外界对辽宁预期已发生转变

汤家凤回应获评淘宝最佳睡前读物！

农民种地要先交钱、干部下田拦春耕？最新进展→

内蒙古开鲁国土三调新增耕地有偿使用？官方：成立工作组开展调查

"不让村民种地"当地镇党委副书记：别找我我不懂法

乌克兰基辅拉响防空警报

问界新M5售价公布：24.98万元起

贵阳，卧槽！这大哥牛逼啊！

沙滩座椅坐10分钟收80元？当地回应了

人社部：1-3月实现失业人员再就业113万人

深圳白昼如黑夜大暴雨来临，部分道路成了“汪洋大海”

国防教育法拟修订

认识人工智能、机器学习、深度学习和神经网络，有干货

穆雷压哨绝杀！掘金20分神逆转湖人2-0！詹皇26+8+12尽力局

胖东来售卖以色列进口橙汁惹争议，有网友表示不会再买

俄外交部：波兰境内出现的美核武器将成合法打击目标

台媒：与台军张骞舰在台海相遇，解放军丽水舰喊话警示“注意你的位置”

F1上海赛道背后的楼越来越多！国外网友惊叹上海的发展速度

中国游客在印尼“地狱之门”景点坠亡

深圳卫健委“霸总”短视频上热搜！对话编导：团队多是年轻人，走红并不意外

以军中央司令部司令请辞

辽宁副省长回应扭转人口流出局面：外界对辽宁预期已发生转变

汤家凤回应获评淘宝最佳睡前读物！

农民种地要先交钱、干部下田拦春耕？最新进展→

内蒙古开鲁国土三调新增耕地有偿使用？官方：成立工作组开展调查

"不让村民种地"当地镇党委副书记：别找我 我不懂法

乌克兰基辅拉响防空警报

问界新M5售价公布：24.98万元起

贵阳，卧槽！这大哥牛逼啊！

沙滩座椅坐10分钟收80元？当地回应了

人社部：1-3月实现失业人员再就业113万人

深圳白昼如黑夜大暴雨来临，部分道路成了“汪洋大海”

国防教育法拟修订

"不让村民种地"当地镇党委副书记：别找我我不懂法