2017年深度学习领域阅读量最高的11篇文章

【智能观】本文是国外知名技术网站Analytics Vidhya总结的11篇深度学习领域最佳文章，如果你还没有看过，可以找来读一读；如果你还不熟悉深度学习，这些资料将成为一份不错的资源。为了方便不同水平的人，本文还设置了文章的层次和文章中使用的工具。

1.用Python和R理解和编码神经网络

使用工具：Python（numpy），R

级别：中级

神经网络被认为是黑匣子，一般人都无法了解它的工作方式。读过这篇文章后，你将彻底改变这样的观点。

本文从感知器在numpy和R中进行编码的过程切入，简化了神经网络的结构。

你将了解神经网络是如何工作的，如何初始化权重，以及如何使用反向传播更新网络。对于那些想要彻底了解神经网络工作的人来说，这是一篇必读的文章。

2. 使用基于R语言的Keras和TensorFlow进行深度学习

使用工具： Keras R语言接口

级别：中级

选R还是Python一直是一个有争议的话题。随着深度学习的发展，人们逐渐选择Python，因为它拥有R所没有的深度学习库和框架（到目前为止）。

当人们刚慢慢习惯把Python作为深度学习的实用语言时，Keras R语言接口发布，兼容TensorFlow运行后端， R语言很可能将再次超越Python。

在本文中，你将学会如何安装使用基于R语言的Keras和Tensorflow，并在RStudio的经典MNIST数据集上构建自己的第一个神经网络模型。

3. 卷积神经网络（CNN）的体系结构揭秘

使用工具：Keras

级别：中级

本文讨论了卷积神经网络背后的架构，这些架构用于解决图像的识别和分类问题。每个图像都是按特定顺序排列的像素。如果你更改像素的顺序或值，图像也会随之改变。

要想了解神经网络中的图像，那么了解像素的排列方式非常重要。CNN是专门设计用来保存这些像素排列，并从图像中获得各种特征的神经网络。本文将帮助你理解卷积神经网络的各个层次，并使你能够使用CNN实现图像分类任务。

4. 实践深度学习：解决年龄检测问题

使用工具：keras

级别：高级

通过观看视频、MOOC，或者通过解决实际问题来学习数据科学都是必要的手段。这两种学习方式都是你要做的。如果你质疑，为什么要学习或应用深度学习，那就说明你已经OUT了。

目前，人们已经在相机中的人脸检测，移动设备上的语音识别以及汽车自动驾驶等领域应用了深度学习。本文鼓励你去解决有趣的和有意义的问题，例如，使用深度学习检测人的年龄等。

5. 用TensorBoard调试和可视化神经网络

使用工具：Keras，TensorBoard

级别：中级

如果你想训练一个神经网络，就必须解决收敛问题（从简单的数据转换到模型创建问题）。

本文重点介绍神经网络的调试工作，目的是指导你解决问题。本文还介绍了一个工具Tensorboard，是深度学习工具箱的有益补充。

6. 转移学习以及在深度学习中使用预先训练的模型

使用工具：Keras

级别：高级

在当今世界，用于机器的RAM非常便宜，易于使用，而且投入又少。如果你需要数百GB的RAM来解决超级复杂的有监督机器学习问题，完全可以考虑自己购买。而另一方面，GPU并不便宜。如果你想使用GPU上100 GB 的VRAM，还得配套其他设备，要付出很高的成本。

当我们想要解决图像和语音识别等领域复杂的实际问题时，每增加模型中的一层隐藏层都需要巨大的资源和时间。转移学习可以帮助我们调整别人预先训练好的模型，解决自己的问题。本文介绍了如何使用预先训练的模型提出解决方案，如何使用VGG16等预先训练的模型进行图像分类。

链接：

https://www.analyticsvidhya.com/blog/2017/06/transfer-learning-the-art-of-fine-tuning-a-pre-trained-model/

7. 深度学习的基础知识：递归神经网络介绍

使用工具：Keras

级别：中级

有时候，信息序列就是数据本身。如果我们想把这些数据合理地输出，就需要一个网络，访问跟该数据相关的信息，以完整地理解数据。这个网络就是递归神经网络。

本文介绍递归神经网络。为方便起见，作者在Excel中展示了递归神经元的工作过程。作者还讨论了递归神经网络的一些缺点，并给出了相应的算法。简单地说，这是一篇介绍性的文章，使你能够理解和使用递归神经网络来处理实际问题。

链接：

https://www.analyticsvidhya.com/blog/2017/12/introduction-to-recurrent-neural-networks/

8. 直观了解Word嵌入：从计数向量到Word2Vec（计算预测模型）

使用工具：gensim

级别：高级

谷歌翻译中输入英文并获得对应中文就是一个文本处理的应用。文本处理通过处理大量的文本来执行不同的任务，如聚类、分类和机器翻译。人类可以非常直观地处理文本，但如果我们一天内生成了数百万个文档，人类执行这些任务就不可能了。

人类可以高效完成一项任务，但对计算机来说，很难。当然，计算机可以匹配两个字符串并告诉你是否相同。但是，当你在寻找梅西时，如何让电脑告诉你关于足球或罗纳尔多的事?

答案是为单词创建一个表示形式，捕捉它们的含义，语义关系以及它们所应用的不同类型的上下文。所有这些都是通过使用“Word嵌入”或“文本数字表示”来实现的。在这篇文章中，你会看到什么是正式的 Word 嵌入及其不同类型, 以及如何实现任务, 如高效地显示 Google 搜索结果。

9. 使用深度学习分析音频数据（附带案例研究）

使用工具：Keras

级别：中级

当你开始使用数据科学时，可以从最简单的做起，如贷款预测或超市销售预测，这些问题的结构化数据可以以表格形式整齐排列。

人是数据科学中最难的部分，现实生活中的数据要复杂得多。你要了解它，从各种来源收集它，并以可以处理的格式排列。当数据是非结构化格式（如图像或音频）时，处理更加困难。因为你必须以标准格式表示图像/音频数据，以便分析。

有趣的是, 非结构化数据暗藏了巨大的开发机会。它更接近我们人类交流和互动的方式。例如，如果一个人在说话，你不仅得到了TA所说的内容，而且还能从声音中感受到这个人的情感。本文介绍音频/语音处理与案例研究，以便你可以亲自体验处理音频问题的方法。

10. 生成性对抗网络 (GANs) 入门指南

使用工具：Keras

级别：高级

神经网络取得了很大的进步。它们现在认识图像和声音的水平与人类相当。它们也能很好地理解自然语言。但即使如此，使用机器来自动化人工任务还有点困难。毕竟，我们所做的不仅仅是认识图像、声音或者理解周围人说什么。让我们看一些例子：

通过学习过去的文章，训练一位能够以非常简单的方式撰写文章并可以解释数据科学概念的人工作者。
创建一个AI画家，从著名画家过去的作品中学习，模仿任何著名画家的作品。

以上这些都可以通过机器来完成吗？答案可能让你大吃一惊。这些任务自动化确实很难，但是生成对抗网络（GAN）有可能做到！

如果你被GAN这个名字吓倒，别担心！这篇文章会安抚你的情绪。本文介绍GAN的概念，并解释它是如何解决这些难题的。你还会知道一些GAN的应用，并得到一些重要资源，以深入了解这个技术。

11. 几分钟完成深度学习应用（使用Python）

使用工具：深度学习API和开源深度学习软件

等级：初级

深度学习是近年来数据科学中研究和讨论最多的话题。值得注意的是，最近数据科学方面的一些突破源于深度学习。预计很多深度学习应用程序在不久的将来进入你的生活。但是，如果你一直没有深入了解深度学习，这些词可能看起来很难很恐怖：TensorFlow，Keras，基于GPU的计算等。但其实并不难！虽然尖端的深度学习需要花费时间和精力来钻研，但将它应用于日常问题是非常容易的。

本文展示了6个应用程序，这些应用程序一开始看起来很困难，但是你可以在一小时内使用深度学习实现它们。

想读原文的朋友请给我们留言。

来源：Analytics Vidhya
智能观编译

—完—

亲爱的朋友：
这些是今年在深度学习领域很火的文章，基本都有中文翻译版本。如果你关注深度学习，相信其中很多文章已经读过了。如果你没有读过，可以尝试搜索一下中文版。

新年快乐！
智能观一米
2017-12-31 于北京中关村

2017年深度学习领域阅读量最高的11篇文章

4月20日，北大运动会“机器人太奶”走红，24日代理公司回应：机器人是开放平台可编程，配齐大概80万

美参议院投票通过向乌克兰和以色列援助法案

媒体：布林肯应约来访这次和上一次的访问明显不同

耿彦波留给大同的这块警示碑再引关注：华严寺综治犯三错，明耻彰过

苏纳克宣布“有史以来最大规模军援”！英国军工业转入战时状态

沉默的日本，衰落的国运

我国居民居住条件处于欧洲60年前水平，未来高层住宅必定都会被拆除

上海江边多人跑步被保安拦，“你们衣服一样的！”公园：统一着装要报备，不能拍照

东契奇32分独行侠险胜快船1-1 欧文23分

太蹊跷！上海小区一报废车长期占据车位，车主按时、足额交停车费，投资已过万，物业很无奈

成都二环高架公交车道能否开放？已初步拟定方案

工商银行突然设立人民武装部，释放了什么信号？逻辑是什么？

中部三省外贸失速，河南一季度手机出口减少1000万台

19连跌！沪牌竞拍人数逐月下降，原因何在？

利物浦0-2埃弗顿！近3轮输2场，落后英超榜首3分，努涅斯错失单刀

杨利伟获得钱学森最高成就奖

被指香港金融史重大时刻华夏博时嘉实三家现货比特币、以太币ETF获批

现场犹如世界末日！乌克兰轰炸俄罗斯斯摩棱斯克的雅采沃炼油厂

为中小学教师减负官方部署专项整治工作

特斯拉在国内取消所有应届毕业生offer

2017年深度学习领域阅读量最高的11篇文章

4月20日，北大运动会“机器人太奶”走红，24日代理公司回应：机器人是开放平台可编程，配齐大概80万

美参议院投票通过向乌克兰和以色列援助法案

媒体：布林肯应约来访 这次和上一次的访问明显不同

耿彦波留给大同的这块警示碑再引关注：华严寺综治犯三错，明耻彰过

苏纳克宣布“有史以来最大规模军援”！英国军工业转入战时状态

沉默的日本，衰落的国运

我国居民居住条件处于欧洲60年前水平，未来高层住宅必定都会被拆除

上海江边多人跑步被保安拦，“你们衣服一样的！”公园：统一着装要报备，不能拍照

东契奇32分独行侠险胜快船1-1 欧文23分

太蹊跷！上海小区一报废车长期占据车位，车主按时、足额交停车费，投资已过万，物业很无奈

成都二环高架公交车道能否开放？已初步拟定方案

工商银行突然设立人民武装部，释放了什么信号？逻辑是什么？

中部三省外贸失速，河南一季度手机出口减少1000万台

19连跌！沪牌竞拍人数逐月下降，原因何在？

利物浦0-2埃弗顿！近3轮输2场，落后英超榜首3分，努涅斯错失单刀

杨利伟获得钱学森最高成就奖

被指香港金融史重大时刻 华夏博时嘉实三家现货比特币、以太币ETF获批

现场犹如世界末日！乌克兰轰炸俄罗斯斯摩棱斯克的雅采沃炼油厂

为中小学教师减负 官方部署专项整治工作

特斯拉在国内取消所有应届毕业生offer

媒体：布林肯应约来访这次和上一次的访问明显不同

被指香港金融史重大时刻华夏博时嘉实三家现货比特币、以太币ETF获批

为中小学教师减负官方部署专项整治工作