在机器学习中,有许多的算法,大多数时候这些算法比较枯燥难懂,但如果用通俗的语言解释一下,你会觉得其实这些算法也蛮有趣的。今天就带你来认识一下决策树。

从名字上来看,其实我们已经可以大致理解它的逻辑结构,它和树状图有些类似,不同的是, 我们需要在每个节点提出一个问题,再有一个预期的标准答案,满足标准,就继续下一个问题,不满足标准,直接pass。

这好比你的择偶标准,在你打算开启相亲之路的时候,你一定会先列出一系列的标准,不能每个都见面,否则,即便你有时间,钱包也受不了啊!于是,你列出了你的标准:

A.年龄:30岁以下

B.身高:160cm以上

C.学历:本科以上

D.样貌:好看

E.母亲不跳广场舞

F.父亲不转发养生朋友圈

于是,你就有了一个你是否需要去相亲的决策树:

打开网易新闻 查看更多图片

当然,这只是最简单的一种决策树。如果我们把所有问题都具体量化,就是一个真正意义上的决策树了。在以上的比喻中,我们可以很好的理解决策树的定义:

决策树是一种树结构,每个内部的节点都表示一个属性上的测试,每个分支代表着一个属性的测试输出,每个叶节点表示一种类别。决策树是一种监督学习,更是一种十分常用的分类方法,它可以在已知各种情况发生概率的情况下,准确评价项目的风险,判断其可行性。在机器学习中,决策树是一个预测模型,这种学习技术也叫做决策树学习,可以用来分析数据,做出预测。

对于初学者来说,决策树很容易理解和实现,在不需要人们了解很多专业知识的情况下就能够熟练掌握。决策树的操作也十分便捷,数据准备简单甚至没有必要,还能够同时处理常规型和数据型属性,处理数据的时间也相对较短。

不过,决策树也有它的短板所在。例如,它在处理连续性字段时比较吃力;在处理有时间顺序的数据时,需要在预处理上多下功夫;数据的类别太多时也很容易出错等。因此在选择算法的时候,学员必须要了解某一算法的长处和短板,根据数据的特征进行选择。