<aside> 💡 决策树的目的是生成规则,以对原始数据达到最好的划分。因此,决策树的根节点为样本的总体集合,非叶子节点的中间节点代表一个规则,叶子节点代表一个划分。

</aside>

由于决策树的生成是递归式的,因此从流程来分析

决策树生成

叶子节点的生成有三种情况

第二种利在用子节点的后验分布,而第三种利用了父节点的先验分布

划分选择

ID3决策树 信息增益

Untitled

C4.5决策树 信息增益率

Untitled

CART决策树 基尼系数

Untitled

剪支处理

连续值与缺失值处理