2.1.14.2.Decision trees and Random Forests with Python
Last updated
Last updated
將圖表直接嵌入到Notebook之中
讀取資料
由df.head可知變因有Age, Number, Start, 結果為Kyphosis
先了解資料欄位的型別以及變數的型態, 由pd.info()可以知道這份資料有4個欄位: 有3筆屬於int64, 1筆屬於object
視覺化資料以了解每個因子間的相關性
首先介紹train_test_split, 這個函式可以隨機劃分訓練集和測試集
import Decision tree classifier
訓練模型
預測
評估模型的精度
confusion_matrix, classification_report
import Random tree forest
訓練模型
預測
評估模型的精度