第三节识别毒蘑菇（第6页）

天才一秒记住【畅想小说网】地址：http://www.cxtra.net

这是一个循环程序，其中的ord（）函数负责转化功能。

In[21]：fe（0，8123）：

fe（0，22）：

&a[i，j]=ord（a[i，j]）

新的训练数据为

接下来就可以构造决策树并用于分类了，输出的是描述所生成的决策树的参数。

In[23]：clf=tree.DeTreeClassifier（）

In[24]：clf.fit（X，Y）

Out[24]：

&reeClassifier（class_weight=erion='gini'，

max_depth=None，

max_features=None，max_leaf_nodes=None，

min_impurity_split=1e-07，min_samples_leaf=1，

mi=2，mi_fra_leaf=0.0，

&=False，random_state=er='best'）

使用决策树用于新数据的分类，可以看到对下列4个新的蘑菇数据进行分类后，输出结果表明其中有3种是可食用的，1种是有毒的。

I=np.anay（[[…]，[…]，[…]，[…]]）

np.anay（[[120，115，121，...，110，110，103]，

[98，115，119，...，110，110，109]，

[120，121，119，...，107，115，117]，

[120，115，103，...，110，97，103]]）

In[26]：clf.predict（test）

Out[26]：array（[1，1，0，1]）

这个决策树的准确率如何呢？一种简单的方法是使用训练数据中的X，用决策树获得对应的类别标记，也就是预测分类结果（这里用Y_predict表示），然后把它和实际的类别标记Y进行比较。

scikit-learn支持这样的比较，使用的方法是accuracy_score。

In[27]：fromsklearricsimportaccuracy_score

In[28]：Y_predict=clf.predict（X）

#这里使用前面训练好的决策树，输入训练样本的X，给出对应的predict

In[29]：accuracy_score（Y，Y_predict）

#这里利用accuracy_score来比较预测值和真实值。

Out[29]：1.0

本章未完，请点击下一章继续阅读！若浏览器显示没有新章节了，请尝试点击右上角↗️或右下角↘️的菜单，退出阅读模式即可，谢谢！

第三节 识别毒蘑菇（第6页）