天才一秒记住【畅想小说网】地址:http://www.cxtra.net
这是一个循环程序,其中的ord()函数负责转化功能。
In[21]:fe(0,8123):
fe(0,22):
&a[i,j]=ord(a[i,j])
新的训练数据为
Ia
接下来就可以构造决策树并用于分类了,输出的是描述所生成的决策树的参数。
In[23]:clf=tree.DeTreeClassifier()
In[24]:clf.fit(X,Y)
Out[24]:
&reeClassifier(class_weight=erion='gini',
max_depth=None,
max_features=None,max_leaf_nodes=None,
min_impurity_split=1e-07,min_samples_leaf=1,
mi=2,mi_fra_leaf=0.0,
&=False,random_state=er='best')
使用决策树用于新数据的分类,可以看到对下列4个新的蘑菇数据进行分类后,输出结果表明其中有3种是可食用的,1种是有毒的。
I=np.anay([[…],[…],[…],[…]])
np.anay([[120,115,121,...,110,110,103],
[98,115,119,...,110,110,109],
[120,121,119,...,107,115,117],
[120,115,103,...,110,97,103]])
In[26]:clf.predict(test)
Out[26]:array([1,1,0,1])
这个决策树的准确率如何呢?一种简单的方法是使用训练数据中的X,用决策树获得对应的类别标记,也就是预测分类结果(这里用Y_predict表示),然后把它和实际的类别标记Y进行比较。
scikit-learn支持这样的比较,使用的方法是accuracy_score。
In[27]:fromsklearricsimportaccuracy_score
In[28]:Y_predict=clf.predict(X)
#这里使用前面训练好的决策树,输入训练样本的X,给出对应的predict
In[29]:accuracy_score(Y,Y_predict)
#这里利用accuracy_score来比较预测值和真实值。
Out[29]:1.0
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!