畅想小说网

第三节 识别毒蘑菇(第5页)

天才一秒记住【畅想小说网】地址:http://www.cxtra.net

实际标记是8123个,需要剔除最后一个''标记

In[12]:label=label[0:-1]

#获得8123个标记

因为用来表示类别的“e”

和“p”

是英文字母,所以需要转化成1和0以便计算机使用,其中1表示可食用,0表示有毒。

使用以下代码完成转化,这是一个循环程序。

In[13]:fe(0,8123):

iflabel[i]=='e':

label[i]=1

else:

label[i]=0

接下来就可以设置Y数据了。

In[14]:Y=label

In[15]:Y=Y.astype(Y)

接下来处理训练样本。

In[16]:data=data.drop(['样本编号','标记'],axis=1)

#训练样本需要将两列去掉(样本编号和标记)

In[17]:data.shape

Out[17]:(8124,22)

#训练样本的行列数量

Ia=np.array(data)

Ia=a[0:-1,:]

#去掉最后一行

Ia.shape

Out[20]:(8123,22)

#新的数据

特征属性的值同样是用字符表示的,而Python的决策树需要对数值进行处理。

所以接下来使用下面的编码将字符直接转化成ASCII编码的整数。

表3-6中的最后一列是通常的字符,前两列分别是这个字符的十进制编码和十六进制编码。

表3-6

使用下面的代码将字符转化成它对应的整数。

如g转化为103,O转化为79等。

本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!

如遇章节错误,请点击报错(无需登陆)

新书推荐

重生八八从木匠开始怪谈作者拖更日记这个修士很危险江山美人志从呆毛王开始公开处刑大道朝天洪荒:我,龙族老祖,绝不出关!英雄联盟之灾变时代我家可能有位大佬我家世显赫,躺平不过分吧!猎人:我真不是除念师万道成神藏锋皇兄万岁崇祯大明:从煤山开始齐天大圣之无限吞噬暗夜通灵王妃每天都想和离反贼平天下官途,搭上女领导之后!老中医的美满生活我家老婆可能是圣女直播写纯爱文的我在虫族封神傲世九重天掌门人不高兴