天才一秒记住【畅想小说网】地址:http://www.cxtra.net
22.habitat:grasses=g,leaves=l,meado,urban=u,oods=d
首先使用pandas读取数据,这是一个强大的数据处理工具。
通过显示数据形状可以看到共有8124行、24列。
In[5]:importpandasaspd
importnumpyasnp
In[6]:data=pd.read_exushrooxlsx',header=0)
In[7]:data.shape
Out[7]:(8124,24)
使用如下命令观察前5行数据。
In[8]:data.head(5)
Out[8]:
样本编号标记属性1属性2属性3属性4属性5属性6属性7属性8...
属性13属性14属性15属性16属性17属性18
01.0pxsntpf...so
12.0exsytafcb...so
23.0ebswtlfcb...so
34.0pxywtpf...so
45.0exsgfnfo
属性19属性20属性21属性22
0pksu
1pnng
2pnnm
3pksu
4enag
[5rowsx24ns]
进行数据拆分,获得输入数据X和对应的类别标记Y,这个过程是为了准备训练数据。
用以下代码获取类别标记。
Ia['标记']
#读取标记列
In[10]:label=np.array(label)
#转化成数组,这是Python最常使用的数据格式
In[11]:label.shape
Out[11]:(8124,)
#获得标记的个数。
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!