天才一秒记住【畅想小说网】地址:http://www.cxtra.net
表8-1成绩分布
可以看到,成绩分布在60到100之间,假设学校按照如下方式划分成绩的等级。
优:90~100;
良:80~89;
中:70~79;
及格:60~69。
这相当于将[60,100]这个区间划分成了4个小区间。
接下来用直方图来观察数据的分布情况。
读者可以先自己动手统计,然后学习用Python来生成直方图(图8-1)。
In[1]:importpandasaspd
#导入pandas模块
In[2]:data=pd.read_excel('grade.xlsx',header=0)
In[3]:data.shape
Out[3]:(20,2)
In[4]:data['成绩'].hist(bins=4)
#指定成绩所在列的数据是分析对象,bins的含义是把指定数据分成几部分
图8-1成绩分布直方图
该直方图反映了这个班级的成绩的重要特征。
想象这样的场景:某一所学校对不同的班级,都建立了类似的直方图。
在考试之后,如果学校依据成绩对班级进行分类,则教务处只需要使用4个参数(优、良、中、及格各自的数量),就可以对不同班级的学习状况进行大致的分类了,而无须比较每个班级所有同学的考试成绩。
当然如果采用上述划分方式后,有两个班级成绩分布相同,那么这4个参数就不足以区分这两个班级,需要进一步挖掘更细致的特征。
一般的人脸识别是通过采集到的人脸照片来进行识别的,对于一张含有人脸的图片,可以使用它的颜色分布(或者灰度分布)作为数据生成直方图,而不同的人脸颜色数据对应的直方图一般是不同的,这样就可以区分不同的人脸了,第二节将会更详细地介绍如何使用这种方法区分人脸。
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!