畅想小说网

第一节 直方图与特征(第3页)

天才一秒记住【畅想小说网】地址:http://www.cxtra.net

表8-1成绩分布

可以看到,成绩分布在60到100之间,假设学校按照如下方式划分成绩的等级。

优:90~100;

良:80~89;

中:70~79;

及格:60~69。

这相当于将[60,100]这个区间划分成了4个小区间。

接下来用直方图来观察数据的分布情况。

读者可以先自己动手统计,然后学习用Python来生成直方图(图8-1)。

In[1]:importpandasaspd

#导入pandas模块

In[2]:data=pd.read_excel('grade.xlsx',header=0)

In[3]:data.shape

Out[3]:(20,2)

In[4]:data['成绩'].hist(bins=4)

#指定成绩所在列的数据是分析对象,bins的含义是把指定数据分成几部分

图8-1成绩分布直方图

该直方图反映了这个班级的成绩的重要特征。

想象这样的场景:某一所学校对不同的班级,都建立了类似的直方图。

在考试之后,如果学校依据成绩对班级进行分类,则教务处只需要使用4个参数(优、良、中、及格各自的数量),就可以对不同班级的学习状况进行大致的分类了,而无须比较每个班级所有同学的考试成绩。

当然如果采用上述划分方式后,有两个班级成绩分布相同,那么这4个参数就不足以区分这两个班级,需要进一步挖掘更细致的特征。

一般的人脸识别是通过采集到的人脸照片来进行识别的,对于一张含有人脸的图片,可以使用它的颜色分布(或者灰度分布)作为数据生成直方图,而不同的人脸颜色数据对应的直方图一般是不同的,这样就可以区分不同的人脸了,第二节将会更详细地介绍如何使用这种方法区分人脸。

本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!

如遇章节错误,请点击报错(无需登陆)

新书推荐

港综世界完美人生间谍的战争超级全能系统全家打入冷宫?听崽心声后杀疯了前方高能哑妻不怂,总裁宠上瘾巡狩万界我的亮剑生涯斗罗:武魂假面,我帝骑无限魂技临渊行神印王座射雕之江湖核爆中走出的强者我靠读书成圣人时间循环:开局就被六扇门抓捕有请小师叔谍网轻狂小毒妃陈二狗的妖孽人生玄天武帝超凡黎明神医娘亲帅炸了无敌召唤之最强人皇权臣大佬和我领了个证众神世界