本发明属于高校资助,具体涉及一种基于改进k-means算法的高校资助评定方法。
背景技术:
1、目前,大部分高校资助的认定方式仍然采用手工的方式进行统计分析和记分,且具体的分析记分材料主要来源于学生自己所提供的相关证明材料,因此存在较大的人为主观性,难以对学生实际情况进行准确全面的评价,进而导致资助的认定结果不够准确、客观。
技术实现思路
1、鉴于此,为解决上述背景技术中所提出的问题,本发明的目的在于提供一种基于改进k-means算法的高校资助评定方法。
2、为实现上述目的,本发明提供如下技术方案:
3、一种基于改进k-means算法的高校资助评定方法,包括以下步骤:
4、获取学生数据,并对所述学生数据进行预处理,且所述学生数据至少包括校园一卡通消费数据、身份数据、家庭信息数据以及班级评价数据;
5、通过预处理后的的家庭信息数据与班级评价数据计算资助指数;
6、对预处理后的校园一卡通消费数据进行特征提取,并将所提取的特征组合形成样本数据集,记u={u1,u2,u3......un},其中n为所述样本数据集的样本个数;
7、初始化分类数量k,基于改进k-means算法对与所述样本数据集进行聚类分类,并基于分类结果得到消费指数;
8、通过所述资助指数与所述消费指数综合计算资助等级。
9、优选的,所述预处理包括去重、缺失处理和格式化;其中
10、所述去重为:根据学生校园一卡id进行数据排序,通过比较相邻数据来删除重复数据;
11、所述缺失处理为:使用平均值填充缺失数据;
12、所述格式化为:将所有消费数据转化为统一的文本格式。
13、优选的,所述身份数据包括学生性别和学生户口类型。
14、优选的,所述资助指数的计算公式为pi=(sex*hr*ncf*cdr)1/4;式中,sex表示学生性别,hr表示户口类型,ncf表示家庭信息数据,cdr表示班级评价数据。
15、优选的,所述的对预处理后的校园一卡通消费数据进行特征提取包括:提取m个消费指标,并将所提取的特征记录为包含有该m个消费指标的指标集合x=(x1,x2......xm);其中所述m个消费指标至少包括在预设时间段内的总消费次数、总消费金额以及平均消费金额。
16、优选的,所述的基于改进k-means算法对与所述样本数据集进行聚类分析包括:
17、1)从所述样本数据集中随机选取一个样本作为初始聚类中心;
18、2)计算所述样本数据集中每个样本与最近的一个聚类中心之间的最短距离、以及每个样本被选为下一个聚类中心的概率;
19、3)随机产生一个[0~1]的随机数,计算每个样本对应概率与该随机数的差值,并选取最小差值所对应的一个样本为下一个聚类中心(轮盘法);
20、4)重复步骤2)与步骤3)至得到k个聚类中心;
21、5)分别计算每个样本与k个聚类中心的距离,并将每个样本归类到与之距离最近的一个聚类中心所在的类别中;
22、6)计算每个聚类类别中所有样本的平均位置,以该平均位置为当前聚类类别中新的聚类中心;
23、7)重复步骤5)与步骤6)至各聚类中心点不再发生变化或达到预设的迭代次数;
24、8)输出聚类分类结果。
25、优选的,所述聚类分类结果为消费等级分类,且所述消费等级包括不资助消费、一般资助消费、资助消费、特别资助消费。
26、优选的,根据不同消费等级预设所述消费指数。
27、优选的,所述样本与所述聚类中心之间的距离为欧式距离:
28、式中,uik表示样本ui的位置坐标,ujk表示样本uj的位置坐标。
29、优选的,所述资助等级计算公式为y=pi*a;且a表示消费指数。
30、本发明与现有技术相比,具有以下有益效果:
31、本发明以学生校园一卡通消费数据为基础,从该消费数据中提取具有代表性的总消费次数、总消费金额以及平均消费金额等消费指标作为消费特征,结合改进k-means算法执行消费特征分类,以此精准确定学生的消费情况,然后再结合身份数据、家庭信息数据以及班级评价数据来进行资助等级的量化计算,为困难学生的资助评定提供科学、准确的辅助分析依据。
1.一种基于改进k-means算法的高校资助评定方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于改进k-means算法的高校资助评定方法,其特征在于,所述预处理包括去重、缺失处理和格式化;
3.根据权利要求1所述的基于改进k-means算法的高校资助评定方法,其特征在于:所述身份数据包括学生性别和学生户口类型。
4.根据权利要求3所述的基于改进k-means算法的高校资助评定方法,其特征在于:所述资助指数的计算公式为pi=(sex*hr*ncf*cdr)1/4;式中,sex表示学生性别,hr表示户口类型,ncf表示家庭信息数据,cdr表示班级评价数据。
5.根据权利要求1所述的基于改进k-means算法的高校资助评定方法,其特征在于,所述的对预处理后的校园一卡通消费数据进行特征提取包括:
6.根据权利要求1所述的基于改进k-means算法的高校资助评定方法,其特征在于,所述的基于改进k-means算法对与所述样本数据集进行聚类分析包括:
7.根据权利要求6所述的基于改进k-means算法的高校资助评定方法,其特征在于:所述聚类分类结果为消费等级分类,且所述消费等级包括不资助消费、一般资助消费、资助消费、特别资助消费。
8.根据权利要求7所述的基于改进k-means算法的高校资助评定方法,其特征在于:根据不同消费等级预设所述消费指数。
9.根据权利要求6所述的基于改进k-means算法的高校资助评定方法,其特征在于:所述样本与所述聚类中心之间的距离为欧式距离:
10.根据权利要求1所述的基于改进k-means算法的高校资助评定方法,其特征在于:所述资助等级计算公式为y=pi*a;且a表示消费指数。