1.本发明涉及金融技术领域,特别涉及一种证券行情分析系统。
背景技术:
2.伴随着全球经济一体化进程飞速发展,证券市场在全球经济中扮演着越来越重要的角色,准确的对证券行情进行分析并预测具有重要的社会经济价值,目前,在现有技术中,还不能全自动的对证券行情进行分析并预测,分析的过程往往比较繁琐,耗费大量的人力,且最终预测结果的精确度不高。
技术实现要素:
3.本发明旨在至少一定程度上解决上述技术中的技术问题之一。为此,本发明的目的在于提出了一种证券行情分析系统,全自动的对证券市场的行情数据进行分析并进行预测,减少人力成本,提高最后预测结果的精确性,使得客户能够根据预测所得的证券涨跌信息及时避免投资亏损。
4.为达到上述目的,本发明提出了一种证券行情分析系统,包括:
5.模型训练模块,用于获取样本集,根据所述样本集对构建的证券行情分析模型进行训练,得到训练好的证券行情分析模型;
6.获取模块,用于获取待分析数据;
7.第一控制模块,用于将所述待分析数据输入训练好的证券行情分析模型中,输出预测的证券涨跌信息。
8.进一步地,所述将所述待分析数据输入训练好的证券行情分析模型中前,还包括对所述待分析数据进行归一化处理。
9.进一步地,所述证券行情数据包括成交额数据、成交量数据及成交日期。
10.进一步地,还包括:
11.打包模块,用于将所述待分析数据与其对应的证券涨跌信息进行打包处理,得到数据包;
12.数据压缩模块,用于对所述数据包进行压缩处理,得到数据压缩包并进行存储。
13.进一步地,所述数据压缩模块包括:
14.计算模块,用于计算所述数据压缩包的压缩评估值;
15.第二控制模块,用于判断所述压缩评估值是否小于预设压缩评估值,在确定所述压缩评估值小于预设压缩评估值时,对所述数据包重新进行压缩处理。
16.进一步地,还包括:
17.数据预处理模块,用于在所述第一控制模块将所述待分析数据输入训练好的证券行情分析模型中前,对所述待分析数据进行预处理。
18.进一步地,所述数据预处理模块包括:
19.标记模块,用于:
20.获取所述待分析数据中包括的若干个数据点,得到第一数据点集合,获取第一数据点集合中每个数据点的标称属性,并从所述第一数据点集合中随机选取一个数据点,作为目标数据点;
21.分别计算所述目标数据点的标称属性与所述第一数据点集合中除所述目标数据点外的其他数据点的标称属性的第一距离,得到若干个第一距离,并筛选出最大的第一距离,分别计算若干个第一距离与所述最大的第一距离的第一比值,并判断是否大于预设比值,在确定所有的所述第一比值均大于预设比值时,将所述目标数据点标记为异常数据点;
22.反之,筛选出所述第一比值小于等于预设比值的数据点,并生成第二数据点集合,获取所述目标数据点与第二数据点集合中每个数据点的序数属性;
23.分别计算所述目标数据点的序数属性与所述第二数据点集合中除所述目标数据点外的其他数据点的序数属性的第二距离,得到若干个第二距离,并筛选出最大的第二距离,分别计算若干个第二距离与所述最大的第二距离的第二比值,得到若干个第二比值,根据所述若干个第二比值得到所述目标数据点与第二数据点集合的距离分布,根据所述距离分布确定置信区间,并分别判断若干个第二比值是否在所述置信区间内,筛选出所述第二比值不在所述置信区间内的数据点,并标记为异常数据点;
24.修复模块,用于:
25.将所述第一数据点集合中的每个数据点全部执行上述步骤,得到若干个异常数据点,获取所述异常数据点的属性信息;所述属性信息包括类型、长度;
26.根据所述异常数据点的属性信息及所述异常数据点在所述第一数据点集合中的位置关系,确定修复数据组;所述修复数据组为由异常数据点及与异常数据点相关联的正常数据点构成;
27.确定修复数据组中正常数据点与异常数据点的关联关系,根据所述关联关系对异常数据点进行修复处理,得到预处理后的待分析数据。
28.进一步地,所述模型训练模块包括:
29.采集模块,用于采集历史证券行情数据;
30.分割模块,用于根据预设时间序列对所述历史证券行情数据进行数据分割处理,得到若干个子历史证券行情数据;
31.处理模块,用于:
32.分别获取每个子历史证券行情数据中包括的最后一个交易日,得到若干个最后一个交易日,分别获取每个最后一个交易日的下一个交易日的证券涨跌值,并作为每个子历史证券行情数据对应的证券涨跌值;
33.分别对每个子历史证券行情数据进行归一化处理;
34.将归一化处理后的子历史证券行情数据作为输入值,与其对应的证券涨跌值作为理想输出值,并生成样本集;所述样本集包括若干个样本对,每个样本对包括一个输入值及一个理想输出值;
35.将所述样本集中连续三个样本对分为一组,得到若干组样本对,根据所述若干组样本对生成循环训练队列;
36.第三控制模块,用于:
37.获取所述循环训练队列包括的第一组样本对;所述第一组样本对包括第一样本
对、第二样本对及第三样本对;
38.将所述第一样本对中包括的输入值输入证券行情分析模型中,输出对应的第一输出值,根据所述第一输出值与所述第一组样本对中包括的理想输出值计算得到第一训练误差;
39.将所述第二样本对与所述第三样本对执行与所述第一样本对相同的操作,得到与所述第二样本对对应的第二训练误差及与所述第三样本对对应的第三训练误差;
40.判断所述第一训练误差、第二训练误差及所述第三训练误差是否均小于预设训练误差,在确定所述第一训练误差、第二训练误差及所述第三训练误差均小于预设训练误差时,得到训练好的证券行情分析模型;
41.反之,对所述证券行情分析模型的模型参数进行调节处理;
42.根据循环训练队列中包括的除第一样本对外的其他组样本对继续对模型参数进行调节处理后的证券行情分析模型进行循环训练,直至第m组样本对包括的三个样本对的训练误差均小于预设训练误差时,得到训练好的证券行情分析模型。
43.进一步地,所述数据预处理模块还用于在所述分割模块根据预设时间序列对所述历史证券行情数据进行数据分割处理前,对所述历史证券行情数据进行预处理。
44.进一步地,还包括:
45.数据加密模块,用于对所述数据压缩包进行加密处理。
46.本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。
附图说明
47.附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
48.图1为根据本发明第一实施例的一种证券行情分析系统的框图;
49.图2为根据本发明第二实施例的一种证券行情分析系统的框图;
50.图3为根据本发明第三实施例的一种证券行情分析系统的框图。
具体实施方式
51.以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
52.下面参考图1至图3来描述本发明实施例提出的一种证券行情分析系统。
53.如图1所示,一种证券行情分析系统,包括:
54.模型训练模块,用于获取样本集,根据所述样本集对构建的证券行情分析模型进行训练,得到训练好的证券行情分析模型;
55.获取模块,用于获取待分析数据;
56.第一控制模块,用于将所述待分析数据输入训练好的证券行情分析模型中,输出预测的证券涨跌信息。
57.上述方案的工作原理:模型训练模块用于获取样本集,根据所述样本集对构建的
证券行情分析模型进行训练,得到训练好的证券行情分析模型;获取模块用于获取待分析数据;所述待分析数据为当前交易日的前预设个交易日的证券行情数据;第一控制模块用于将所述待分析数据输入训练好的证券行情分析模型中,输出预测的证券涨跌信息。
58.上述方案的有益效果:全自动的对证券市场的行情数据进行分析并进行预测,减少人力成本,提高最后预测结果的精确性,使得客户能够根据预测所得的证券涨跌信息及时避免投资亏损。
59.根据本发明的一些实施例,所述将所述待分析数据输入训练好的证券行情分析模型中前,还包括对所述待分析数据进行归一化处理。
60.上述方案的工作原理:所述将所述待分析数据输入训练好的证券行情分析模型中前,还包括对所述待分析数据进行归一化处理。
61.上述方案的有益效果:对所述待分析数据进行归一化处理,使得最终输出的证券涨跌信息更加的精确。
62.根据本发明的一些实施例,所述证券行情数据包括成交额数据、成交量数据及成交日期。
63.上述方案的工作原理及有益效果:所述证券行情数据包括成交额数据、成交量数据及成交日期。
64.根据本发明的一些实施例,还包括:
65.打包模块,用于将所述待分析数据与其对应的证券涨跌信息进行打包处理,得到数据包;
66.数据压缩模块,用于对所述数据包进行压缩处理,得到数据压缩包并进行存储。
67.上述方案的工作原理:打包模块,用于将所述待分析数据与其对应的证券涨跌信息进行打包处理,得到数据包;数据压缩模块,用于对所述数据包进行压缩处理,得到数据压缩包并进行存储。
68.上述方案的有益效果:将待分析数据与其对应的证券涨跌信息进行打包处理,得到数据包并进行压缩存储处理,方面后续对模型参数的训练。
69.根据本发明的一些实施例,所述数据压缩模块包括:
70.计算模块,用于计算所述数据压缩包的压缩评估值;
71.第二控制模块,用于判断所述压缩评估值是否小于预设压缩评估值,在确定所述压缩评估值小于预设压缩评估值时,对所述数据包重新进行压缩处理。
72.上述方案的工作原理:计算模块,用于计算所述数据压缩包的压缩评估值;第二控制模块,用于判断所述压缩评估值是否小于预设压缩评估值,在确定所述压缩评估值小于预设压缩评估值时,对所述数据包重新进行压缩处理。
73.上述方案的有益效果:在对数据包进行压缩的过程中,可能会因为种种原因导致数据压缩包出现乱码的情况等,因此计算所述数据压缩包的压缩评估值是必要的,在确定所述压缩评估值小于预设压缩评估值时,对所述数据包重新进行压缩处理,进而保证数据压缩包的精确性。
74.根据本发明的一些实施例,还包括:
75.数据预处理模块,用于在所述第一控制模块将所述待分析数据输入训练好的证券行情分析模型中前,对所述待分析数据进行预处理。
76.上述方案的工作原理:数据预处理模块,用于在所述第一控制模块将所述待分析数据输入训练好的证券行情分析模型中前,对所述待分析数据进行预处理。
77.上述方案的有益效果:因待分析数据在获取过程中可能会受到外界因素各种各样的影响,会导致乱码,因此对所述待分析数据进行预处理进而保证待分析数据的精确性是必要的。
78.根据本发明的一些实施例,所述数据预处理模块包括:
79.标记模块,用于:
80.获取所述待分析数据中包括的若干个数据点,得到第一数据点集合,获取第一数据点集合中每个数据点的标称属性,并从所述第一数据点集合中随机选取一个数据点,作为目标数据点;
81.分别计算所述目标数据点的标称属性与所述第一数据点集合中除所述目标数据点外的其他数据点的标称属性的第一距离,得到若干个第一距离,并筛选出最大的第一距离,分别计算若干个第一距离与所述最大的第一距离的第一比值,并判断是否大于预设比值,在确定所有的所述第一比值均大于预设比值时,将所述目标数据点标记为异常数据点;
82.反之,筛选出所述第一比值小于等于预设比值的数据点,并生成第二数据点集合,获取所述目标数据点与第二数据点集合中每个数据点的序数属性;
83.分别计算所述目标数据点的序数属性与所述第二数据点集合中除所述目标数据点外的其他数据点的序数属性的第二距离,得到若干个第二距离,并筛选出最大的第二距离,分别计算若干个第二距离与所述最大的第二距离的第二比值,得到若干个第二比值,根据所述若干个第二比值得到所述目标数据点与第二数据点集合的距离分布,根据所述距离分布确定置信区间,并分别判断若干个第二比值是否在所述置信区间内,筛选出所述第二比值不在所述置信区间内的数据点,并标记为异常数据点;
84.修复模块,用于:
85.将所述第一数据点集合中的每个数据点全部执行上述步骤,得到若干个异常数据点,获取所述异常数据点的属性信息;所述属性信息包括类型、长度;
86.根据所述异常数据点的属性信息及所述异常数据点在所述第一数据点集合中的位置关系,确定修复数据组;所述修复数据组为由异常数据点及与异常数据点相关联的正常数据点构成;
87.确定修复数据组中正常数据点与异常数据点的关联关系,根据所述关联关系对异常数据点进行修复处理,得到预处理后的待分析数据。
88.根据本发明的一些实施例,所述数据预处理模块包括:
89.标记模块,用于获取所述待分析数据中包括的若干个数据点,得到第一数据点集合,获取第一数据点集合中每个数据点的标称属性,并从所述第一数据点集合中随机选取一个数据点,作为目标数据点;分别计算所述目标数据点的标称属性与所述第一数据点集合中除所述目标数据点外的其他数据点的标称属性的第一距离,得到若干个第一距离,并筛选出最大的第一距离,分别计算若干个第一距离与所述最大的第一距离的第一比值,并判断是否大于预设比值,在确定所有的所述第一比值均大于预设比值时,将所述目标数据点标记为异常数据点;反之,筛选出所述第一比值小于等于预设比值的数据点,并生成第二数据点集合,获取所述目标数据点与第二数据点集合中每个数据点的序数属性;分别计算
所述目标数据点的序数属性与所述第二数据点集合中除所述目标数据点外的其他数据点的序数属性的第二距离,得到若干个第二距离,并筛选出最大的第二距离,分别计算若干个第二距离与所述最大的第二距离的第二比值,得到若干个第二比值,根据所述若干个第二比值得到所述目标数据点与第二数据点集合的距离分布,根据所述距离分布确定置信区间,示例的,若目标数据点为a,第二数据点集合中包括数据点b、c、d、e、f五个数据点,统计得到所述目标数据点与第二数据点集合的距离分布的正态分布,给定的显著性水平为0.0026,可利用3-sigma原则计算出所述距离分布的置信区间为(0.04,0.16);并分别判断若干个第二比值是否在所述置信区间内,筛选出所述第二比值不在所述置信区间内的数据点,并标记为异常数据点;修复模块,用于:将所述第一数据点集合中的每个数据点全部执行上述步骤,得到若干个异常数据点,获取所述异常数据点的属性信息;所述属性信息包括类型、长度;根据所述异常数据点的属性信息及所述异常数据点在所述第一数据点集合中的位置关系,确定修复数据组;所述修复数据组为由异常数据点及与异常数据点相关联的正常数据点构成;确定修复数据组中正常数据点与异常数据点的关联关系,根据所述关联关系对异常数据点进行修复处理,得到预处理后的待分析数据;根据所述异常数据点的属性信息及所述异常数据点在所述第一数据点集合中的位置关系,确定修复数据组,包括基于属性信息确定修复数据组包括的数据点的数量;根据所述异常数据点在所述第一数据点集合中的位置关系,确定选取数据点的方向。设数据点的数量为l,如所述异常数据点处于最左端,向右侧取l;如所述异常数据点处于最右左端,向左侧取l;如所述异常数据点位于中间时,向左右两侧各取2/l;若所述异常数据点位于左侧取不到2/l时,取所述异常数据点位于左侧的最大值;若所述异常数据点位于右侧取不到2/l时,取所述异常数据点位于右侧的最大值。
90.上述方案的有益效果:因待分析数据在获取过程中可能会受到外界因素各种各样的影响,会导致乱码,从而产生大量的异常数据点,若不精确的检测出这些异常数据点进而进行修复处理,会使得最终预测的证券涨跌信息不精确,因此对待分析数据进行异常数据检测及异常数据修复是必要的,本方案提供了数据检测及数据修复的具体步骤,具有全自动、速度快、精确度高的优点;通过标称属性确定第一数据多点集合后,即目标数据点的近邻点集合,利用统计学思想且根据序数属性检测近邻点集合中的异常近邻点,遍历所有的数据点,将异常近邻点检测结果进行聚合操作,检测得到最终的异常数据点,提高了异常数据点的检测的精确度,且该方法的实施过程较为简便,使得预处理后的待分析数据更加的清晰、精确,进而提高最终预测证券涨跌信息的准确性,,使得客户能够根据预测所得的证券涨跌信息及时避免投资亏损。
91.根据本发明的一些实施例,所述模型训练模块包括:
92.采集模块,用于采集历史证券行情数据;
93.分割模块,用于根据预设时间序列对所述历史证券行情数据进行数据分割处理,得到若干个子历史证券行情数据;
94.处理模块,用于:
95.分别获取每个子历史证券行情数据中包括的最后一个交易日,得到若干个最后一个交易日,分别获取每个最后一个交易日的下一个交易日的证券涨跌值,并作为每个子历史证券行情数据对应的证券涨跌值;
96.分别对每个子历史证券行情数据进行归一化处理;
97.将归一化处理后的子历史证券行情数据作为输入值,与其对应的证券涨跌值作为理想输出值,并生成样本集;所述样本集包括若干个样本对,每个样本对包括一个输入值及一个理想输出值;
98.将所述样本集中连续三个样本对分为一组,得到若干组样本对,根据所述若干组样本对生成循环训练队列;
99.第三控制模块,用于:
100.获取所述循环训练队列包括的第一组样本对;所述第一组样本对包括第一样本对、第二样本对及第三样本对;
101.将所述第一样本对中包括的输入值输入证券行情分析模型中,输出对应的第一输出值,根据所述第一输出值与所述第一组样本对中包括的理想输出值计算得到第一训练误差;
102.将所述第二样本对与所述第三样本对执行与所述第一样本对相同的操作,得到与所述第二样本对对应的第二训练误差及与所述第三样本对对应的第三训练误差;
103.判断所述第一训练误差、第二训练误差及所述第三训练误差是否均小于预设训练误差,在确定所述第一训练误差、第二训练误差及所述第三训练误差均小于预设训练误差时,得到训练好的证券行情分析模型;
104.反之,对所述证券行情分析模型的模型参数进行调节处理;
105.根据循环训练队列中包括的除第一样本对外的其他组样本对继续对模型参数进行调节处理后的证券行情分析模型进行循环训练,直至第m组样本对包括的三个样本对的训练误差均小于预设训练误差时,得到训练好的证券行情分析模型。
106.上述方案的工作原理:采集模块用于采集历史证券行情数据;分割模块用于根据预设时间序列对所述历史证券行情数据进行数据分割处理,得到若干个子历史证券行情数据;处理模块,用于分别获取每个子历史证券行情数据中包括的最后一个交易日,得到若干个最后一个交易日,分别获取每个最后一个交易日的下一个交易日的证券涨跌值,并作为每个子历史证券行情数据对应的证券涨跌值;分别对每个子历史证券行情数据进行归一化处理;将归一化处理后的子历史证券行情数据作为输入值,与其对应的证券涨跌值作为理想输出值,并生成样本集;所述样本集包括若干个样本对,每个样本对包括一个输入值及一个理想输出值;将所述样本集中连续三个样本对分为一组,得到若干组样本对,根据所述若干组样本对生成循环训练队列;第三控制模块,用于获取所述循环训练队列包括的第一组样本对;所述第一组样本对包括第一样本对、第二样本对及第三样本对;将所述第一样本对中包括的输入值输入证券行情分析模型中,输出对应的第一输出值,根据所述第一输出值与所述第一组样本对中包括的理想输出值计算得到第一训练误差;将所述第二样本对与所述第三样本对执行与所述第一样本对相同的操作,得到与所述第二样本对对应的第二训练误差及与所述第三样本对对应的第三训练误差;判断所述第一训练误差、第二训练误差及所述第三训练误差是否均小于预设训练误差,在确定所述第一训练误差、第二训练误差及所述第三训练误差均小于预设训练误差时,得到训练好的证券行情分析模型;反之,对所述证券行情分析模型的模型参数进行调节处理;根据循环训练队列中包括的除第一样本对外的其他组样本对继续对模型参数进行调节处理后的证券行情分析模型进行循环训练,直至
第m组样本对包括的三个样本对的训练误差均小于预设训练误差时,得到训练好的证券行情分析模型。
107.上述方案的有益效果:上述方案具体的描述了训练模型的具体过程,根据每个子历史证券行情数据及对应的证券涨跌值进行训练,在m组样本对包括的三个样本对的训练误差均小于预设训练误差时,得到训练好的证券行情分析模型;使得训练好证券行情分析模型更加的精确,进而提高最后证券行情分析的准确度,从而可以为投资者调整投资策略时提供帮助,能够根据预测所得的证券涨跌趋势及时避免投资亏损。
108.根据本发明的一些实施例,还包括:
109.数据加密模块,用于对所述数据压缩包进行加密处理。
110.上述方案的工作原理:数据加密模块用于对所述数据压缩包进行加密处理。
111.上述方案的有益效果:对数据压缩包进行加密处理,保证数据压缩包的安全性,避免数据压缩包被不法分子盗取。
112.根据本发明的一些实施例,所述计算所述数据压缩包的压缩评估值,包括:
113.计算所述数据包与所述数据压缩包的相差系数k,如公式(1)所示:
[0114][0115]
其中,si为所述数据包中的第i个子数据包;wi为所述数据压缩包中的第i个子数据压缩包;n为所述数据包中包括的子数据包的数量,也为所述数据压缩包中包括的子数据压缩包的数量,且所述数据包中包括的子数据包的数量与所述数据压缩包中包括的子数据压缩包的数量相同;
[0116]
根据所述数据包与所述数据压缩包的相差系数k,计算所述数据压缩包的压缩评估值ζ,如公式(2)所示:
[0117][0118]
其中,q1为所述数据包的大小;q2为所述数据压缩包的大小。
[0119]
上述方案的工作原理及有益效果:在计算所述数据压缩包的压缩评估值时,考虑所述数据包的大小、所述数据压缩包的大小及所述数据压缩包的相差系数等因素,使得计算出来的压缩评估值更加的精确,提高判断所述压缩评估值与预设压缩评估值大小的准确性,便于在所述压缩评估值小于预设压缩评估值时,对所述数据包重新压缩处理,进而保证数据压缩包的精确性。
[0120]
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
技术特征:
1.一种证券行情分析系统,其特征在于,包括:模型训练模块,用于获取样本集,根据所述样本集对构建的证券行情分析模型进行训练,得到训练好的证券行情分析模型;获取模块,用于获取待分析数据;第一控制模块,用于将所述待分析数据输入训练好的证券行情分析模型中,输出预测的证券涨跌信息。2.根据权利要求1所述的证券行情分析系统,其特征在于,所述将所述待分析数据输入训练好的证券行情分析模型中前,还包括对所述待分析数据进行归一化处理。3.根据权利要求1所述的证券行情分析系统,其特征在于,所述证券行情数据包括成交额数据、成交量数据及成交日期。4.根据权利要求1所述的证券行情分析系统,其特征在于,还包括:打包模块,用于将所述待分析数据与其对应的证券涨跌信息进行打包处理,得到数据包;数据压缩模块,用于对所述数据包进行压缩处理,得到数据压缩包并进行存储。5.根据权利要求4所述的证券行情分析系统,其特征在于,所述数据压缩模块包括:计算模块,用于计算所述数据压缩包的压缩评估值;第二控制模块,用于判断所述压缩评估值是否小于预设压缩评估值,在确定所述压缩评估值小于预设压缩评估值时,对所述数据包重新进行压缩处理。6.根据权利要求1所述的证券行情分析系统,其特征在于,还包括:数据预处理模块,用于在所述第一控制模块将所述待分析数据输入训练好的证券行情分析模型中前,对所述待分析数据进行预处理。7.根据权利要求6所述的证券行情分析系统,其特征在于,所述数据预处理模块包括:标记模块,用于:获取所述待分析数据中包括的若干个数据点,得到第一数据点集合,获取第一数据点集合中每个数据点的标称属性,并从所述第一数据点集合中随机选取一个数据点,作为目标数据点;分别计算所述目标数据点的标称属性与所述第一数据点集合中除所述目标数据点外的其他数据点的标称属性的第一距离,得到若干个第一距离,并筛选出最大的第一距离,分别计算若干个第一距离与所述最大的第一距离的第一比值,并判断是否大于预设比值,在确定所有的所述第一比值均大于预设比值时,将所述目标数据点标记为异常数据点;反之,筛选出所述第一比值小于等于预设比值的数据点,并生成第二数据点集合,获取所述目标数据点与第二数据点集合中每个数据点的序数属性;分别计算所述目标数据点的序数属性与所述第二数据点集合中除所述目标数据点外的其他数据点的序数属性的第二距离,得到若干个第二距离,并筛选出最大的第二距离,分别计算若干个第二距离与所述最大的第二距离的第二比值,得到若干个第二比值,根据所述若干个第二比值得到所述目标数据点与第二数据点集合的距离分布,根据所述距离分布确定置信区间,并分别判断若干个第二比值是否在所述置信区间内,筛选出所述第二比值不在所述置信区间内的数据点,并标记为异常数据点;修复模块,用于:
将所述第一数据点集合中的每个数据点全部执行上述步骤,得到若干个异常数据点,获取所述异常数据点的属性信息;所述属性信息包括类型、长度;根据所述异常数据点的属性信息及所述异常数据点在所述第一数据点集合中的位置关系,确定修复数据组;所述修复数据组为由异常数据点及与异常数据点相关联的正常数据点构成;确定修复数据组中正常数据点与异常数据点的关联关系,根据所述关联关系对异常数据点进行修复处理,得到预处理后的待分析数据。8.根据权利要求1所述的证券行情分析系统,其特征在于,所述模型训练模块包括:采集模块,用于采集历史证券行情数据;分割模块,用于根据预设时间序列对所述历史证券行情数据进行数据分割处理,得到若干个子历史证券行情数据;处理模块,用于:分别获取每个子历史证券行情数据中包括的最后一个交易日,得到若干个最后一个交易日,分别获取每个最后一个交易日的下一个交易日的证券涨跌值,并作为每个子历史证券行情数据对应的证券涨跌值;分别对每个子历史证券行情数据进行归一化处理;将归一化处理后的子历史证券行情数据作为输入值,与其对应的证券涨跌值作为理想输出值,并生成样本集;所述样本集包括若干个样本对,每个样本对包括一个输入值及一个理想输出值;将所述样本集中连续三个样本对分为一组,得到若干组样本对,根据所述若干组样本对生成循环训练队列;第三控制模块,用于:获取所述循环训练队列包括的第一组样本对;所述第一组样本对包括第一样本对、第二样本对及第三样本对;将所述第一样本对中包括的输入值输入证券行情分析模型中,输出对应的第一输出值,根据所述第一输出值与所述第一组样本对中包括的理想输出值计算得到第一训练误差;将所述第二样本对与所述第三样本对执行与所述第一样本对相同的操作,得到与所述第二样本对对应的第二训练误差及与所述第三样本对对应的第三训练误差;判断所述第一训练误差、第二训练误差及所述第三训练误差是否均小于预设训练误差,在确定所述第一训练误差、第二训练误差及所述第三训练误差均小于预设训练误差时,得到训练好的证券行情分析模型;反之,对所述证券行情分析模型的模型参数进行调节处理;根据循环训练队列中包括的除第一样本对外的其他组样本对继续对模型参数进行调节处理后的证券行情分析模型进行循环训练,直至第m组样本对包括的三个样本对的训练误差均小于预设训练误差时,得到训练好的证券行情分析模型。9.根据权利要求6所述的证券行情分析系统,其特征在于,所述数据预处理模块还用于在所述分割模块根据预设时间序列对所述历史证券行情数据进行数据分割处理前,对所述历史证券行情数据进行预处理。
10.根据权利要求4所述的证券行情分析系统,其特征在于,还包括:数据加密模块,用于对所述数据压缩包进行加密处理。
技术总结
本发明公开了一种证券行情分析系统,包括模型训练模块用于获取样本集,根据所述样本集对构建的证券行情分析模型进行训练,得到训练好的证券行情分析模型;获取模块用于获取待分析数据;第一控制模块用于将所述待分析数据输入训练好的证券行情分析模型中,输出预测的证券涨跌信息。有益效果:全自动的对证券市场的行情数据进行分析并进行预测,减少人力成本,提高最后预测结果的精确性,使得客户能够根据预测所得的证券涨跌信息及时避免投资亏损。预测所得的证券涨跌信息及时避免投资亏损。预测所得的证券涨跌信息及时避免投资亏损。
技术研发人员:邬波 江益明 李晓军 杨健
受保护的技术使用者:江苏雪舟教育科技有限公司
技术研发日:2021.12.09
技术公布日:2022/3/8