基于多源数据时空关联的房地产市场热度指数预测方法与流程

专利查询15天前  11


本发明涉及房地产领域,尤其涉及一种基于多源数据时空关联的房地产市场热度指数预测方法。


背景技术:

1、房地产市场是经济增长的支柱产业,其发展带动了建筑业、工业、商业和运输业等国民经济基本行业的繁荣发展。但是,一旦房地产市场在发展中出现秩序混乱、结构失衡等问题,也将威胁着宏观经济的健康发展。

2、为了及时掌握房地产的情况,通常会将房地产市场热度作为表征当前房地产市场各项指标增长速度的描述。一旦能够对房地产市场热度情况做出准确预测,将有利于对房地产市场情况的掌握。

3、不过,现有的房地产市场热度指数预测方法存在不足:由于房地产市场热度会受到多种因素以及该多种因素之间的相互影响,而现有的房地产市场热度指数预测方法则通常是基于单一指标作为依据,无法形成系统性的表征房地产市场规律特征的多源指标体系,导致难以更加全面准确地预测得到房地产市场热度指数情况。


技术实现思路

1、本发明所要解决的技术问题是针对上述现有技术提供一种基于多源数据时空关联的房地产市场热度指数预测方法。

2、本发明解决上述技术问题所采用的技术方案为:基于多源数据时空关联的房地产市场热度指数预测方法,其特征在于,包括如下步骤:

3、步骤1,预先形成表征城市房地产市场规律的多源指标体系;其中,该多源指标体系包括城市内的新房交易价格、新房销售交易量、二手房交易价格、二手房销售交易量、土地交易价格、土地出让面积、房屋租赁交易价格以及市场情绪值,市场情绪值根据与城市内房地产市场相关的新闻文本数据处理得到;城市为国家行政区域内的直辖市或者地级市;

4、步骤2,根据多源指标体系获取国家行政区域内所有城市的多源指标数据集合,且对该多源指标数据集合做针对异常数据删除的预处理,得到预处理后多源指标数据集合;

5、其中,多源指标数据集合内的指标类型与多源指标体系内的指标类型一一对应,多源指标数据集合包括不同城市在不同时刻所对应的各指标数据;预处理后多源指标数据集合标记为x,x={xi,p(t)};xi,p(t)为预处理后多源指标数据集合x内第p个城市的第i个指标数据xi在时刻t的预处理后数值,1≤p≤m,1≤i≤n;m为国家行政区域内所有城市的总数量,n为多源指标体系内指标数据类型的总数量;

6、步骤3,对预处理后多源指标数据集合内各预处理后数据均做归一化处理,得到归一化处理后多源指标数据集合,并计算该归一化处理后多源指标数据集合内各指标数据自身在不同时刻所占的指标权重以及各指标数据的熵值;

7、步骤4,根据所得各指标数据的熵值分别计算每一个指标数据的差异系数以及对应的权重值,并基于所得各权重值分别对应计算每个城市的房地产热度指数;

8、步骤5,计算国家行政区域内所有城市各自在不同时刻的房地产热度指数,并基于所得各房地产热度指数分别对应得到各城市在预设时间段内的房地产热度对数变化率;

9、步骤6,根据所得各城市的房地产热度对数变化率,计算表征国家行政区域内所有城市的房地产热度指数在不同时刻的交叉关联矩阵;

10、步骤7,对交叉关联矩阵进行随机分解处理得到分解处理后的矩阵元,且对该分解处理后的矩阵元做去噪处理,得到去噪后交叉关联矩阵;

11、步骤8,基于所得去噪后交叉关联矩阵,构建该去噪后交叉关联矩阵的平面最大过滤图,且将该平面最大过滤图作为表征国家行政区域内所有城市之间相互关联作用的房地产热度关联网络;

12、步骤9,将所得房地产热度关联网络和国家行政区域内各城市房地产热度指数时间序列作为输入,输入到时间图卷积网络中处理,并将该时间图卷积网络处理后的输出结果作为国家行政区域内各城市的房地产市场热度指数预测值。

13、改进地,在所述基于多源数据时空关联的房地产市场热度指数预测方法中,所述异常数据包括重复数据、缺失数据和删除异常数据。

14、进一步地,在所述基于多源数据时空关联的房地产市场热度指数预测方法中,在步骤3中,归一化处理以得到所述归一化处理后多源指标数据集合的方式如下:

15、

16、其中,所述归一化处理后多源指标数据集合标记为x,x={xi,p(t)};xi,p(t)表示第p个城市的第i个指标数据xi,p在时刻t的归一化处理后数据数值,max(xi,p)表示第i个指标数据xi,p在预处理后指标数据集合x内的最大预处理后数据数值,min(xi,p)表示第p个城市的第i个指标数据xi,p在预处理后指标数据集合x内的最小预处理后数据数值。

17、改进地,在所述基于多源数据时空关联的房地产市场热度指数预测方法中,在步骤3中,所述各指标数据自身在不同时刻所占的指标权重以及各指标数据的熵值计算方式分别如下:

18、

19、其中,ui,p(t)为第p个城市的第i个指标数据xi,p自身在时刻t下所占的指标权重;为归一化处理后数值xi,p(t)的自增值处理后指标数据数值,△i为无限接近零的正数;

20、

21、其中,ei,p为第p个城市的第i个指标数据的熵值;表示第p个城市的第i个指标数据xi,p自身在时间段[t1,tm]内所对应指标权重的总数量。

22、再改进,在所述基于多源数据时空关联的房地产市场热度指数预测方法中,在步骤4中,每一个指标数据的差异系数以及每个城市的房地产热度指数计算方式分别如下:

23、gi,p=1-ei,p;

24、

25、其中,gi,p为第p个城市的第i个指标数据xi,p的差异系数,wi,p为第p个城市的第i个指标数据xi,p的权重值;sp(t)为第p个城市在时刻t的房地产热度指数。

26、进一步地,在所述基于多源数据时空关联的房地产市场热度指数预测方法中,在步骤5中,所述城市在预设时间段内的房地产热度对数变化率计算方式如下:

27、

28、hp(t)=lnsp(t+△t)-lnsp(t);1≤p≤m;

29、其中,hp(t)表示第p个城市在预设时间段△t内的房地产热度对数变化率,<hp(t)表示第p个城市在预设时间段△t内所得房地产热度指数之和的平均值,σp为第p个城市在预设时间段△t内所得房地产热度指数的标准差;预设时间段为一天的倍数。

30、再改进,在所述基于多源数据时空关联的房地产市场热度指数预测方法中,在步骤6中,所述交叉关联矩阵的计算方式如下:

31、cpq=<hp(t)·hq(t)>;1≤q≤m;

32、其中,所述交叉关联矩阵标记为c,该交叉关联矩阵c是一个实对称矩阵,实对称矩阵对角上的各矩阵元均为1,该实对称矩阵内非对角上的矩阵元取值范围为[-1,1];cpq为交叉关联矩阵c的一个矩阵元,矩阵元cpq表示城市p和城市q之间针对房地产热度关联效应的强弱值,hq(t)示第q个城市在预设时间段△t内的房地产热度对数变化率。

33、进一步地,在所述基于多源数据时空关联的房地产市场热度指数预测方法中,在步骤7中,处理得到所述分解处理后的矩阵元的方式如下:

34、

35、其中,λα代表矩阵元cpq的第α个特征值,k为第α个特征值所对应特征向量中的元素总数量,表示第α个特征值所对应特征向量中的第p个元素;表示第α个特征值所对应特征向量中的第q个元素;表征第p个元素与第q个元素在第α个特征值所对应特征向量下的交叉关联值;

36、在步骤7中,处理得到所述去噪后交叉关联矩阵的方式如下:

37、

38、其中,pr(λ)为特征值λ的概率分布函数,为特征值λ的最大值,为特征值λ的最小值,t为随机时间序列的长度,n为长度是t的随机时间序列总数量。

39、更进一步地,在所述基于多源数据时空关联的房地产市场热度指数预测方法中,在步骤9中,所述国家行政区域内各城市的房地产市场热度指数预测值的获取方式如下:

40、f(x,a)=σ(relu(a*xw0)w1);且f(x,a)∈rn×t';

41、w0∈rp×h;w1∈rh×t';

42、其中,f(x,a)表示时间图卷积网络gcn在输入为x和a时的输出,x是特征矩阵,a是作为邻接矩阵的所述房地产热度关联网络,a*表示邻接矩阵a的预处理后矩阵;w0表示从输入层到隐藏层的权重矩阵,p是特征矩阵x的长度,h是隐藏层中的隐藏单元数量;w1表示从隐藏层到输出层的权重矩阵,t'表示预测长度,σ表示激活函数,relu表示时间图卷积网络gcn中的非线性激活函数。

43、与现有技术相比,本发明的优点在于:该发明的基于多源数据时空关联的房地产市场热度指数预测方法通过形成多源指标体系以全面地刻画房地产市场主体的投资意愿和对市场走势的预期,并基于多源指标体系获取国家行政区域内所有城市的多源指标数据集合及预处理后多源指标数据集合,再对预处理后多源指标数据集合归一化处理、不同指标权重计算、不同指标数据的熵值计算及指标数据差异系数和指标数据权重值的计算,进而再计算每个城市的房地产热度指数以及房地产热度对数变化率,再基于各城市的房地产热度对数变化率计算表征国家行政区域内所有城市的房地产热度指数在不同时刻的交叉关联矩阵,并得到针对该交叉关联矩阵的去噪后交叉关联矩阵,进而将该去噪后交叉关联矩阵所得平面最大过滤图作为房地产热度关联网络,将房地产热度关联网络和国家行政区域内各城市房地产热度指数时间序列输入到时间图卷积网络中处理,并将该时间图卷积网络处理后的输出结果作为国家行政区域内各城市的房地产市场热度指数预测值,实现了利用时间图卷积网络捕捉不同城市房地产市场在空间和时间上的依赖性,从而考虑了周边相邻城市对目标城市房地产市场的影响,使得对不同城市房地产市场热度指数的预测更加全面和准确。


技术特征:

1.基于多源数据时空关联的房地产市场热度指数预测方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于多源数据时空关联的房地产市场热度指数预测方法,其特征在于,所述异常数据包括重复数据、缺失数据和删除异常数据。

3.根据权利要求2所述的基于多源数据时空关联的房地产市场热度指数预测方法,其特征在于,在步骤3中,归一化处理以得到所述归一化处理后多源指标数据集合的方式如下:

4.根据权利要求3所述的基于多源数据时空关联的房地产市场热度指数预测方法,其特征在于,在步骤3中,所述各指标数据自身在不同时刻所占的指标权重以及各指标数据的熵值计算方式分别如下:

5.根据权利要求4所述的基于多源数据时空关联的房地产市场热度指数预测方法,其特征在于,在步骤4中,每一个指标数据的差异系数以及每个城市的房地产热度指数计算方式分别如下:

6.根据权利要求5所述的基于多源数据时空关联的房地产市场热度指数预测方法,其特征在于,在步骤5中,所述城市在预设时间段内的房地产热度对数变化率计算方式如下:

7.根据权利要求6所述的基于多源数据时空关联的房地产市场热度指数预测方法,其特征在于,在步骤6中,所述交叉关联矩阵的计算方式如下:

8.根据权利要求7所述的基于多源数据时空关联的房地产市场热度指数预测方法,其特征在于,在步骤7中,处理得到所述分解处理后的矩阵元的方式如下:

9.根据权利要求8所述的基于多源数据时空关联的房地产市场热度指数预测方法,其特征在于,在步骤9中,所述国家行政区域内各城市的房地产市场热度指数预测值的获取方式如下:


技术总结
本发明涉及一种基于多源数据时空关联的房地产市场热度指数预测方法,通过预先形成表征城市房地产市场规律的多源指标体系,得到国家行政区域内所有城市的预处理后多源指标数据集合、每个城市的房地产热度指数及房地产热度对数变化率,计算房地产热度指数在不同时刻的去噪后交叉关联矩阵,将该去噪后交叉关联矩阵所得平面最大过滤图作为房地产热度关联网络,将房地产热度关联网络和国家行政区域内各城市房地产热度指数时间序列输入到时间图卷积网络处理,将该时间图卷积网络输出作为各城市房地产市场热度指数预测值,实现了利用时间图卷积网络捕捉不同城市房地产市场在空间和时间上的依赖性,更加全面准确预测了不同城市房地产市场热度指数。

技术研发人员:俞荐中,王晓东,朱锦辉,钟文军,董晓炜,张志强,张碧静,岑涛,蒋雄飞
受保护的技术使用者:宁波市自然资源和规划大数据中心
技术研发日:
技术公布日:2024/12/5

最新回复(0)