电力应急非结构化文档目录构建方法、装置、计算机设备、存储介质和计算机程序产品与流程

专利查询9小时前  4


本技术涉及电网,特别是涉及一种电力应急非结构化文档目录构建方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。


背景技术:

1、在电网领域中,对电力应急非结构化文档进行目录构建,对于实现快速获取文档中的关键信息,显得至关重要。

2、传统技术中,在对电力应急非结构化文档进行目录构建时,一般采用人工构建的方式;但是,这种方式容易耗费大量的时间和人力,导致电力应急非结构化文档目录的构建效率较低。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种能够提高电力应急非结构化文档目录的构建效率的电力应急非结构化文档目录构建方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

2、第一方面,本技术提供了一种电力应急非结构化文档目录构建方法,包括:

3、获取待处理电力应急非结构化文档;

4、将所述待处理电力应急非结构化文档和所述待处理电力应急非结构化文档中的关键词,输入至预先训练的标题信息预测模型,得到所述待处理电力应急非结构化文档各章节的标题信息;

5、根据所述各章节的标题信息,以及所述各章节的标题信息下的文本信息,确定所述各章节的标题信息对应的目标词向量;

6、根据所述各章节的标题信息对应的目标词向量,确定所述各章节的标题信息之间的层级关系;

7、根据所述各章节的标题信息,以及所述各章节的标题信息之间的层级关系,构建所述待处理电力应急非结构化文档对应的目录信息。

8、在其中一个实施例中,所述根据所述各章节的标题信息,以及所述各章节的标题信息下的文本信息,确定所述各章节的标题信息对应的目标词向量,包括:

9、对所述各章节的标题信息进行特征提取处理,得到所述各章节的标题信息对应的第一词向量,以及对所述各章节的标题信息下的文本信息进行特征提取处理,得到所述各章节的标题信息下的文本信息对应的第二词向量;

10、确定所述第一词向量对应的第一权重,以及所述第二词向量对应的第二权重;

11、根据所述第一权重和所述第二权重,对所述第一词向量和所述第二词向量进行融合处理,得到所述各章节的标题信息对应的目标词向量。

12、在其中一个实施例中,所述根据所述各章节的标题信息对应的目标词向量,确定所述各章节的标题信息之间的层级关系,包括:

13、根据所述各章节的标题信息对应的目标词向量,确定所述各章节的标题信息之间的相似度;

14、根据所述各章节的标题信息之间的相似度,确定所述各章节的标题信息之间的层级关系。

15、在其中一个实施例中,在根据所述各章节的标题信息,以及所述各章节的标题信息之间的层级关系,构建所述待处理电力应急非结构化文档对应的目录信息之后,还包括:

16、对所述目录信息进行验证,得到所述待处理电力应急非结构化文档对应的验证结果;

17、在所述验证结果满足预设条件的情况下,将所述目录信息作为所述待处理电力应急非结构化文档对应的目标目录信息。

18、在其中一个实施例中,在获取待处理电力应急非结构化文档之后,还包括:

19、对所述待处理电力应急非结构化文档进行预处理,得到预处理后电力应急非结构化文档;

20、所述将所述待处理电力应急非结构化文档和所述待处理电力应急非结构化文档中的关键词,输入至预先训练的标题信息预测模型,得到所述待处理电力应急非结构化文档各章节的标题信息,包括:

21、将所述预处理后电力应急非结构化文档和所述预处理后电力应急非结构化文档中的关键词,输入至预先训练的标题信息预测模型,得到所述待处理电力应急非结构化文档各章节的标题信息。

22、在其中一个实施例中,所述预先训练的标题信息预测模型,通过下述方式训练得到:

23、获取样本电力应急非结构化文档;

24、将所述样本电力应急非结构化文档和所述样本电力应急非结构化文档中的关键词,输入至待训练的标题信息预测模型,得到所述样本电力应急非结构化文档各章节的预测标题信息;

25、根据所述样本电力应急非结构化文档各章节的预测标题信息与实际标题信息之间的差异,对所述待训练的标题信息预测模型进行迭代训练,得到所述预先训练的标题信息预测模型。

26、第二方面,本技术还提供了一种电力应急非结构化文档目录构建装置,包括:

27、文档获取模块,用于获取待处理电力应急非结构化文档;

28、信息预测模块,用于将所述待处理电力应急非结构化文档和所述待处理电力应急非结构化文档中的关键词,输入至预先训练的标题信息预测模型,得到所述待处理电力应急非结构化文档各章节的标题信息;

29、向量确定模块,用于根据所述各章节的标题信息,以及所述各章节的标题信息下的文本信息,确定所述各章节的标题信息对应的目标词向量;

30、关系确定模块,用于根据所述各章节的标题信息对应的目标词向量,确定所述各章节的标题信息之间的层级关系;

31、目录构建模块,用于根据所述各章节的标题信息,以及所述各章节的标题信息之间的层级关系,构建所述待处理电力应急非结构化文档对应的目录信息。

32、第三方面,本技术还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:

33、获取待处理电力应急非结构化文档;

34、将所述待处理电力应急非结构化文档和所述待处理电力应急非结构化文档中的关键词,输入至预先训练的标题信息预测模型,得到所述待处理电力应急非结构化文档各章节的标题信息;

35、根据所述各章节的标题信息,以及所述各章节的标题信息下的文本信息,确定所述各章节的标题信息对应的目标词向量;

36、根据所述各章节的标题信息对应的目标词向量,确定所述各章节的标题信息之间的层级关系;

37、根据所述各章节的标题信息,以及所述各章节的标题信息之间的层级关系,构建所述待处理电力应急非结构化文档对应的目录信息。

38、第四方面,本技术还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:

39、获取待处理电力应急非结构化文档;

40、将所述待处理电力应急非结构化文档和所述待处理电力应急非结构化文档中的关键词,输入至预先训练的标题信息预测模型,得到所述待处理电力应急非结构化文档各章节的标题信息;

41、根据所述各章节的标题信息,以及所述各章节的标题信息下的文本信息,确定所述各章节的标题信息对应的目标词向量;

42、根据所述各章节的标题信息对应的目标词向量,确定所述各章节的标题信息之间的层级关系;

43、根据所述各章节的标题信息,以及所述各章节的标题信息之间的层级关系,构建所述待处理电力应急非结构化文档对应的目录信息。

44、第五方面,本技术还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:

45、获取待处理电力应急非结构化文档;

46、将所述待处理电力应急非结构化文档和所述待处理电力应急非结构化文档中的关键词,输入至预先训练的标题信息预测模型,得到所述待处理电力应急非结构化文档各章节的标题信息;

47、根据所述各章节的标题信息,以及所述各章节的标题信息下的文本信息,确定所述各章节的标题信息对应的目标词向量;

48、根据所述各章节的标题信息对应的目标词向量,确定所述各章节的标题信息之间的层级关系;

49、根据所述各章节的标题信息,以及所述各章节的标题信息之间的层级关系,构建所述待处理电力应急非结构化文档对应的目录信息。

50、上述电力应急非结构化文档目录构建方法、装置、计算机设备、存储介质和计算机程序产品,先获取待处理电力应急非结构化文档,再将待处理电力应急非结构化文档和待处理电力应急非结构化文档中的关键词,输入至预先训练的标题信息预测模型,得到待处理电力应急非结构化文档各章节的标题信息,接着,根据各章节的标题信息,以及各章节的标题信息下的文本信息,确定各章节的标题信息对应的目标词向量,然后,根据各章节的标题信息对应的目标词向量,确定各章节的标题信息之间的层级关系,最后,根据各章节的标题信息,以及各章节的标题信息之间的层级关系,构建待处理电力应急非结构化文档对应的目录信息。这样,在对电力应急非结构化文档进行目录构建时,通过预先训练的标题信息预测模型,可以快速得到待处理电力应急非结构化文档各章节的标题信息,结合各章节的标题信息之间的层级关系,从而可以快速构建待处理电力应急非结构化文档对应的目录信息,有利于提高电力应急非结构化文档目录的构建效率;而且,整个过程采用自动化的方式,无需人工干预,避免了采用人工构建的方式容易耗费大量的时间和人力,导致电力应急非结构化文档目录的构建效率较低的缺陷,进而提高了电力应急非结构化文档目录的构建效率。


技术特征:

1.一种电力应急非结构化文档目录构建方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述各章节的标题信息,以及所述各章节的标题信息下的文本信息,确定所述各章节的标题信息对应的目标词向量,包括:

3.根据权利要求1所述的方法,其特征在于,所述根据所述各章节的标题信息对应的目标词向量,确定所述各章节的标题信息之间的层级关系,包括:

4.根据权利要求1所述的方法,其特征在于,在根据所述各章节的标题信息,以及所述各章节的标题信息之间的层级关系,构建所述待处理电力应急非结构化文档对应的目录信息之后,还包括:

5.根据权利要求1所述的方法,其特征在于,在获取待处理电力应急非结构化文档之后,还包括:

6.根据权利要求1至5中任一项所述的方法,其特征在于,所述预先训练的标题信息预测模型,通过下述方式训练得到:

7.一种电力应急非结构化文档目录构建装置,其特征在于,所述装置包括:

8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。

9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。

10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。


技术总结
本申请涉及一种电力应急非结构化文档目录构建方法、装置、计算机设备、存储介质和计算机程序产品。该方法包括:获取待处理电力应急非结构化文档;根据待处理电力应急非结构化文档和待处理电力应急非结构化文档中的关键词,得到待处理电力应急非结构化文档各章节的标题信息;根据各章节的标题信息,以及各章节的标题信息下的文本信息,确定各章节的标题信息对应的目标词向量;根据各章节的标题信息对应的目标词向量,确定各章节的标题信息之间的层级关系;根据各章节的标题信息,以及各章节的标题信息之间的层级关系,构建待处理电力应急非结构化文档对应的目录信息。采用本方法,能够提高电力应急非结构化文档目录的构建效率。

技术研发人员:张壮领,郑松源,陈彩娜,杨绍群,潘岐深,胡秀珍,蒋毅,莫一夫,胡振维,毕明利,黄国泳,黄杰辉,邱万亿,黎振宇,王勇军
受保护的技术使用者:广东电网有限责任公司
技术研发日:
技术公布日:2024/12/5

最新回复(0)