1.本技术涉及信息处理技术领域,具体而言,涉及一种视频编目方法、装置、电子设备及计算机可读存储介质。
背景技术:
2.为了使视频行业在视频内容运营时,对视频本身的描述更加清晰和精准,达到精细化运营或差异化运营的目的,内容运营商一般会对视频给予基本描述、简介、演员等基本信息,同时附上符合视频人物、语言等标签数据。但是,目前内容运营商还是采用传统的人工运营的模式,由内容供应商提供视频基本的描述信息如名称、分类、语言、简介等,内容运营商发布上线时对视频标签的标签由运营人员手工填写,此种运营数据的维护方式耗费了大量的人力、时间,而且由于运营人员不同个体对视频内容的理解,认知差异,语义表达都不同,所以经常会造成视频编目、标签描述不够准确或描述范围覆盖不全。
技术实现要素:
3.本技术实施例的目的在于提供一种视频编目方法、装置、电子设备及计算机可读存储介质,以改善“现有的视频编目方法存在视频编目、标签描述不准确且描述范围不全面”的问题。
4.本发明是这样实现的:
5.第一方面,本技术实施例提供一种视频编目方法,所述方法包括:获取待编目视频,所述待编目视频携带有自身的基本标签;对所述待编目视频进行视频分析,获取所述待编目视频对应的各类信息;根据所述基本标签,在预设的信息库中匹配出包含最多的所述基本标签的第一标签集合;其中,所述信息库包括多类视频对应的标签集合;根据所述各类信息,确定所述待编目视频对应的第二标签集合;其中,所述第一标签集合和所述第二标签集合用于确定所述待编目视频的最终标签集合。
6.在本技术实施例中,通过对待编目视频进行视频分析,可根据待编目视频对应的各类信息确定第二标签集合,相较于现有技术是从预设的标签库中查找待编目视频对应的各标签,该方式能够从视频本身的内容上获取到更全面且更准确的标签信息。并且,因第一标签集合中有与待编目视频对应的各类标签信息,第二标签集合中有根据待编目视频的视频内容获取到的各类标签信息,因此,该最终标签集合能为工作人员提供更丰富且全面的待编目视频对应的各标签信息。进一步,工作人员可根据该最终标签集合快速的为待编目视频选择对应的标签,从而提高工作人员的工作效率,进而提高编目效率。此外,通过待编目视频携带的基本标签与在信息库中进行匹配,从而匹配出与待编目视频对应的标签信息,能提高视频编目的效率,且能降低人力成本。
7.结合上述第一方面提供的技术方案,在一些可能的实现方式中,所述根据所述各类信息,确定所述待编目视频对应的第二标签集合,包括:根据所述各类信息中的人物信息,获取对应的人物名称、该人物出现的次数和该人物出现的时长;并根据所述人物出现的
次数和时长,确定所述待编目视频对应的人物标签子集合;根据所述各类信息中的场景信息和物品信息,获取所述场景信息和所述物品信息对应的场景名称和物品名称;并根据所述场景名称和所述物品名称,确定所述待编目视频对应的场景物品标签子集合;其中,所述第二标签集合包括所述人物标签子集合和场景物品标签子集合。
8.在本技术实施例中,通过上述方式,能根据待编目视频对应的各类信息,确定出该待编目视频对应的人物标签子集合和场景物品标签子集合,从而便于后续工作人员根据不同集合为待编目视频选择不同类型的标签,进而提高了工作人员的工作效率。
9.结合上述第一方面提供的技术方案,在一些可能的实现方式中,在所述根据所述人物出现的次数和时长,确定所述待编目视频对应的人物标签子集合之后,所述方法还包括:将所述人物标签子集合中的各人物标签与预设的人物名单库进行匹配,若该人物标签出现在所述人物名单库中,则对该人物标签进行标记。
10.在本技术实施例中,通过上述方式,能对人物标签子集合中的各人物标签有目的的进行标记,从而便于后续工作人员按照该标记对各人物标签快速进行选择,从而提高了工作人员的工作效率。
11.结合上述第一方面提供的技术方案,在一些可能的实现方式中,所述信息库包括多个信息子库,不同子库中的多类视频对应的标签集合来源不同;根据所述基本标签,在预设的信息库中匹配出包含最多的所述基本标签的第一标签集合,包括:根据所述基本标签,分别在各个子库中匹配出与该子库对应的包含最多的所述基本标签的子标签集合;获取全部所述子标签集合中出现多次的各标签,得到第一标签集合。
12.在本技术实施例中,上述各标签在全部子标签集合中至少出现过两次,即表示该标签具有一定的置信度。通过上述方式,能根据置信度较高的标签得到第一标签集合,从而能保证后续工作人员在第一标签集合中为待编目视频选择出的标签的准确率。
13.结合上述第一方面提供的技术方案,在一些可能的实现方式中,在所述获取全部所述子标签集合中出现多次的各标签,得到第一标签集合之后,所述方法还包括:根据所述各标签在全部所述子标签集合中出现的次数,确定所述各标签的置信度;根据该置信度,对所述各标签进行标记。
14.在本技术实施例中,通过对第一标签集合中的各标签按其置信度进行标记,能方便工作人员根据各标签上标记的置信度对待编目视频对应的标签进行选择,从而可提高工作人员的工作效率。
15.结合上述第一方面提供的技术方案,在一些可能的实现方式中,所述第二标签集合包括人物标签子集合,所述方法还包括:根据所述人物标签子集合中各人物标签对应的人物出现次数,对所述各人物标签进行排序,获取排名前n的人物标签;根据所述各标签对应的置信度,获取置信度最高的各标签,其中,n为正整数;根据所述排名前n的人物标签和所述置信度最高的各标签,确定所述待编目视频对应的精选标签集合。
16.在本技术实施例中,通过上述方式,能确定出待编目视频对应的精选标签集合,因该精选标签集合包括了待编目视频对应的置信度最高的各标签以及待编目视频中出现的人物次数较多的人物标签,使得后续工作人员能够根据精选标签集合快速选择出待编目视频对应的标签,从而提高了工作人员的工作效率。
17.结合上述第一方面提供的技术方案,在一些可能的实现方式中,所述信息库中的
一个子库为平台内容子库,所述平台内容子库包括从各网络平台获取到的各类视频对应的标签信息。
18.在本技术实施例中,通过设置平台内容子库,能扩大用于进行待编目视频匹配的各类视频对应的标签信息的范围,从而使待编目视频的基本标签和信息库进行匹配时,能获取到待编目视频对应的更全面的第一标签集合。
19.结合上述第一方面提供的技术方案,在一些可能的实现方式中,在所述对所述待编目视频进行视频分析,获取所述待编目视频对应的各类信息之前,所述方法还包括:根据所述基本标签在预设的编目库中进行匹配,所述编目库包括已审核通过的各类视频对应的标签集合;其中,所述编目库中的标签信息置信度高于所述信息库中的标签信息置信度;确定所述待编目视频和所述编目库的匹配准确度未达到预设值。
20.结合上述第一方面提供的技术方案,在一些可能的实现方式中,所述方法还包括:当所述待编目视频和所述编目库的匹配准确度达到预设值时,根据所述基本标签在预设的编目库中匹配出的各标签位置,确定所述待编目视频在所述编目库中对应的所有标签;将所述编目库中与所述待编目视频对应的所有标签,添加至所述待编目视频。
21.在本技术实施例中,待编目视频的基本标签与编目库的匹配准确率达到预设值表示在编目库中查找到与待编目视频对应的所有标签,并且,因编目库中各标签的置信度较高且标签全面,故可直接使用编目库中与待编目视频对应的所有标签,即将所述编目库中与待编目视频对应的所有标签,添加至所述待编目视频,从而提高对待编目视频进行编目的效率。
22.结合上述第一方面提供的技术方案,在一些可能的实现方式中,所述方法还包括:根据所述待编目视频对应的各类信息,对所述编目库中与所述待编目视频对应的标签集合进行调整。
23.在本技术实施例中,根据待编目视频对应的各类信息,对编目库中与该待编目视频对应的标签进行调整能对编目库实时进行更新,使得后续使用编目库获取待编目视频对应的各标签时,能获取到待编目视频对应的更全面的各标签信息,从而提高对待编目视频编目的准确率,以及使根据编目库获取到的待编目视频对应的各标签更全面。
24.第二方面,本技术实施例提供一种视频编目装置,所述装置包括:获取模块,用于获取待编目视频,所述待编目视频携带有自身的基本标签;分析模块,用于对所述待编目视频进行视频分析,获取所述待编目视频对应的各类信息;处理模块,用于根据所述基本标签,在预设的信息库中匹配出包含最多的所述基本标签的第一标签集合;其中,所述信息库包括多类视频对应的标签集合;根据所述各类信息,确定所述待编目视频对应的第二标签集合;其中,所述第一标签集合和所述第二标签集合用于确定所述待编目视频的最终标签集合。
25.第三方面,本技术实施例提供一种电子设备,包括:处理器和存储器,所述处理器和所述存储器连接;所述存储器用于存储程序;所述处理器用于调用存储在所述存储器中的程序,执行如上述第一方面实施例和/或结合上述第一方面实施例的一些可能的实现方式提供的方法。
26.第四方面,本技术实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在被处理器运行时执行如上述第一方面实施例和/或结合上述第一方面实
施例的一些可能的实现方式提供的方法。
附图说明
27.为了更清楚地说明本技术实施例的技术方案,下面将对本技术实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
28.图1为本技术实施例提供的一种视频编目方法的步骤流程图。
29.图2为本技术实施例提供的一种视频编目装置的结构框图。
30.图3为本技术实施例提供的一种电子设备的结构框图。
具体实施方式
31.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行描述。
32.鉴于现有的视频编目方法存在视频编目、标签描述不准确且描述范围不全面的问题,本技术发明人经过研究探索,提出以下实施例以解决上述问题。
33.以下结合图1对一种视频编目方法的具体流程及步骤进行描述。本技术实施例提供一种视频编目方法,应用于对各类视频进行编目的过程中。
34.需要说明的是,本技术实施例提供的视频编目方法不以图1及以下所示的顺序为限制。
35.步骤s101:获取待编目视频,待编目视频携带有自身的基本标签。
36.其中,待编目视频可以是电视剧集,还可以是电影等各类节目,此处不做限定。上述基本标签为待编目视频在制作生成时,制作人员为该待编目视频设置的一些基础的标签,比如:待编目视频的名称、类型、年份、语种、导演等。
37.在获取到待编目视频之后,本方法可继续执行步骤s102。
38.步骤s102:对待编目视频进行视频分析,获取待编目视频对应的各类信息。
39.其中,上述视频分析是指对待编目视频进行智能解析,具体的,可将待编目视频解析为一帧一帧的图像,再从获取到的每张图像中识别出其中出现的人脸、物品、场景、台词等基础信息。上述各类信息包括待编目视频中出现的人脸、物品、场景、台词等基础信息。上述对视频的解析以及从图像中识别对应的人脸、物品、场景、台词等基础信息可采用本领域中常用的技术手段,此处不再说明。
40.步骤s103:根据基本标签,在预设的信息库中匹配出包含最多的基本标签的第一标签集合。
41.其中,信息库包括多类视频对应的标签集合。其中,该标签集合是指某一视频对应的所有标签形成的一个集合,比如:a视频,其对应的标签为:aa(名称)、bb(类型)、cc(年份)、dd(导演)和ee(语种),则上述aa、bb、cc、dd和ee则构成a视频的标签集合,需要说明的是,标签集合中的标签会存在多种,不限于上述例子中的各类标签。
42.在本技术实施中,根据待编目视频携带的基本标签,在预设的信息库中与多类视频对应的标签集合分别进行匹配,能获取到包含最多的基本标签的一个集合(即第一标签集合),比如:待编目视频携带的基本标签有a(名称)、历史(类型)、2018(年份)、中文(语
种)、b(导演)、c(主演表)和d(简介),将该基本标签放入预设的信息库进行匹配,获取到一个包含最多的基本标签的标签集合,该标签集合包括上述待编目视频的a(名称)、历史(类型)、2018(年份)、中文(语种)、b(导演)和c(主演表),则可认为该标签集合描述的就是待编目视频,即可将该标签集合设置为第一标签集合。通过该方式,能避免通过人工的方式对待编目视频进行判断,且在预设的标签库中查找待编目视频对应的所有标签。
43.需要说明的是,上述信息库可以为一个库,也可以包括多个子库。当该信息库包括多个子库时,不同子库中的多类视频对应的标签集合来源不同,比如:上述信息库中一个子库可以为平台内容子库,该平台内容子库包括从各网络平台(例如:各论坛)获取到的各类视频对应的标签信息,其中,该标签信息包括能够从各网络平台获取到的全部标签信息(例如:视频对应的评分、评论);上述信息库中一个子库也可以为内容生产子库,该内容生产子库包括各视频在生产制作时,视频编辑人员为该视频制作的各类标签(例如:名称、演员);上述信息库中的一个子库还可以为内容运营子库,该内容运营子库包括从各视频运营平台获取到的各类视频对应的标签信息。还需要说明的是,在各个信息子库中,各标签也是以各类视频对应的标签集合的形式进行的存储。
44.可选的,当上述信息库包括多个子库时,根据基本标签,在预设的信息库中匹配出包含最多的基本标签的第一标签集合可具体包括:根据基本标签,分别在各个子库中匹配出与该子库对应的包含最多的基本标签的子标签集合;获取全部子标签集合中出现多次的各标签,得到第一标签集合。
45.在本技术实施例中,上述获取到的各标签在全部子标签集合中至少出现过两次,即表示该标签具体一定的置信度。因此,通过上述方式,能根据置信度较高的标签得到第一标签集合,从而能保证后续工作人员在第一标签集合中为待编目视频选择出的标签的准确率。
46.可选的,在获取全部子标签集合中出现多次的各标签,得到第一标签集合之后,还可根据各标签在全部子标签集合中出现的次数,确定各标签的置信度;根据该置信度,对各标签进行标记。
47.例如:信息库中包括三个子库,根据待编目视频对应的基本标签,可在三个子库中分别匹配出一个子标签集合,即共获得三个子标签集合,每个子标签集合中都有不同的标签信息,比如:第一个子标签集合中包括的标签信息有:a(名称)、b(年份)、c(语种)、d(导演)、e(主演表)、f(场景),第二子标签集合中包括的标签信息有:a(名称)、b(年份)、c(语种)、d(导演)、z(主演表)、f(场景),第三子标签集合包括的标签信息有:a(名称)、b(年份)、k(语种)、d(导演)、e(主演表)、g(评分)、h(评价),则上述三个子标签集合中出现多次的各标签为:a、b、c、d、e和f。其中,a、b和d各出现了三次,c、e和f各出现了两次,则a、b和d的置信度高于c、e和f的置信度,并且,因只有三个信息子库,故当a、b和d各匹配到了三次时,可认为获取到的a、b和d绝对可信,即a、b和d的置信度为100%,此时,可根据a、b和d的置信度为其进行对应的标记,比如:将a、b和d标记为红色。同理,c、e和f的置信度低于a、b和d的置信度,此时,可用橙色对c、e和f进行标记。
48.需要说明的是,当信息库包括n个子库时,在n个子标签集合中,出现n次的标签置信度》出现n-1次的标签置信度》
…
》出现2次的标签置信度,可根据每个标签对应的置信度,为该标签标记不同的颜色以代表该标签的置信度高低,从而方便工作人员根据各标签上关
于置信度的标记对待编目视频对应的标签进行选择,进而可提高工作人员的工作效率。
49.需要说明的是,步骤s102和步骤s103可同时进行,也可以有先后顺序的进行,即先进行步骤s102后进行步骤s103,或先进行步骤s103后进行步骤s102,此处不做限定。
50.步骤s104:根据各类信息,确定待编目视频对应的第二标签集合。
51.具体的,根据各类信息中的人物信息,获取对应的人物名称、该人物出现的次数和该人物出现的时长;并根据人物出现的次数和时长,确定待编目视频对应的人物标签子集合;根据各类信息中的场景信息和物品信息,获取场景信息和物品信息对应的场景名称和物品名称;并根据场景名称和物品名称,确定待编目视频对应的场景物品标签子集合;其中,第二标签集合包括人物标签子集合和场景物品标签子集合。
52.其中,上述人物信息包括待编目视频中每个时刻出现的人物名称,故根据该人物信息可获取到待编目视频中出现的各人物名称、各人物出现的次数和各人物出现的总时长。因此,可根据各人物出现的次数和时长,确定该待编目视频中主要的人物,再根据确定出的人物获取对应的各人物标签(即该人物对应的名称),进而确定出人物标签子集合。
53.上述场景信息包括待编目视频中每帧图像中出现的场景,比如:待编目视频的第一帧图像对应的场景是公园、待编目视频的第五十帧图像对应的是办公室;上述物品信息包括待编目视频中每帧图像中出现的物品,比如:待编目视频的第一帧图像中出现了水杯、餐桌、蜡烛,待编目视频的第五十帧图像中出现了电脑、座椅。根据上述场景信息和物品信息可获取到待编目视频对应的各场景名称及各物品名称,根据各场景名称及各物品名称可确定上述场景名称和物品名称,即场景物品标签子集合包括待编目视频中出现的各个场景名称和各个物品名称。
54.在本技术实施例中,通过上述方式,能根据待编目视频对应的各类信息,确定出该待编目视频对应的人物标签子集合和场景物品标签子集合,从而便于后续工作人员根据不同集合为待编目视频选择不同类型的标签,进而提高了工作人员的工作效率。此外,相较于现有技术,上述方式能够从待编目视频其内容本身获取对应的标签信息,从而能丰富待编目视频对应的各标签信息,从而为后续工作人员为待编目视频选择对应的标签提供更丰富、更全面的标签信息。
55.可选的,在根据人物出现的次数和时长,确定待编目视频对应的人物标签子集合之后,还可将人物标签子集合中的各人物标签与预设的人物名单库进行匹配,若该人物标签出现在人物名单库中,则对该人物标签进行标记。
56.其中,上述人物名单库可根据实际情况进行设置,比如:将人物名单库设置人物黑名单库,将人物标签子集合中的各人物标签与人物黑名单库进行匹配,若该人物标签出现在该人物黑名单库中,则对该人物标签进行标记,从而使工作人员后续根据待编目视频的人物标签子集合为该待编目视频选择对应的标签时,能根据人物标签上的黑名单标记,避开为待编目视频选择做有标记的人物标签。
57.在本技术实施例中,通过上述方式,能对人物标签子集合中的各人物标签有目的的进行标记,从而便于后续工作人员按照该标记对各人物标签快速进行选择,从而提高了工作人员的工作效率。
58.需要说明的是,第一标签集合和第二标签集合用于确定待编目视频的最终标签集合。因第一标签集合中有与待编目视频对应的各类标签信息,第二标签集合中有根据待编
目视频的视频内容获取到的各类标签信息,因此,该最终标签集合能为工作人员提供更丰富且全面的待编目视频对应的各标签信息。并且,工作人员可根据该最终标签集合快速的为待编目视频选择对应的标签,从而提高工作人员的工作效率,进而提高编目效率。
59.此外,在确定出第一标签集合和第二标签集合之后,还可根据该第一标签集合和该第二标签集合确定出精选标签集合。
60.具体的,根据人物标签子集合中各人物标签对应的人物出现次数,对各人物标签进行排序,获取排名前n的人物标签;根据各标签对应的置信度,获取置信度最高的各标签,其中,n为正整数;根据排名前n的人物标签和置信度最高的各标签,确定待编目视频对应的精选标签集合。
61.在本技术实施例中,因根据待编目视频中各人物出现的次数和时长,确定出该待编目视频对应的人物标签子集合,故可获取到人物标签子集合中各人物出现的总次数。将人物标签子集合中各人物出现的总次数按由高到低的顺序进行排列,获取排名前n的人物标签,比如:获取排名前三的人物标签。又因第二标签集合中的各标签是根据该标签的置信度确定出的,故根据各标签对应的置信度,可获取置信度最高的各标签,比如:信息库有三个子库,则根据三个子标签集合确定出的第二标签集合中的各标签的最高置信度为:该标签在全部子标签集合中共出现三次。
62.通过上述方式,能确定出待编目视频对应的精选标签集合,因该精选标签集合包括了待编目视频对应的置信度最高的各标签以及待编目视频中出现的人物次数较多的人物标签,则可将该精选标签集合设置为必须选择的标签集合,即该精选标签集合中包括了必须选择的标签,使得后续工作人员能够根据精选标签集合快速选择出待编目视频对应的标签,从而提高了工作人员的工作效率。
63.为了提高对待编目视频进行编目的效率,在步骤s102之前,还可根据基本标签在预设的编目库中进行匹配,该编目库包括已审核通过的各类视频对应的标签集合;其中,编目库中的标签信息置信度高于信息库中的标签信息置信度;在确定待编目视频和编目库的匹配准确度未达到预设值时,执行上述步骤s102-步骤s104。
64.其中,编目库中的标签集合是指针对某一视频的已审核通过的所有标签形成的一个集合,比如:aa视频,其已审核通过的标签为:aaa(名称)、bbb(类型)、ccc(年份)、ddd(导演)和eee(语种),则上述aaa、bbb、ccc、ddd和eee则构成aa视频的标签集合,需要说明的是,标签集合中的标签会存在多种,不限于上述例子中的各类标签。
65.根据待编目视频携带的基本标签,在预设的编目库中进行匹配,可获取到包含最多的基本标签的一个集合。并且,根据基本标签和该集合的各标签,可得到上述匹配准确度。例如:待编目视频携带的基本标签有a(名称)、历史(类型)、2018(年份)、中文(语种)和b(导演),将该基本标签放入预设的信息库进行匹配,获取到一个包含最多的基本标签的标签集合,该标签集合包括上述待编目视频的a(名称)、历史(类型)、2018(年份)、中文(语种)、d(导演)和c(主演表)。若将每个基本标签匹配准确度均设置为20%,则上述例子中匹配出了基本标签中的a(名称)、历史(类型)、2018(年份)和中文(语种),即该待编目视频和编目库的匹配准确度为80%。当待编目视频和编目库的匹配准确度达到预设值,则认为该标签集合描述的就是待编目视频;当待编目视频和编目库的匹配准确度未达到预设值,则认为在编目库中未匹配到待编目视频对应的标签集合,即对于待编目视频,没有可以直接
使用的标签集合。
66.相应的,还可根据待编目标签的基本标签设置不同的匹配规则,例如:基本标签中的名称占40%,类型占10%,年份占10%,语种占10%、导演占30%。需要说明的是,还可根据基本标签的个数设置不同的匹配规则,此处不做限定。
67.通过上述方式,能根据待编目视频所携带的基本标签在编目库中进行匹配,从而查看编目库中有无待编目视频对应的、可直接使用的标签集合。相较于现有技术中需要人工根据待编目视频的信息,在预设的标签库中查找待编目视频对应的专辑,上述方式能提高待编目视频在编目库中的匹配效率,从而提高编目效率。
68.可选的,当待编目视频和编目库的匹配准确度达到预设值时,根据基本标签在预设的编目库中匹配出的各标签位置,确定待编目视频在编目库中对应的所有标签;将编目库中与待编目视频对应的所有标签,添加至待编目视频。
69.因将待编目视频与预设的信息库进行匹配时,会获得一个包含最多的基本标签的标签集合,故当待编目视频和编目库的匹配准确度达到预设值时,可根据基本标签在预设的编目库中匹配出的各标签位置,找到该标签集合,即可确定出待编目视频在编目库中对应的所有标签。在确定出待编目视频在编目库中对应的所有标签之后,因编目库中各标签的置信度较高,且标签较全面,故可直接将上述所有标签添加至待编目视频。
70.还需要说明的是,当待编目视频和编目库的匹配准确度达到预设值时,可对该待编目视频进行视频分析,获取待编目视频对应的各类信息。并根据所述待编目视频对应的各类信息,对所述编目库中与所述待编目视频对应的标签集合进行调整。其中,上述视频分析和上述各类信息请参考前述步骤s102中对视频分析和各类信息的说明,避免赘述,此处不再说明。
71.根据待编目视频的各类信息,可获取到该待编目视频中出现频次较高的各人物名称,以及该待编目视频中出现的各场景名称、各物品名称。根据上述各人物名称、各场景名称和各物品名称,能对编目库中与该待编目视频对应的标签集合进行调整。
72.例如:b电视剧第三集视频和编目库的匹配准确度达到预设值,则可确定出该视频在编目库中对应的所有标签(即b电视剧对应的所有标签);将编目库中与该视频对应的所有标签,添加至该视频。此时,对上述b电视剧第三集视频进行视频分析,可获取到在该视频中出现频次较高的人物名称为:h、j、k。但是,该所有标签中只有h和j,并未有k,则说明k在b电视剧第三集视频中首次出现频率较高,则可将k添加至编目库中与b电视剧第三集视频对应的标签集合中,使得再次使用该标签集合时,能获取到更全面的、更丰富的标签集合。
73.在本技术实施例中,根据待编目视频对应的各类信息,对编目库中与该待编目视频对应的标签进行调整能对编目库实时进行更新,使得后续使用编目库获取待编目视频对应的各标签时,能获取到待编目视频对应的更全面的各标签信息,从而提高对待编目视频编目的准确率,以及使根据编目库获取到的待编目视频对应的各标签更全面。
74.请参阅图2,基于同一发明构思,本技术实施例还提供一种视频编目装置100,该装置100包括:获取模块101、分析模块102和处理模块103。
75.获取模块101,用于获取待编目视频,待编目视频携带有自身的基本标签。
76.分析模块102,用于对待编目视频进行视频分析,获取待编目视频对应的各类信息。
77.处理模块103,用于根据基本标签,在预设的信息库中匹配出包含最多的基本标签的第一标签集合;其中,信息库包括多类视频对应的标签集合;根据各类信息,确定待编目视频对应的第二标签集合;其中,第一标签集合和第二标签集合用于确定待编目视频的最终标签集合。
78.可选的,处理模块103具体用于根据各类信息中的人物信息,获取对应的人物名称、该人物出现的次数和该人物出现的时长;并根据人物出现的次数和时长,确定待编目视频对应的人物标签子集合;根据各类信息中的场景信息和物品信息,获取场景信息和物品信息对应的场景名称和物品名称;并根据场景名称和物品名称,确定待编目视频对应的场景物品标签子集合;其中,第二标签集合包括人物标签子集合和场景物品标签子集合。
79.可选的,处理模块103还用于将人物标签子集合中的各人物标签与预设的人物名单库进行匹配,若该人物标签出现在人物名单库中,则对该人物标签进行标记。
80.可选的,信息库包括多个信息子库,不同子库中的多类视频对应的标签集合来源不同,相应的,处理模块103具体用于根据基本标签,分别在各个子库中匹配出与该子库对应的包含最多的基本标签的子标签集合;获取全部子标签集合中出现多次的各标签,得到第一标签集合。
81.可选的,处理模块103还用于根据各标签在全部子标签集合中出现的次数,确定各标签的置信度;根据该置信度,对各标签进行标记。
82.可选的,第二标签集合包括人物标签子集合,相应的,处理模块103还用于根据人物标签子集合中各人物标签对应的人物出现次数,对各人物标签进行排序,获取排名前n的人物标签,其中,n为正整数;根据各标签对应的置信度,获取置信度最高的各标签;根据排名前n的人物标签和置信度最高的各标签,确定待编目视频对应的精选标签集合。
83.可选的,获取模块101还用于根据基本标签在预设的编目库中进行匹配,编目库包括已审核通过的各类视频对应的标签集合;其中,编目库中的标签信息置信度高于信息库的标签信息置信度;确定待编目视频和编目库的匹配准确度未达到预设值。
84.可选的,获取模块101还用于当待编目视频和编目库的匹配准确度达到预设值时,根据基本标签在预设的编目库中匹配出的各标签位置,确定待编目视频在编目库中对应的所有标签;将编目库中与待编目视频对应的所有标签,添加至待编目视频。
85.可选的,获取模块101还用于根据待编目视频对应的各类信息,对编目库中与待编目视频对应的标签集合进行调整。
86.请参阅图3,基于同一发明构思,本技术实施例提供的一种电子设备200的示意性结构框图,该电子设备200可用于上述的一种视频编目方法。本技术实施例中,电子设备200可以是,但不限于个人计算机(personal computer,pc)、智能手机、平板电脑、个人数字助理(personal digital assistant,pda)、移动上网设备(mobile internet device,mid)等。在结构上,电子设备200可以包括处理器210和存储器220。
87.处理器210与存储器220直接或间接地电性连接,以实现数据的传输或交互,例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。其中,处理器210可以是一种集成电路芯片,具有信号处理能力。处理器210也可以是通用处理器,例如,可以是中央处理器(central processing unit,cpu)、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、分
立门或晶体管逻辑器件、分立硬件组件,可以实现或者执行本技术实施例中的公开的各方法、步骤及逻辑框图。此外,通用处理器可以是微处理器或者任何常规处理器等。
88.存储器220可以是,但不限于,随机存取存储器(random access memory,ram)、只读存储器(read only memory,rom)、可编程只读存储器(programmable read-only memory,prom)、可擦可编程序只读存储器(erasable programmable read-only memory,eprom),以及电可擦编程只读存储器(electric erasable programmable read-only memory,eeprom)。存储器220用于存储程序,处理器210在接收到执行指令后,执行该程序。
89.应当理解,图3所示的结构仅为示意,本技术实施例提供的电子设备200还可以具有比图3更少或更多的组件,或是具有与图3所示不同的配置。此外,图3所示的各组件可以通过软件、硬件或其组合实现。
90.需要说明的是,由于所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
91.基于同一发明构思,本技术实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序在被运行时执行上述实施例中提供的方法。
92.该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如固态硬盘solid state disk(ssd))等。
93.在本技术所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
94.另外,作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
95.再者,在本技术各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
96.在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
97.以上所述仅为本技术的实施例而已,并不用于限制本技术的保护范围,对于本领域的技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
技术特征:
1.一种视频编目方法,其特征在于,所述方法包括:获取待编目视频,所述待编目视频携带有自身的基本标签;对所述待编目视频进行视频分析,获取所述待编目视频对应的各类信息;根据所述基本标签,在预设的信息库中匹配出包含最多的所述基本标签的第一标签集合;其中,所述信息库包括多类视频对应的标签集合;根据所述各类信息,确定所述待编目视频对应的第二标签集合;其中,所述第一标签集合和所述第二标签集合用于确定所述待编目视频的最终标签集合。2.根据权利要求1所述的方法,其特征在于,所述根据所述各类信息,确定所述待编目视频对应的第二标签集合,包括:根据所述各类信息中的人物信息,获取对应的人物名称、该人物出现的次数和该人物出现的时长;并根据所述人物出现的次数和时长,确定所述待编目视频对应的人物标签子集合;根据所述各类信息中的场景信息和物品信息,获取所述场景信息和所述物品信息对应的场景名称和物品名称;并根据所述场景名称和所述物品名称,确定所述待编目视频对应的场景物品标签子集合;其中,所述第二标签集合包括所述人物标签子集合和场景物品标签子集合。3.根据权利要求2所述的方法,其特征在于,在所述根据所述人物出现的次数和时长,确定所述待编目视频对应的人物标签子集合之后,所述方法还包括:将所述人物标签子集合中的各人物标签与预设的人物名单库进行匹配,若该人物标签出现在所述人物名单库中,则对该人物标签进行标记。4.根据权利要求1所述的方法,其特征在于,所述信息库包括多个信息子库,不同子库中的多类视频对应的标签集合来源不同;根据所述基本标签,在预设的信息库中匹配出包含最多的所述基本标签的第一标签集合,包括:根据所述基本标签,分别在各个子库中匹配出与该子库对应的包含最多的所述基本标签的子标签集合;获取全部所述子标签集合中出现多次的各标签,得到第一标签集合。5.根据权利要求4所述的方法,其特征在于,在所述获取全部所述子标签集合中出现多次的各标签,得到第一标签集合之后,所述方法还包括:根据所述各标签在全部所述子标签集合中出现的次数,确定所述各标签的置信度;根据该置信度,对所述各标签进行标记。6.根据权利要求5所述的方法,其特征在于,所述第二标签集合包括人物标签子集合,所述方法还包括:根据所述人物标签子集合中各人物标签对应的人物出现次数,对所述各人物标签进行排序,获取排名前n的人物标签,其中,n为正整数;根据所述各标签对应的置信度,获取置信度最高的各标签;根据所述排名前n的人物标签和所述置信度最高的各标签,确定所述待编目视频对应的精选标签集合。7.根据权利要求4所述的方法,其特征在于,所述信息库中的一个子库为平台内容子
库,所述平台内容子库包括从各网络平台获取到的各类视频对应的标签信息。8.根据权利要求1所述的方法,其特征在于,在所述对所述待编目视频进行视频分析,获取所述待编目视频对应的各类信息之前,所述方法还包括:根据所述基本标签在预设的编目库中进行匹配,所述编目库包括已审核通过的各类视频对应的标签集合;其中,所述编目库中的标签信息置信度高于所述信息库中的标签信息置信度;确定所述待编目视频和所述编目库的匹配准确度未达到预设值。9.根据权利要求8所述的方法,其特征在于,所述方法还包括:当所述待编目视频和所述编目库的匹配准确度达到预设值时,根据所述基本标签在预设的编目库中匹配出的各标签位置,确定所述待编目视频在所述编目库中对应的所有标签;将所述编目库中与所述待编目视频对应的所有标签,添加至所述待编目视频。10.根据权利要求9所述的方法,其特征在于,所述方法还包括:根据所述待编目视频对应的各类信息,对所述编目库中与所述待编目视频对应的标签集合进行调整。11.一种视频编目装置,其特征在于,所述装置包括:获取模块,用于获取待编目视频,所述待编目视频携带有自身的基本标签;分析模块,用于对所述待编目视频进行视频分析,获取所述待编目视频对应的各类信息;处理模块,用于根据所述基本标签,在预设的信息库中匹配出包含最多的所述基本标签的第一标签集合;其中,所述信息库包括多类视频对应的标签集合;根据所述各类信息,确定所述待编目视频对应的第二标签集合;其中,所述第一标签集合和所述第二标签集合用于确定所述待编目视频的最终标签集合。12.一种电子设备,其特征在于,包括:处理器和存储器,所述处理器和所述存储器连接;所述存储器用于存储程序;所述处理器用于运行存储在所述存储器中的程序,执行如权利要求1-10中任一项所述的方法。13.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序在被计算机运行时执行如权利要求1-10中任一项所述的方法。
技术总结
本申请提供一种视频编目方法、装置、电子设备及计算机可读存储介质。该方法包括:获取待编目视频,所述待编目视频携带有自身的基本标签;对所述待编目视频进行视频分析,获取所述待编目视频对应的各类信息;根据所述基本标签,在预设的信息库中匹配出包含最多的所述基本标签的第一标签集合;其中,所述信息库包括多类视频对应的标签集合;根据所述各类信息,确定所述待编目视频对应的第二标签集合;其中,所述第一标签集合和所述第二标签集合用于确定所述待编目视频的最终标签集合。通过该方式,能改善现有的视频编目方法存在的视频编目、标签描述不准确且描述范围不全面的问题。标签描述不准确且描述范围不全面的问题。标签描述不准确且描述范围不全面的问题。
技术研发人员:李鸣 肖云 张奎 陈明 余鹏军
受保护的技术使用者:未来电视有限公司
技术研发日:2021.12.27
技术公布日:2022/3/8