1.本技术涉及到机器翻译领域,具体而言,涉及一种基于多种语言学习平台翻译智能处理方法和系统。
背景技术:
2.在进行机器翻译的时候,有可能会出现小语种的翻译,如果没有该小语种的翻译引擎,则无法对该小语种进行翻译,此时会借用中间语言来进行翻译。因此,选择中间
3.例如,在机器翻译中需要进行泰语到葡萄牙语的翻译。翻译的提供方如果没有直接的翻译引擎,则一般采用使用两个翻译引擎来进行翻译。即可以首先将泰语翻译成英语,然后再将英语翻译成葡萄牙语。
4.在线学习平台会支持多种语言显示,这样可以让多个国家的学生都可以使用该学习,平台。在线学习平台具有以下特性:知识专业背景强,通用翻译器效果不理想;通常的方法是借助固定的中间语言翻译,容易造成错误传播。
5.采用固定中间语种进行翻译有可能会导致翻译不准确。
技术实现要素:
6.本技术实施例提供了一种基于多种语言学习平台翻译智能处理方法和系统,以至少解决现有技术中采用固定中间语种进行翻译所导致的问题。
7.根据本技术的一个方面,提供了一种基于多种语言学习平台翻译智能处理方法,包括:分别使用多个不同的第一翻译引擎中的每一个对第一文字进行翻译,得到多种第二文字,其中,所述第一翻译引擎为机器翻译引擎,不同的第一翻译引擎得到的第二文字的语种不同;将所述多种第二文字分别使用对应的第二翻译引擎翻译成多种第三文字,其中,所述第三文字的语种与所述第一文字的语种相同;将所述多种第三文字分别所述第一文字进行比较,确定每种第三文字相对于第一文字的相似度;至少根据每种第三文字的相似度从所述多个不同的第一翻译引擎中选择出预定的第一翻译引擎;通过所述预定的第一翻译引擎对所述第一文字进行翻译得到预定的第二文字;将所述预定的第二文字使用第三翻译引擎翻译成第四文字,其中,所述第四文字为翻译的目标语种。
8.进一步地,至少根据每种第三文字的相似度从所述多个不同的第一翻译引擎中选择出预定的第一翻译引擎包括:选择相似度最高的第三文字对应的第一翻译引擎作为所述预定的第一翻译引擎。
9.进一步地,在分别使用多个不同的第一翻译引擎中的每一个对第一文字进行翻译之前,所述方法还包括:遍历所有的机器翻译引擎,获取能够将所述第一文字翻译成的一个或多个第一其他语种;遍历所有的机器翻译引擎,获取能够将所述第四文字翻译成的一个或多个第二其他语种,获取所述一个或多个第一其他语种与所述第一或多个第二其他语种中相同的语种;确定将能够将所述第一文字翻译成所述相同的语种的机器翻译引擎为所述多个不同的第一翻译引擎。
10.进一步地,在所述一个或多个第一其他语种与所述第一或多个第二其他语种中不存在相同的语种的情况下,所述方法还包括:发送提示信息,其中,所述提示信息用于指示无法将所述第一文字翻译成所述翻译的目标语种。
11.根据本技术的另一个方面,还提供了一种基于多种语言学习平台翻译智能处理系统,包括:第一翻译模块,用于分别使用多个不同的第一翻译引擎中的每一个对第一文字进行翻译,得到多种第二文字,其中,所述第一翻译引擎为机器翻译引擎,不同的第一翻译引擎得到的第二文字的语种不同;第二翻译模块,用于将所述多种第二文字分别使用对应的第二翻译引擎翻译成多种第三文字,其中,所述第三文字的语种与所述第一文字的语种相同;比较模块,用于将所述多种第三文字分别所述第一文字进行比较,确定每种第三文字相对于第一文字的相似度;选择模块,用于至少根据每种第三文字的相似度从所述多个不同的第一翻译引擎中选择出预定的第一翻译引擎;第三翻译模块,用于通过所述预定的第一翻译引擎对所述第一文字进行翻译得到预定的第二文字;第四翻译模块,用于将所述预定的第二文字使用第三翻译引擎翻译成第四文字,其中,所述第四文字为翻译的目标语种。
12.进一步地,所述选择模块用于选择相似度最高的第三文字对应的第一翻译引擎作为所述预定的第一翻译引擎。
13.进一步地,在分别使用多个不同的第一翻译引擎中的每一个对第一文字进行翻译之前,所述系统还包括:第一遍历模块,用于遍历所有的机器翻译引擎,获取能够将所述第一文字翻译成的一个或多个第一其他语种;第二遍历模块,用于遍历所有的机器翻译引擎,获取能够将所述第四文字翻译成的一个或多个第二其他语种,获取模块,用于获取所述一个或多个第一其他语种与所述第一或多个第二其他语种中相同的语种;确定模块,用于确定将能够将所述第一文字翻译成所述相同的语种的机器翻译引擎为所述多个不同的第一翻译引擎。
14.进一步地,在所述一个或多个第一其他语种与所述第一或多个第二其他语种中不存在相同的语种的情况下,所述系统还包括:发送模块,用于发送提示信息,其中,所述提示信息用于指示无法将所述第一文字翻译成所述翻译的目标语种。
15.在本技术实施例中,采用了分别使用多个不同的第一翻译引擎中的每一个对第一文字进行翻译,得到多种第二文字,其中,所述第一翻译引擎为机器翻译引擎,不同的第一翻译引擎得到的第二文字的语种不同;将所述多种第二文字分别使用对应的第二翻译引擎翻译成多种第三文字,其中,所述第三文字的语种与所述第一文字的语种相同;将所述多种第三文字分别所述第一文字进行比较,确定每种第三文字相对于第一文字的相似度;至少根据每种第三文字的相似度从所述多个不同的第一翻译引擎中选择出预定的第一翻译引擎;通过所述预定的第一翻译引擎对所述第一文字进行翻译得到预定的第二文字;将所述预定的第二文字使用第三翻译引擎翻译成第四文字,其中,所述第四文字为翻译的目标语种。通过本技术解决了现有技术中采用固定中间语种进行翻译所导致的问题,在一定程度上提高了翻译质量。
附图说明
16.构成本技术的一部分的附图用来提供对本技术的进一步理解,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:
17.图1是根据本技术实施例的多种语言学习平台翻译智能处理方法的流程图。
具体实施方式
18.需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本技术。
19.需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
20.在线学习平台一般会支持多种语言的显示,例如,一般这种显示方法是根据学习者使用的网络地址来确定平台显示的语言的,该方法可以包括如下步骤:获取所述学习者的网络地址(ip地址是目前通用的网络地址,可以使用ip地址);根据所述网络地址获取该网络地址所对应的国家或者地区;根据所述国家或者地区获取该国家或者地区所使用的语言;获取所述在线学习平台上的语言包,其中,该语言包包括学习平台上显示的各种文字和内容;在所述在线学习平台上使用获取到的所述语言包进行显示。
21.在一个实施例里中,如果没有获取到需要显示的语言包,则需要使用机器学习引擎对已经有的语言包进行翻译,例如,可以对英语的语言包进行翻译。如果没有英语翻译成目标语言的翻译引擎,则可以借助于中间引擎来进行翻译。
22.在本实施例中提供了一种多种语言学习平台翻译智能处理方法,该方法应用于对上述语言包的翻译,图1是根据本技术实施例的多种语言学习平台翻译智能处理方法的流程图,如图1所示,该流程包括如下步骤:
23.步骤s102,分别使用多个不同的第一翻译引擎中的每一个对第一文字进行翻译,得到多种第二文字,其中,所述第一翻译引擎为机器翻译引擎,不同的第一翻译引擎得到的第二文字的语种不同;
24.步骤s104,将所述多种第二文字分别使用对应的第二翻译引擎翻译成多种第三文字,其中,所述第三文字的语种与所述第一文字的语种相同;
25.步骤s106,将所述多种第三文字分别所述第一文字进行比较,确定每种第三文字相对于第一文字的相似度;
26.在现有技术中评价翻译的质量一般是靠人工来进行评价的,在该步骤中引入了一个新的自动评价翻译质量的方法。例如,将中文翻译成日语,然后再将日语翻译成中文;将中文翻译成韩语,然后再将韩语翻译成中文。将中文原文与日语翻译成的中文进行比较,找到其相似度;将中文原文与韩语翻译成的中文进行比较,找到其相似度。如果日语翻译成的中文相似度高,则至少部分说明中文翻译成日语的引擎质量更好。
27.两篇文字的相似度的判断方式有很多:例如,对两篇文章进行分词,记录每个分词在文章中的位置;对出现最多的十个最多的词语的每个词语均进行两篇文章位置是否相同的比对,计算出每个词语位置相同的比例,获取十个词语的平均位置相同的比例,将该比例值作为第一相似度值,该第一相似度值可以作为上述步骤s106的相似度。或者也可以使用如下更好的相似度判断方式:
28.对两篇文章按照标点符号进行分句,每一个标点符号均作为分句的依据,记录每个分句在文章中的位置,然后按照段落统计每个段落中的相同位置的句子中字符相同的比
例,对该段落中的所有的比例取平均值,从而得到该段落的相似度。对所有段落的相似度进行统计,得到相似度的范围值,判断第一相似度值是否在所述范围值之内,如果在,则将所述第一相似度值作为相似度使用,如果不在,则取所述范围值的中间值与所述第一相似度的平均值作为所述相似度使用。
29.上述使用的相似度均是机器自动判断的相似度,作为一个可选的方式,还可以引入人工智能判断:使用多组训练数据训练得到一个机器学习模型,所述多组训练数据中的每一组均包括两篇文字和用于标识这两篇文字相似度的标签,通过训练之后得到第一模型,将第一文字和第三文字输入所述第一模型,所述第一模型输出的标签即为相似度。
30.步骤s108,至少根据每种第三文字的相似度从所述多个不同的第一翻译引擎中选择出预定的第一翻译引擎;
31.作为另一个可选的实施方式,还可以获取所述多个不同的第一翻译引擎在进行机器学习训练的时候所使用的语料的数量,使用的语料的数量越多则说明机器学习训练出的翻译引擎的质量越好。此时,在该步骤中,可以至少根据每种第三文字的相似度和每个第一翻译引擎在训练时使用的训练数据的数量从所述多个不同的一翻译引擎中选择出第一翻译引擎。例如,预先配置一个相似度的范围,首先选择出落入所述相似度的范围的多个第一翻译引擎;然后从落入所述相似度范围的多个第一引擎中选择使用训练数据量最大的翻译引擎作为所述预定的第一翻译引擎。
32.步骤s110,通过所述预定的第一翻译引擎对所述第一文字进行翻译得到预定的第二文字;
33.步骤s112,将所述预定的第二文字使用第三翻译引擎翻译成第四文字,其中,所述第四文字为翻译的目标语种。
34.在该步骤之后,作为一个可选的实施方式还可以进行记录:记录将第一文字对应的语种翻译为第四文字对应的语种中使用的是第一翻译引擎,所述第一翻译引擎的目标语种为所述第一文字对应的语种翻译成第四文字对应的语种的中间语种;获取所有的从第一文字对应语种到所述第四文字对应的语种的翻译记录,选择记录中出现最多的中间语种作为默认的中间语种。
35.在采用默认的中间语种进行第一文字到第四文字的翻译会后,将翻译结果发送给用户确认,在所述用户确认需要重新选择中间语种的情况下,重复上述步骤s102到步骤s112。
36.通过上述步骤,每次均进行评估,根据评估结果来选择中间语种,不再是一直使用英语作为默认的中间语种,从而解决了现有技术中采用固定中间语种进行翻译所导致的问题,在一定程度上提高了翻译质量。
37.作为一个可选的实施方式,至少根据每种第三文字的相似度从所述多个不同的第一翻译引擎中选择出预定的第一翻译引擎包括:选择相似度最高的第三文字对应的第一翻译引擎作为所述预定的第一翻译引擎。
38.作为一个可选的实施方式,在分别使用多个不同的第一翻译引擎中的每一个对第一文字进行翻译之前,所述方法还包括:遍历所有的机器翻译引擎,获取能够将所述第一文字翻译成的一个或多个第一其他语种;遍历所有的机器翻译引擎,获取能够将所述第四文字翻译成的一个或多个第二其他语种,获取所述一个或多个第一其他语种与所述第一或多
个第二其他语种中相同的语种;确定将能够将所述第一文字翻译成所述相同的语种的机器翻译引擎为所述多个不同的第一翻译引擎。
39.作为一个可选的实施方式,在所述一个或多个第一其他语种与所述第一或多个第二其他语种中不存在相同的语种的情况下,所述方法还可以包括:发送提示信息,其中,所述提示信息用于指示无法将所述第一文字翻译成所述翻译的目标语种。
40.在本实施例中,提供一种电子装置,包括存储器和处理器,存储器中存储有计算机程序,处理器被设置为运行计算机程序以执行以上实施例中的方法。
41.上述程序可以运行在处理器中,或者也可以存储在存储器中(或称为计算机可读介质),计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
42.这些计算机程序也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤,对应与不同的步骤可以通过不同的模块来实现。在本实施例中就提供了一种包括这种模块的系统,该系统称为一种多种语言学习平台翻译智能处理系统,该系统包括:第一翻译模块,用于分别使用多个不同的第一翻译引擎中的每一个对第一文字进行翻译,得到多种第二文字,其中,所述第一翻译引擎为机器翻译引擎,不同的第一翻译引擎得到的第二文字的语种不同;第二翻译模块,用于将所述多种第二文字分别使用对应的第二翻译引擎翻译成多种第三文字,其中,所述第三文字的语种与所述第一文字的语种相同;比较模块,用于将所述多种第三文字分别所述第一文字进行比较,确定每种第三文字相对于第一文字的相似度;选择模块,用于至少根据每种第三文字的相似度从所述多个不同的第一翻译引擎中选择出预定的第一翻译引擎;第三翻译模块,用于通过所述预定的第一翻译引擎对所述第一文字进行翻译得到预定的第二文字;第四翻译模块,用于将所述预定的第二文字使用第三翻译引擎翻译成第四文字,其中,所述第四文字为翻译的目标语种。
43.该系统中包括的一个或多个模块用于执行上述方法中的步骤,已经进行过说明的,在此不再赘述。
44.例如,所述选择模块用于选择相似度最高的第三文字对应的第一翻译引擎作为所述预定的第一翻译引擎。
45.例如,在分别使用多个不同的第一翻译引擎中的每一个对第一文字进行翻译之前,所述系统还包括:第一遍历模块,用于遍历所有的机器翻译引擎,获取能够将所述第一文字翻译成的一个或多个第一其他语种;第二遍历模块,用于遍历所有的机器翻译引擎,获取能够将所述第四文字翻译成的一个或多个第二其他语种,获取模块,用于获取所述一个
或多个第一其他语种与所述第一或多个第二其他语种中相同的语种;确定模块,用于确定将能够将所述第一文字翻译成所述相同的语种的机器翻译引擎为所述多个不同的第一翻译引擎。
46.例如,在所述一个或多个第一其他语种与所述第一或多个第二其他语种中不存在相同的语种的情况下,所述系统还包括:发送模块,用于发送提示信息,其中,所述提示信息用于指示无法将所述第一文字翻译成所述翻译的目标语种。
47.通过上述实施例,每次均进行评估,根据评估结果来选择中间语种,不再是一直使用英语作为默认的中间语种,从而解决了现有技术中采用固定中间语种进行翻译所导致的问题,在一定程度上提高了翻译质量。
48.以上仅为本技术的实施例而已,并不用于限制本技术。对于本领域技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本技术的权利要求范围之内。
技术特征:
1.一种基于多种语言学习平台翻译智能处理方法,其特征在于,包括:分别使用多个不同的第一翻译引擎中的每一个对第一文字进行翻译,得到多种第二文字,其中,所述第一翻译引擎为机器翻译引擎,不同的第一翻译引擎得到的第二文字的语种不同;将所述多种第二文字分别使用对应的第二翻译引擎翻译成多种第三文字,其中,所述第三文字的语种与所述第一文字的语种相同;将所述多种第三文字分别所述第一文字进行比较,确定每种第三文字相对于第一文字的相似度;至少根据每种第三文字的相似度从所述多个不同的第一翻译引擎中选择出预定的第一翻译引擎;通过所述预定的第一翻译引擎对所述第一文字进行翻译得到预定的第二文字;将所述预定的第二文字使用第三翻译引擎翻译成第四文字,其中,所述第四文字为翻译的目标语种。2.根据权利要求1所述的方法,其特征在于,至少根据每种第三文字的相似度从所述多个不同的第一翻译引擎中选择出预定的第一翻译引擎包括:选择相似度最高的第三文字对应的第一翻译引擎作为所述预定的第一翻译引擎。3.根据权利要求1所述的方法,其特征在于,在分别使用多个不同的第一翻译引擎中的每一个对第一文字进行翻译之前,所述方法还包括:遍历所有的机器翻译引擎,获取能够将所述第一文字翻译成的一个或多个第一其他语种;遍历所有的机器翻译引擎,获取能够将所述第四文字翻译成的一个或多个第二其他语种,获取所述一个或多个第一其他语种与所述第一或多个第二其他语种中相同的语种;确定将能够将所述第一文字翻译成所述相同的语种的机器翻译引擎为所述多个不同的第一翻译引擎。4.根据权利要求3所述的方法,其特征在于,在所述一个或多个第一其他语种与所述第一或多个第二其他语种中不存在相同的语种的情况下,所述方法还包括:发送提示信息,其中,所述提示信息用于指示无法将所述第一文字翻译成所述翻译的目标语种。5.一种基于多种语言学习平台翻译智能处理系统,其特征在于,包括:第一翻译模块,用于分别使用多个不同的第一翻译引擎中的每一个对第一文字进行翻译,得到多种第二文字,其中,所述第一翻译引擎为机器翻译引擎,不同的第一翻译引擎得到的第二文字的语种不同;第二翻译模块,用于将所述多种第二文字分别使用对应的第二翻译引擎翻译成多种第三文字,其中,所述第三文字的语种与所述第一文字的语种相同;比较模块,用于将所述多种第三文字分别所述第一文字进行比较,确定每种第三文字相对于第一文字的相似度;选择模块,用于至少根据每种第三文字的相似度从所述多个不同的第一翻译引擎中选择出预定的第一翻译引擎;第三翻译模块,用于通过所述预定的第一翻译引擎对所述第一文字进行翻译得到预定的第二文字;
第四翻译模块,用于将所述预定的第二文字使用第三翻译引擎翻译成第四文字,其中,所述第四文字为翻译的目标语种。6.根据权利要求5所述的系统,其特征在于,所述选择模块用于选择相似度最高的第三文字对应的第一翻译引擎作为所述预定的第一翻译引擎。7.根据权利要求5所述的系统,其特征在于,在分别使用多个不同的第一翻译引擎中的每一个对第一文字进行翻译之前,所述系统还包括:第一遍历模块,用于遍历所有的机器翻译引擎,获取能够将所述第一文字翻译成的一个或多个第一其他语种;第二遍历模块,用于遍历所有的机器翻译引擎,获取能够将所述第四文字翻译成的一个或多个第二其他语种,获取模块,用于获取所述一个或多个第一其他语种与所述第一或多个第二其他语种中相同的语种;确定模块,用于确定将能够将所述第一文字翻译成所述相同的语种的机器翻译引擎为所述多个不同的第一翻译引擎。8.根据权利要求7所述的系统,其特征在于,在所述一个或多个第一其他语种与所述第一或多个第二其他语种中不存在相同的语种的情况下,所述系统还包括:发送模块,用于发送提示信息,其中,所述提示信息用于指示无法将所述第一文字翻译成所述翻译的目标语种。
技术总结
本申请公开了一种基于多种语言学习平台翻译智能处理方法和系统,该方法包括:分别使用多个不同的第一翻译引擎中的每一个对第一文字进行翻译,得到多种第二文字;将所述多种第二文字分别使用对应的第二翻译引擎翻译成多种第三文字;将所述多种第三文字分别所述第一文字进行比较,确定每种第三文字相对于第一文字的相似度;至少根据每种第三文字的相似度从所述多个不同的第一翻译引擎中选择出预定的第一翻译引擎;通过所述预定的第一翻译引擎对所述第一文字进行翻译得到预定的第二文字;将所述预定的第二文字使用第三翻译引擎翻译成第四文字。通过本申请解决了现有技术中采用固定中间语种进行翻译所导致的问题,在一定程度上提高了翻译质量。度上提高了翻译质量。度上提高了翻译质量。
技术研发人员:肖君 臧宏 白庆春 王腊梅 盛海龙
受保护的技术使用者:上海开放大学
技术研发日:2021.12.09
技术公布日:2022/3/8