中国专利搜索 世界专利搜索 专利分类查询 专利引用检索 专利族检索
登陆 | |

一种词语对齐方法及装置
无权-驳回

Word alignment method and device

申请号:201310389092.2 申请日:2013-08-30
摘要:本发明公开了一种词语对齐方法及装置,属于机器翻译技术领域,所述方法包括如下步骤A、选取不同的词语对齐特征分别建立判别式子模型一和判别式子模型二;B、搜索词语对齐空间,分别获得上述两个判别式子模型的最优对齐中间结果;C、利用对偶分解算法融合上述判别式子模型一和判别式子模型二的最优对齐中间结果,获得最终词语对齐结果,所述装置为与方法对应的虚拟模块。本发明所提出的词语对齐方法和装置,克服了现有技术中词语搜索错误严重,对齐准确率低的问题,能够高效准确地完成词语对齐,具有良好的实用性。
Abstract: The invention discloses a word alignment method and a word alignment device and belongs to the technical field of machine translation. The method comprises the steps of A) selecting different work alignment characteristics and respectively establishing a discriminative sub-model I and a discriminative sub-model II; B) searching a word alignment space and respectively obtaining optimal alignment intermediate results of the two discriminative sub-models; and C) merging the optimal alignment intermediate results of the discriminative sub-model I and the discriminative sub-model II by adopting a dual decomposition algorithm to obtain a final word alignment result. The device is a virtual module corresponding to the method. The word alignment method and the word alignment device disclosed by the invention have the advantages that the problems that word searching mistakes are serious and the alignment accuracy is low in the prior art are solved, the word alignment can be efficiently and accurately finished and the practicability is high.
申请人: 清华大学
Applicant: UNIV TSINGHUA
地址: 100084 北京市海淀区清华园********(隐藏)
发明(设计)人: 沈世奇 刘洋 孙茂松
Inventor: SHEN SHIQI; LIU YANG; SUN MAOSONG
主分类号: G06F17/27(2006.01)I
分类号: G06F17/27(2006.01)I G06F17/28(2006.01)I G06F17/30(2006.01)I
  • 法律状态
2017-06-06  发明专利申请公布后的驳回 IPC(主分类):G06F 17/27申请公布日:20131204
2013-12-25  实质审查的生效IPC(主分类):G06F 17/27申请日:20130830
2013-12-04  公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
  • 其他信息
主权项  一种词语对齐方法,其特征在于,包括如下步骤:A、选取不同的词语对齐特征分别建立判别式子模型一和判别式子模型二;B、搜索词语对齐空间,分别获得上述两个判别式子模型的最优对齐中间结果;C、利用对偶分解算法融合上述判别式子模型一和判别式子模型二的最优对齐中间结果,获得最终词语对齐结果。
公开号  103425638A
公开日  2013-12-04
专利代理机构  北京路浩知识产权代理有限公司 11002
代理人  王莹
颁证日  
优先权  
 
国别 优先权号 优先权日 类型
CN  201310389092  20130830 
国际申请  
国际公布  
进入国家日期  
  • 专利对比文献
类型 阶段 文献号 公开日期 涉及权利要求项 相关页数
SEA  CN101482861A  20090715  1-11  全文 
SEA  CN101008943A  20070801  1-11  全文 
SEA  CN103150329A  20130612  1-11  全文 
注:不保证该信息的有效性、完整性、准确性,以上信息也不具有任何效力,仅供参考。使用前请另行委托专业机构进一步查核,使用该信息的一切后果由用户自行负责。
X:单独影响权利要求的新颖性或创造性的文件;
Y:与检索报告中其他 Y类文件组合后影响权利要求的创造性的文件;
A:背景技术文件,即反映权利要求的部分技术特征或者有关的现有技术的文件;
R:任何单位或个人在申请日向专利局提交的、属于同样的发明创造的专利或专利申请文件;
P:中间文件,其公开日在申请的申请日与所要求的优先权日之间的文件,或会导致需核实该申请优先权的文件;
E:单独影响权利要求新颖性的抵触申请文件。
  • 期刊对比文献
类型 阶段 期刊文摘名称 作者 标题 涉及权利要求项 相关页数
SEA  《Computational Linguistics》20100910363doi:10.1162/coli_a_00001  Yang Liu et al  Discriminative word alignment by linear modeling  1-11  303-339 
YANG LIU ET AL: "Discriminative word alignment by linear modeling", 《COMPUTATIONAL LINGUISTICS》 
SEA  《中文信息学报》20130731274  沈世奇 等  基于对偶分解的词语对齐搜索算法  1-11  11-14 
沈世奇 等: "基于对偶分解的词语对齐搜索算法", 《中文信息学报》 
  • 书籍对比文献
类型 阶段 书名 作者 标题 涉及权利要求项 相关页数
  • 附加信息
同族专利
 
引用文献
CN101008943ACN101482861ACN103150329A
 
被引用文献
CN105630776ACN106062736A