搜索 分析 新世界 法规 图书 网址导航 更多
高级用户登录 | 登录 | |

一种用于语义理解的文本序列迭代方法
审中-实审

申请号:201510861689.1 申请日:2015-11-30
摘要:一种用于语义理解的文本序列迭代方法,本发明涉及语义理解的文本序列迭代方法。本发明的目的是为了解决现有技术在语义相似度计算方面采用爬取搜索引擎检索数的方法,导致效率较低和重现代价过大,以及依赖于本体库和语义资源,需要人工校对或者纯人工构建,可扩展性方面有待提高,一定程度上限制了实际应用的问题。通过以下技术方案实现的:一、抽取原文三元组和背景知识库三元组;二、计算原文三元组的实数向量和背景知识库三元组的实数向量;三、计算语义相似度;四、计算背景知识库三元组的实数向量的权重值;五、构成序列迭代模型;六、采用支持向量机对原文进行文本分类,并对分类性能进行评估。本发明应用于计算机领域。
申请人: 哈尔滨工业大学
地址: 150001 黑龙江省哈尔滨市南岗区西大直街92号
发明(设计)人: 秦兵 刘挺 张牧宇 郑茂 李家琦
主分类号: G06F17/30(2006.01)I
分类号: G06F17/30(2006.01)I
  • 法律状态
2016-02-17  实质审查的生效IPC(主分类):G06F 17/30申请日:20151130
2016-01-20  公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
  • 其他信息
主权项  一种用于语义理解的文本序列迭代方法,具体是按照以下步骤制备的:步骤一、抽取原文三元组和背景知识库三元组;步骤二、计算原文三元组的实数向量和背景知识库三元组的实数向量;步骤三、设置原文三元组的权重值为1,将原文三元组作为搜索起始点,通过Cosine?similarity计算原文三元组的实数向量与背景知识库三元组的实数向量语义相似度;Cosine?similarity为余弦相似度;步骤四、根据原文三元组的实数向量与背景知识库三元组的实数向量的语义相似度的大小,对背景知识库三元组的实数向量按照语义相似度从大到小进行排序,得到从大到小排序的背景知识库三元组,计算背景知识库三元组的实数向量的权重值;步骤五、将原文三元组按照T1、T2……TM进行排序,M为正整数,将排序后的原文三元组按T1、T2……TM的顺序依次对步骤四得到的从大到小排序的背景知识库三元组进行激发,重复执行步骤四,直至计算完所有原文三元组,构成序列迭代模型;步骤六、将序列迭代模型中计算出的背景知识库三元组的实数向量的权重值从高到低进行排序,前N个背景知识库三元组作为原文的外部特征加入到原文的实数向量中,N为正整数,采用支持向量机对原文进行文本分类,并对分类性能进行评估。
公开号  105260488A
公开日  2016-01-20
专利代理机构  哈尔滨市松花江专利商标事务所 23109
代理人  杨立超
颁证日  
优先权  
国际申请  
国际公布  
进入国家日期