服务热线:15895595058
产品展示 Categories
联系我们 contact us
联系人:
陆先生
手机:
15895595058
电话:
0512-58628685
地址:
张家港市南丰镇
行业新闻
当前位置:主页 > 新闻动态 > 行业新闻 >
本相似度计算方法-电动液压滚圆机弯管机张家港
添加时间:2019-06-21
中文实体描述短文本具有词语稀疏、语义离散、用词随意等特点。本文分析《知网》义原网络和词语相似度的关系,提出了短文本间语义相似度部分和短文本分类部分相结合的实体描述短文本间相似度计算方法。语义相似度部分分析《知网》义原网络和词语间相似度的关系,在计算词语间相似度和短文本间相似度的过程中弱化了浅层《知网》义原影响并均衡了义原权重,使义原相似度计算结果更加合理。短文本分类部分将短文本分解为义原向量,根据特定领域短文本的义原分布情况进行短文本分类。两部分结合得到实体描述短文本间相似度。本文方法的有效性在百度知识图谱数据分析竞赛任务1的测试结果中得到了证明。 多义项词参与的词语相似度的参数。整句相似度由各集合加权平均得到。4短文本相似度计算方法的短文本分类部分本文将实体描述短文本分解为义原向量,本相似度计算方法-电动液压滚圆机弯管机张家港电动液压弯管机数控弯管机根据短文本的义原分布情况为其分类,再根据分类结果计算实体描述短文本间相似度。短文本语义相似度方法和短文本分类方法输出的相似度平均值即是实体描述短文本间相似度的最终结果。4本文由弯管机张家港弯管机价格网站
采集
转载中国知网整理! http://www.15895595058.net .1用义原向量描述短文本短文本分类部分用义原向量来表示短文本。本文采用文献[14]提出了将文本根据义原系数分解为义原向量的方法,并结合文献[15]的概念排歧方法。系统设计如图1所示。图1文本分解为义原向量流程图特征抽取和模型训练为了得到一篇短文本属于各个分类的概率并保持较高的计算效率,本文选择朴素贝叶斯分类器来为实体描述短文本分类。研究将每个实体的描述短文本按4.1的方法整理为义原向量。考虑到非叶节点义原的表意模糊,本文从义原向量中删除所有非叶节点义原。生成义原向量之后,本文需要在叶节点义原中抽取出n个适用于分类的义原作为分类特征。文献[16]提出了四种特征抽取方法:文档频率、信息增益、CHI统计和互信息。本文选择信息增益(IG)法、χ2统计量(CHI)法和互信息(MI)法作为特征选择的方法。当一个义原的信息增益、CHI值和互信息均大于特定阈值时,这个义原作为表达文本的特征。本文将每个文本表示为一个n维特征向量,X={x1,x2,…,xn},其中xi表示文本中对应义原的出现次数,以九类电影简介信息生成的特征向量作为训练集,建立朴素贝叶斯分类模型。4.3相似度计算本文通过朴素贝叶斯分类模型,计算两篇短文本属于每一个类别ci的后验概率P(ci|X),并将其整理为向量?本相似度计算方法-电动液压滚圆机弯管机张家港电动液压弯管机数控弯管机本文由弯管机张家港弯管机价格网站
采集
转载中国知网整理! http://www.15895595058.net