您目前所在的位置:首页 - 期刊简介 - 详细页面

铁道科学与工程学报

JOURNAL OF RAILWAY SCIENCE AND ENGINEERING

第9卷    第2期    总第46期    2012年4月

[PDF全文下载]    [Flash在线阅读]

    

文章编号:1672-7029(2012)02-0119-06
异构数据库相似语义属性聚类过程研究
李小平,任恩恩

(兰州交通大学机电技术研究所,甘肃兰州730070)

摘 要: 对异构数据库相似语义属性聚类过程及其关键技术进行研究,在词频-逆文件频率的基础上,提出数值类型属性信息的槽频率-逆文件频率处理方法,分别应用于文本信息和数值信息的相似语义属性聚类过程。研究结果表明: 使用词频-逆文件频率和槽频率-逆文件频率方法相结合是异构数据库相似语义属性聚类实现的一种有效方法。

 

关键字: 异构数据库; 相似语义; 属性聚类; 统一矢量化; 词频—逆文件频率; 槽频率—逆文件槽频率; 自组织映射网络

Research of similar semantic attribute clustering process in heterogeneous database
LI Xiao-ping ,REN En-en

Mechatronical T&R Institute,Lanzhou Jiaotong University,Lanzhou 730070,China

Abstract:The key technology of the similar semantic attribute clustering process in the heterogeneous database was researched.On the basis of the term frequency-inverse document frequency,the processing method of bin frequency-inverse document bin frequency was proposed,which was applied in similar semantic attribute clustering prosess of the text information and numerical information.The results show that the method using term frequency – inverse document frequency and bin frequency-inverse document bin frequency is effective to the process of the similar semantic attribute clustering in the heterogeneous database.

 

Key words: heterogeneous database; similar semantic; attribute clustering; unified vector ( UV) ; term frequency inverse document frequency ( TF-IDF) ; bin frequency-inverse document bin frequency ( BF-IDBF) ; self -organizing mapping network ( SOM)

ISSN 1672-7029
CN 43-1423/U

主管:中华人民共和国教育部 主办:中南大学 中国铁道学会 承办:中南大学
湘ICP备09001153号 版权所有:《铁道科学与工程学报》编辑部
------------------------------------------------------------------------------------------
地 址:湖南省长沙市韶山南路22号 邮编:410075
电 话:0731-82655133,82656174   传真:0731-82655133   电子邮箱:jrse@mail.csu.edu.cn