摘 要: | 为使复杂的海量多源空间标绘内容规范化、标准化,确保标绘内容的正确性,亟需对空间标绘内容进行整合。针对多源异构空间标绘信息中存在的同标异物、异标同物等情况,分析不同应用类型标绘数据的自身特点,以最大限度地消除差异性为标准,采用粗糙集理论对信息进行分类,通过建立语义本体库进行源数据分析、提取和转换等工作,建立数据整合标准与质量控制体系,突破数据源之间标准的差异以及异常数据的限制,实现了多源标绘内容的自动/半自动整合。以全球地名数据为例,随机选取4组实验数据进行属性约简和规则提取,并对相关数据进行整合。实验结果表明,算法可行性强,数据整合流程具备高效性,能够应用于大数据集的分类。
|