首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
中文地址解析是地址匹配的重要环节,广泛应用于地址检索、地理编码和地址信息识别等方面.但传统地址解析方法存在覆盖度有限、人工参与过多和泛化能力较差等问题.为发挥深度学习模型在深层结构上自动学习上下文特征的优势,提出一种基于BERT-BiLSTM-CRF深度学习模型的中文地址解析方法:依据中文地址要素多级分类体系,扩展BIOES标注方法并进行地址语料标注;基于预训练语言模型,构建融合BERT、BiLSTM和CRF的综合深度学习模型,通过BERT预训练语言模型获取富含语义信息的字符向量,弥补静态词向量特异性缺失的问题,提高复杂地址要素的提取能力.以2019年深圳市地址数据为例进行模型性能评估,该方法对于多数中文地址要素的解析准确率达90%以上;相比IDCNN-CRF和BiLSTM-CRF等深度学习模型,该方法对只具有小规模地址语料时的地址解析效果更优,且在解析多种地址要素类型时能保持良好的性能.  相似文献   

2.
利用在线地理编码API解决海量中文地址快速编码问题,在此基础上,利用简单的规则对编码结果进行清洗、标记,最后通过基于系统聚类与随机森林的分类优化模型,将多平台编码结果分类处理、优化。利用广州市盗窃案件地址对模型进行训练与验证,结果表明:相比未处理的编码结果,经模型优化过的编码结果整体位置误差距离减小。高德的地理编码服务有着最好的编码质量,但训练样本的高德编码误差均值仍高达590.43 m,经模型优化后,样本的编码误差均值降至173.73 m,验证样本编码误差均值由554.88 m(高德)降至180.04 m,降低了67.49%,高德90.08%的异常编码结果被清洗优化。对于训练样本与验证样本,模型优化效果相似;对于地址类型不同的案件、位于市区与市郊的案件,模型优化效果相似,说明模型具有一定普适性。该模型能够方便快捷地将海量社会经济信息转化为空间数据,提高编码精度,为地理大数据的研究提供更好的数据支持。  相似文献   

3.
对于不同区域、类别的地名地址文本数据,各互联网地图平台提供的在线地理编码与地名检索服务质量参差不齐,用户无法快捷获取地名地址空间化最优结果。该文提出一种基于国内3种主流地图平台的多源在线地理编码与地名检索服务聚合方法,包括数据预处理、最小行政区划提取、地理编码与地名检索服务定位结果获取、最优定位结果选取等内容。以四川省3个地区4类兴趣点作为样本数据,设计了16种地名地址空间化实验,从匹配率、定位精度两方面比较分析各实验结果优劣。结果表明,该文方法显著提升了地名地址空间化质量,具有普适性;相对于单平台地理编码服务,精确匹配率增加了14%~61%,定位精度≤50m的比例增加了15%~43%;定位质量提升幅度与实验数据地址质量呈负相关。  相似文献   

4.
针对现有方法从微博中识别时空信息精度较低且相对粗略的问题,该文提出基于双向长短期记忆网络和条件随机场(BiLSTM-CRF)与分类分层标注的微博中突发事件时空信息精细识别方法(MFISIE).首先,设计一套适用于微博中突发事件的分类分层时空信息标注体系(CHSIAS),构建微博语料库;然后,结合BiLSTM-CRF构建微博时空信息识别模型,并利用117567条标注的微博语料进行实验.结果表明:与人民日报语料标注体系相比,CHSIAS与CRF、BiLSTM、BiLSTM-CRF 3种方法结合进行时空信息识别,F值均较高,且可获得多层级、精细化的突发事件时空信息,其中,基于BiLSTM-CRF的MFISIE方法的F值(91.2%)最高.使用CHSIAS时,BiL-STM-CRF对时间信息的识别效果最好,其对兴趣点、建筑物和相对位置描述识别结果的F值比BiLSTM方法分别提升了8.8%、6.3%和12.3%,比CRF方法分别提升了7.1%、7.7%和8.9%.MFISIE可更精确地提取微博中突发事件的时空信息,为突发事件应急信息的快速感知与精准应用提供技术支撑.  相似文献   

5.
中文文本中时间信息解析方法   总被引:1,自引:0,他引:1  
探讨了基于触发词汇和规则模型相结合的中文文本中时间信息解析方法。通过分析、归纳中文文本中时间信息描述特点,构建时间词汇词典和时间信息描述模式库,设计时间信息抽取、规范化表达和语义推理算法,实现了中文文本中时间信息的解析。实验结果表明,中文文本中时间信息抽取的准确率、召回率和F1值分别为75.00%、88.24%和40.54%,为泛在时空信息动态关联更新和实时挖掘分析提供数据源,且通过与空间维数据有机地、交互地组织,能够实时展现地理现象和事物的时空演化过程、时空分布特征,从而推动地理信息检索、LBS等地理信息服务向动态化、多维化方向发展。  相似文献   

6.
在研究分析地址模型的基础上,建立了存储标准地址数据集的标准地址库和自定义的地址匹配规则库,提出了一种基于规则的模糊中文地址编码方法。该方法在依据标准地址库分词的同时,也沿着自定义的地址匹配规则进行推理,从而缩小了下次分词所用到的目标数据集,提高了系统执行效率。另外,通过借助构建的规则树与歧义栈,提高了文中定义的两类模糊地址匹配的成功率。最后,基于该算法建立了一个地理编码原型系统,并利用经济普查项目中的相关数据对算法的可用性进行了验证。  相似文献   

7.
基于空间语义学基础理论,将传统的地理信息服务技术与新兴的语义服务技术相结合,建立地理信息语义服务框架及知识标注方法体系,并应用于地理空间信息服务处理中,提供智能化、自动化的地理信息服务发现、组合与触发策略;设计基于文本挖掘算法的半自动知识标注引擎,提高服务处理自动化程度,实现包含丰富语义信息的地理空间语义服务的发布;建立基于规则和推理引擎的地理信息服务匹配与发现机制,提高服务发现效率;建立地理信息服务语义标注与服务匹配评价方法,采用基于空间关联规则的标注正确性评估策略,验证知识标注价值。  相似文献   

8.
高质量地图点要素标注及自动配置问题是地图制图中的难点之一。为了解决地图点要素标注中的重叠问题,提出基于遗传算法的局部优化功能实现防重叠冲突的地图点要素标注。该文首先通过地图点要素标注的位置分配问题,建立基于点要素的八位置候选模型。其次,针对地图点的防重叠冲突问题,提出地图点标注的重叠数量评价函数和重叠面积评价函数,记录每一次迭代过程中点要素标注的重叠个数和重叠面积,得到标注重叠质量得分,进而得到适应度评分。最后基于3种评分结果建立新的终止条件,将数次迭代后满足该条件的标注设置为最终的配置方案。实验采用随机模拟数据和福州大学城实际数据进行验证,结果表明基于遗传算法和防重叠冲突的点标注配置与一般的标注配置相比,其重叠个数减少了89%。在迭代过程中最后一代相较于第一代的重叠面积减少了75%,标注的适应度提升54.5%。该算法能够有效地计算出群体点标注的近似最优解,显著提升地图标注的美观性和位置平衡性,适用于网络地图和专题地图点要素的自动化标注和配置。  相似文献   

9.
基于地理要素的资源与环境数据的组织方法   总被引:23,自引:0,他引:23  
陈常松  何建邦 《地理学报》1999,54(4):373-381
建立资源与环境信息的分类体系及其在分类基础上的编码,是建立空间型资源与环境信息系统中用以标识资源与环境信息的主要方法,但是研究表明,建立在对资源与环境信息本身分类的基础上编码只适合于专题信息系统的建立。综合性资源与环境信息系统是一种综合性信息服务系统,其设计必须从数据的可共享性出发,采用基于地理要素的方法。本文在介绍了国外有关基于地理要素方法的基本概念后,结合资源与环境信息系统的设计,对地理要素概  相似文献   

10.
借助携带地理信息的图像数据,标注未知图像的地理信息,是图像视频地理信息系统迫切需要的基于内容的检索工具。传统基于文本的地理信息标注方法主要借助人工完成,效率低下且无法运用于视频GIS检索之中,针对该问题,提出了基于流形结构的图像地理信息标注方法。该方法提取图像的视觉特征作为相似度度量,重构地理图像的流形结构,用以刻画不同视角视图图像的渐进变化规律,建立相同地理位置不同视角图像之间的内部关联,以便携带地理信息的共享。构建地理图像的流形结构需要连续视角变化的地理图像,当已有地理图像视角变化跳跃时,提出利用主动学习策略,通过交互完成视角变化跳跃位置的地理图像补充,同时进行增量式训练,提升地理信息标注方法的泛化能力。实验结果表明,给出携带地理信息的图像,该文方法可以获得相同地理位置处流形结构内的所有地理图像,高效完成地理信息标注。此外,在应对成像视角变化跳跃的情况时,具有较强的鲁棒性。  相似文献   

11.
上海市基础地理要素编码标准编制研究   总被引:6,自引:0,他引:6  
对以城市道路和街坊为核心的基础地理要素编码方法进行研究,克服了传统的城市基础地理要素编码方法中因人为因素造成编码在唯一性、扩展性和稳定性方面的缺陷,提出将编码内容与地理要素的地理位置相关联,且充分体现唯一性、扩展性和稳定性的网格化城市基础地理要素编码方法。由该方法编制的覆盖上海全市的基础地理要素编码可供上海城市规划、建设与管理使用。同时为促进上海空间基础地理信息的共享和交换,推动城市GIS的开发利用创造条件。  相似文献   

12.
地理编码(Geocoding)的应用研究   总被引:28,自引:2,他引:26  
该文阐述地理编码(Geocoding)的技术应用和发展。首先从地理编码的定义出发,论述了它在地址定位和空间信息整合方面的作用。分析国内外地理编码技术的应用方法和领域,总结了它在应用方面存在的一些问题以及解决这些问题的方法和策略。探讨地理编码在实现数字城市空间信息的融合和共享方面的作用。  相似文献   

13.
基于神经网络的单元自动机CA及真实和优化的城市模拟   总被引:78,自引:8,他引:78  
黎夏  叶嘉安 《地理学报》2002,57(2):159-166
提出了一种基于神经网络的单元自动机(CA)。CA已被越来越多地应用在城市及其它地理现象的模拟中。CA模拟所碰到的最大问题是如何确定模型的结构和参数。模拟真实的城市涉及到使用许多空间变量和参数。当模型较复杂时,很难确定模型的参数值。本模型的结构较简单,模型的参数能通过对神经网络的训练来自动获取。分析表明,所提出的方法能获得更高的模拟精度,并能大大缩短寻找参数所需要的时间。通过筛选训练数据,本模型还可以进行优化的城市模拟,为城市规划提供参考依据。  相似文献   

14.
基于神经网络的单元自动机CA及真实和忧化的城市模拟   总被引:6,自引:0,他引:6  
提出了一种基于神经网络的单元自动机(CA)。CA已被越来越多地应用在城市及其它地理现象的模拟中。CA模拟所碰到的最大问题是如何确定模型的结构和参数。模拟真实的城市涉及到使用许多空间变量和参数。当模型较复杂时,很难确定模型的参数值。本模型的结构较简单,模型的参数能通过对神经网络的训练来自动获取。分析表明,所提出的方法能获得更高的模拟精度,并能大大缩短寻找参数所需要的时间。通过筛选训练数据,本模型还可以进行优化的城市模拟,为城市规划提供参考依据。  相似文献   

15.
人类时空间行为数据观测体系架构及其关键问题   总被引:2,自引:0,他引:2  
大数据的行为研究具有丰富的数据源,但在数据的尺度、信度、精度、粒度和研究边界等方面仍存在诸多问题,且涉及隐私、可预测性等广泛争议。依据"信息获取方式确定—信息获取手段整合—信息类型划分—信息解析与要素提取—行为属性与要素集成"的思路,构建了整合高精度、全要素和多视角的行为数据观测体系架构。梳理与论述了行为研究中行为变化的尺度依赖特征,个体行为与群体行为数据的区分与综合,行为数据需求与个体隐私边界界定及行为数据的解析、匹配与整合等关键问题。尝试从科学问题的边界界定与数据需求、多源数据采集与整合方法、多要素行为数据解析与集成方法及应用驱动的行为数据应用模式与途径等方面,对行为数据的综合采集与集成处理进行界定。  相似文献   

16.
通过对多机场体系概念内涵的解析,基于机场与区域空间关系的视角,构建了多机场体系量化甄别的两步搜索法,并提出了多机场体系界定的关键技术参数。基于机场-都市圈距离模拟优化阈值(70 km)识别的全球多机场体系空间格局研究发现:(1)全球共有59个多机场体系,其业务规模在全球民航运输中占有重要地位;多机场体系内的机场数量多为2个或3个,其中“一主一辅”布局模式占据主导,(航空)港-城的平均车程时间为39.35 min。(2)多机场体系呈现出多核空间布局特征,主要分布在沿海发达地区或大洲/国家尺度的区域性中心;多机场体系的运输规模、机场数量、港-城距离等特征表现出一定的空间异质性。(3)在空间指向上,多机场体系呈现出中心地指向性和海洋指向性的特征。  相似文献   

17.
在界定空港经济竞争力概念的基础上,构建空港经济竞争力模型,以机场密集区中具有代表意义的江苏省域为区域背景,考察机场的空港经济竞争力及其内部子系统竞争力变化特征。在综合竞争力方面,江苏机场等级体系鲜明,具有明显地域过渡性。子系统分析表明,机场子系统差距最大,硬件建设普遍超前于软实力建设;城市子系统内部差距缩小,地域过渡特征更为明显;空港经济区子系统基本处于低位均衡。当前城市发展是省内空港经济的最强动力,但城市各要素作用力不均衡,经济、旅游、对外开放和科技研发作用较强,人口、交通要素作用较弱。基于子系统组合分析可将省内机场归为四类,最后针对成熟度各异的省内机场空港经济发展路径进行了分类指导。  相似文献   

18.
针对现有地理分析模型同多源复杂地学数据之间耦合困难、模型运算数据处理过程复杂等问题,构建了以模型需求模板匹配为基础的多源地理数据自动处理与推送方法。利用元数据对多源地理数据进行统一描述,并从模型的数据需求和任务需求两个角度生成模型需求模板,最后通过基于XML的元数据与模型需求模板的匹配求得数据操作模板。在数据操作模板中应用算子库作为转换工具,实现了数据库数据到模型需求数据的转换,完成模型运算数据的自动推送。基于江苏沿海滩涂数据库的分析案例表明,该文提出的模型模板匹配方法可对模型运行数据进行有效解析,并通过数据操作流的构建实现数据的自动推送。该研究可为服务型GIS的发展及地理模型的集成提供理论参考与方法借鉴。  相似文献   

19.
以健康老年男性血沉参考值为例,收集中国各地用温氏法测定的健康老年男性血沉参考值,运用BP神经网络模拟分析其与地理环境的海拔高度、年日照时数、年平均相对湿度、年平均气温、年降水量等要素间的非线性、复杂性关系特征,通过5层神经网络,经过500次及1 300次自学习建立模拟规则后,用此规则很好地模拟健康老年男性血沉参考值与地理环境的关系。知道中国某地的地理要素, 就可用此模型估算该地区老年男性血沉参考值。人工神经网络预测血沉参考值的模型自动定义具体的结构和参数,减少血沉参考值预测中的人为性,计算方便;同时,通过对不同地理要素的组合,模型可以寻找预测误差最低的地理要素组合关系。  相似文献   

20.
为解决传统地图查询方法中对复杂地址对象难以定位的问题,该文面向地理网格的时空大数据分析需求,结合面要素特点与语义分析,提出一种面要素语义位置的GeoSOT网格定位方法。首先通过最小外包矩形(Minimum Bounding Rectangle,MBR)将面要素以九宫格形式分割成9个区块,单独计算各区块的网格编码集合;然后提取位置语句中的名称与空间关系,根据具体情境进行直接查询,或利用网格编码计算目标位置;最后根据语义考虑是否对编码结果做差集运算,从而得到目标的GeoSOT网格定位范围。实验表明,对比现有的地图服务,该方法能够实现语境更加复杂的位置定位,具有可行性和有效性,其提供的未知要素推理定位方法能够有效补充、扩展原有的面要素数据集,可为后续针对面状区域的时空大数据分析提供网格化的数据资源。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号