首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
社交用户的文本具有地理差异性,并且社交关系密切的用户之间居住位置更近,因而文本和社交网络均可用于推断用户常驻位置。现有基于文本和社交网络的用户常驻位置预测方法对文本的位置指示性特征挖掘不充分,而用户文本中地名等位置指示信息却提供了最有用的位置信号。因此,本文提出一种基于地理命名实体识别(GER)和图卷积神经网络(GCN)的社交用户位置预测方法。首先,通过地理命名实体识别方法对用户文本进行过滤以凸显位置指示性特征;其次,基于提及关系和关注与被关注关系抽取社交网络;再次,结合社交网络和用户文本内容,采用基于图卷积神经网络的方法进行用户常驻位置预测;最后,将GER-GCN与GCN以及最新研究成果进行比较,并探究该模型的小样本学习能力及其影响因素。基于Geotext数据集和2个微博数据集的实验表明:① GER文本过滤方法可显著提升用户位置预测精度;② 在所有实验中,GER-GCN的预测精度最高,并在基准数据集GeoText上比最新研究成果提升1%~2%;③ 在最小监督的现实场景中,本文印证了GER-GCN模型的小样本学习能力,并发现社交网络质量对其小样本学习能力起到决定性作用。实验结果验证了GER-GCN方法的先进性,且该方法符合社交媒体现实场景的应用需求。  相似文献   

2.
地理命名实体分类体系的设计与应用分析   总被引:2,自引:0,他引:2  
自然语言是一种重要的空间数据来源,从自然语言中获取地理空间信息是地理信息科学的重要研究议题。完善的地理命名实体分类体系,有助于实现自然语言中地理空间信息的解析、存贮、组织、管理、分析及共享应用。现有的基础地理要素分类体系、地名分类体系和组织机构分类体系,分别侧重于不同的应用领域,只能表达自然语言中的部分地理命名实体,没有考虑时空关联特性。本文在参照大量相关标准的基础上,根据大量自然语言文本的标注结果,以地理命名实体所指代的空间位置、地理特征和属性作为分类标准,采用主分表和复分表相结合的方式,设计了地理命名实体分类体系(简称"GNEC")。采用定量和定性相结合的方法,分析了GNEC与GB/T18521-2001,GB/T13923-2006,CHG IS的地名分类体系、ADL的FTT词表之间的兼容性,并以中文文本的地理命名实体解析和地图服务为例,验证了GNEC的应用性能。多样性是自然语言中地理实体描述的重要特征,而分类体系主要实现地理命名实体的概念化操作。因此,在GNEC基础上构建本体,将成为解决这一问题的有效途径。  相似文献   

3.
园林植物知识图谱可为顾及区域适应性、观赏性和生态性等因子的绿化树种的选型提供知识支持。植物描述文本的实体识别及关系抽取是知识图谱构建的关键环节。针对植物领域未有公开的标注数据集,本文阐述了园林植物数据集的构建流程,定义了园林植物的概念体系结构,完成了园林植物语料库的构建。针对现有Word2vec、ELMo和BERT等语言模型存在无法解决多义词、融合上下文能力差、运行速度慢等缺点,提出了嵌入ALBERT(A Lite BERT)预训练语言模型的实体识别和关系抽取模型。ALBERT预训练的动态词向量能够有效地表示文本特征,将其分别输入到BiGRU-CRF命名实体识别模型和BiGRU-Attention关系抽取模型中进行训练,进一步提升实体识别和关系抽取的效果。在园林植物语料库上进行方法的有效性验证,结果表明ALBERT-BiGRU-CRF命名实体识别模型的F1值为0.9517,ALBERT-BiGRU-Attention关系抽取模型的F1值为0.9161,相较于经典的语言模型(如Word2vec、ELMo和BERT等)性能有较为显著的提升。因此基于ALBERT模型的实体与关系抽取任务能有效提高识别分类效果,可将其应用于植物描述文本的实体关系抽取任务中,为园林植物知识图谱自动构建提供方法。  相似文献   

4.
鉴于生物医学命名实体识别的多数模型使用单机器学习算法时识别效果不好,提出一种基于条件随机域(CRFs)与最大熵(Maxent)分类器融合的方法,利用基分类器之间的相关性和互补性,结合有效的特征集合,进行再学习,得到融合模型.实验表明,该模型的识别性能与单一分类器和JNLPBA专题会议相关的系统比较,取得很好成绩,F测度...  相似文献   

5.
蕴含地理事件微博客消息的自动识别方法   总被引:1,自引:0,他引:1  
微博客文本蕴含类型丰富的地理事件信息,能够弥补传统定点监测手段的不足,提高事件应急响应质量。然而,由于大规模标注语料的普遍匮乏,无法利用监督学习过程识别蕴含地理事件信息的微博客文本。为此,本文提出一种蕴含地理事件微博客消息的自动识别方法,通过快速获取的语料资源增强识别效果。该方法利用主题模型具有提取文档中主题集合的优势,通过主题过滤候选语料文本,实现地理事件语料的自动提取。同时,将分布式表达词向量模型引入事件相关性计算过程,借助词向量隐含的语义信息丰富微博客短文本的上下文内容,进一步增强事件消息的识别效果。通过以新浪微博为数据源开展的实验分析表明,本文提出的蕴含地理事件信息微博客消息识别方法,识别来自事件微博话题的消息文本的F-1值可达到71.41%,比经典的基于SVM模型的监督学习方法提高了10.79%。在模拟真实微博环境的500万微博客数据集上的识别准确率达到60%。  相似文献   

6.
地理实体关系语料库是地理信息获取与地理知识服务的基础数据资源,其规模直接影响机器学习模型训练的效果。快速更新的网络文本不断涌现新的关系实例,要求语料库及时更新以覆盖更丰富的关系实例。手工构建和更新语料库成本高昂,亟需一种快速构建大规模地理实体关系语料库的方法。本文提出一种基于回标技术的地理实体关系语料库构建方法。首先,参考地理实体分类标准与语义关系、空间关系分类标准,针对地理实体关系的自然语言描述习惯,建立地理实体关系的标注体系;然后,结合精确匹配与模糊匹配策略,提高客体匹配的覆盖率;接着,基于优序图法建立句子打分规则,实现种子三元组到句子映射的定量评价;最后,使用中文百度百科文本验证方法的有效性。实验结果显示,本文方法平均回标成功率为67.83%,关系标注的准确率为76.36%。相比人工构建空间关系标注语料库的过程,本文提出的语料自动构建方法,标注速度快,规模大,为自动扩充标注语料库提出了可行方案。同时,该方法兼顾了地理实体间的语义关系和空间关系,且关系类型不受限,可用于开放式关系抽取任务。  相似文献   

7.
主流地图检索方法多基于元数据文本匹配或图像内容相似度计算,缺乏对用户意图的主动理解,导致检索结果欠佳;而现有意图识别方法无法准确表达与识别复杂地理概念联合约束的地图资源检索需求。为此,本文提出一种顾及地理语义的地图检索意图形式化表达与识别方法,旨在利用相关反馈样本“感知”用户需求,以提升检索精度。该方法通过地理本体约束“意图-子意图-维度分量”模型的构建,实现检索需求的语义化描述;并将意图识别视为组合优化问题,基于最小描述长度准则、顾及地理概念从属关系的样本随机合并策略及贪心搜索实现最优意图识别。实验结果表明,相比基于频繁项集挖掘的RuleGO、决策树的DTHF算法,本文方法具有更高的识别准确度与噪声容忍度;随机合并策略可在不降低识别准确性的情况下有效缩短平均求解耗时;样本增强策略保证算法在样本规模仅为20时仍具有较高识别准确度。该方法可望应用于地理信息门户,提升各类地理信息资源共享与发现的服务品质。  相似文献   

8.
提出了利用HTMLParser和PDFBox工具包来编程实现对Web网页文本内容自动提取和PDF文档格式的转换并这些数据进行处理来适合HTK语言建模工具的要求。最后通过实验证明了采用该方法可以较好地实现语言模型的自动更新从而适应识别对象不断变化,同时减少了识别过程中的集外词并提高了语言模型的性能。  相似文献   

9.
利用机器学习原理,提出一种基于多层全连接(multi-layer fully connected, MFC)神经网络的六分量(six-component, 6C)地震波极化向量识别方法。首先利用6C地震波各波型极化向量数学模型和一系列仿真参数得到5种波型和噪声波型各5 000个极化向量数据集,然后随机选取其中5 000个作为测试集,其余划分为训练集,进行MFC神经网络与支持向量机(support vector machine, SVM)的综合辨识性能对比实验。结果表明,MFC神经网络模型识别5种极化向量类型(SH波和Love波视为一类)和6种极化向量类型的效果均显著优于SVM模型,平均识别率分别达到99.786%和87.940%。  相似文献   

10.
港口目标识别是海事船舶监管的重中之重,船舶自动识别系统(Automatic Identification System,AIS)所获取的船舶活动信息,可为港口目标识别提供高时相和高精度的船舶航行数据。为了探究AIS数据在港口目标识别中的应用,提出一种基于多源数据和船舶停留轨迹语义建模的港口目标识别方法。通过数据挖掘和语义信息增强构建船舶停留轨迹语义模型,识别船舶港口停留轨迹;建立基于随机森林的船舶停留方式分类模型,分类船舶泊位停留轨迹和船舶锚地停留轨迹,并利用空间逐级合并方法提取港口泊位和港口锚地;综合船舶泊位停留轨迹、道路、海岸线、水深、土地利用与土地覆盖等数据,顾及情景-领域知识实现港口目标识别。基于2017年96 790艘船舶的超8300万条AIS轨迹记录,应用本文方法识别南海研究区的港口目标。实验结果表明,本文方法对于船舶轨迹停留行为总体分类精度为0.9477,Kappa系数为0.8948。提取出南海研究区447个港口区域,与Google Earth影像叠加验证结果表明,提取结果均位于真实的港口影像内,相较于Natural Earth数据集中包含的南海区域24个港口点位,提取结...  相似文献   

11.
现有的面实体多指标几何匹配方法在计算综合相似度和确定最终匹配实体时面临着指标权重和阈值难以科学量化的难题,集成学习算法通过构建并结合多个机器学习器来完成学习任务,在解决分类问题时体现出了较为明显的性能优势。为此,本文提出了一种基于集成学习算法CatBoost的面实体匹配方法,将匹配问题转化为分类问题。选取形状、面积、方向和位置4个几何特征作为模型分类特征;利用过采样与欠采样相结合的混合重采样技术减轻原始训练样本的类别不平衡度;借助贝叶斯优化算法确定CatBoost模型的最优超参数;引入可解释人工智能领域的SHAP解释框架从全局和局部两个角度解释各输入特征对匹配结果的影响。在青藏高原的面状湖泊数据上对本文提出的方法进行了验证,实验结果表明:对模型预测影响最大的特征是位置,然后依次是面积、形状,影响最小的特征是方向。CatBoost匹配方法在实验数据集上的查准率、查全率和F1-score分别达到0.9937、0.9753和0.9844,相比于直接使用样本不均衡的原始样本进行模型训练,分别提高了约5.8%、0.6%和3.3%。与传统的面实体多指标双向匹配方法和逻辑回归、K近邻、决策树、神经网...  相似文献   

12.
基于图像特征的地类识别技术精度低且复杂度高,难以满足土地利用动态监测的实时性要求。而基于深度学习的遥感影像地类识别技术数据处理及特征提取能力较强,能够有效提升识别精度,使地类信息获取更加智能化,因而被广泛应用于遥感影像地类处理。根据地类识别技术不同,可以分为遥感影像分割、遥感影像分类以及目标监测三种方式。每类识别技术根据训练数据是否有标注可以分为有监督学习、半监督学习以及无监督学习三种类型。通过对相关技术和文献的调研和分析,介绍各种深度学习模型的理论基础与基本结构,总结国内外基于深度学习的遥感影像地类识别方法的优缺点,并指出未来的发展方向。  相似文献   

13.
为避免密集人群踩踏事件发生,从监控图像中准确获取密集人群人数信息非常重要。针对密集人群计数难度大、人群目标小、场景尺度变化大等特点,本文提出一种新型神经网络结构VGG-ResNeXt。本网络使用VGG-16的前10层作粗粒度特征提取器,使用改进的残差神经网络作为细粒度特征提取器。利用改进的残差神经网络“多通道,共激活”的特点,使得单列式人群计数神经网络获得了多列式人群计数网络的优点(即从小目标、多尺度的密集人群图像中提取更多人群特征),同时避免了多列式人群计数网络训练难度大、结构冗余等缺点。实验结果表明本模型在UCF-CC-50数据集、ShangHaiTech B数据集和UCF-QNRF数据集中取得了最高精度,MAE指标分别优于其他同期模型7.5%、18.8%和2.4%,证明了本模型的在计数精度方面的有效性。本研究成果可以有效帮助城市管理,有效缓解公安疏导压力,保障人民生命财产安全。  相似文献   

14.
地址匹配是地理编码的核心基础,本文针对现有地址匹配算法与地址数据库反馈交互局限性问题,提出词汇-结构-语义三层解构地址的匹配处理策略。词汇层通过地名词典和结合尾字特征的正则表达式定义粒度剖分规则,以地址词元素为基本单元完成词汇级别解析;结构层定义地址模式类型以实例化数据组织,完成顾及上下地址层级结构的模型匹配;语义层抽象地址语义形式化表达,实现融合深度语义的地址匹配。同时,本文在综合地址词元素筛选、地址层级结构剖分和地址语义理解基础上对经过完全解析的地址数据不断反哺作为数据参考,从而实现数据库支持下的算法逻辑绑定与结果集成。本文以浙江省湖州市德清县地址数据作为实例进行验证,实验结果表明,在低重复率的多次采样实验下,平均匹配率达到92.83%,正确率为95.37%;通过实例分析表明,本文方法在完善地址参考库的基础上改进算法性能和精度,能有效解决地址结构缺失和语义近似推断,适应多样地址类型。  相似文献   

15.
道路等级不仅反映在路网结构的静态骨架信息上,也蕴含在轨迹数据呈现的动态语义信息上。为解决(OpenStreetMap)OSM路网部分路段及路网生成产品等级缺失问题,本文提出一种顾及路网与轨迹多模特征的道路等级分类方法。首先通过轨迹数据的清洗、地图匹配和基于路名的路网合并实现轨迹点与命名道路的联结;然后以命名道路为分析单元,综合考虑路网及轨迹数据,在系统分析路网结构的道路几何特征、道路分布特征、道路拓扑特征及道路单双向信息基础上,进一步挖掘与融合轨迹数据蕴含的道路宽度、道路车流量、道路速度等静动态特征,形成关于道路等级的描述特征集,作为识别道路等级的基础与依据;最后以随机森林(RF)为基本分类器进行特征选择及模型训练实现道路等级识别。为验证本文方法,选取武汉市汉正街区域及二环区域,基于OSM路网数据及众源轨迹数据开展试验。该方法取得了较好的分类结果,小范围汉正街区域的验证集准确率为91.2%,大范围二环区域的验证集准确率达到80.8%。与单类特征相比,集成路网与轨迹特征极大提高了道路等级分类准确率;与原始路段形式进行道路等级分类相比,以路名重构道路形式进行道路等级分类效果更好。  相似文献   

16.
知识图谱作为人工智能技术与应用中重要的数据基础设施,已经成为地理科学领域的一个研究热点。目前对地理知识图谱进行嵌入表达时通常使用默认的超参数(如2层网络搜索深度),但是部分地理知识图谱的网络规模和拓扑特征与通用知识图谱不同,其合理性需进一步论证。为此,本文围绕城市轨道交通人地关系,基于地铁线路网络的拓扑结构特征,结合客流数据、POI(兴趣点)数据以及建成环境数据等构建地铁出行知识图谱;利用GraphSAGE模型学习实体的多维度特征嵌入,并结合POI数据对站点分类结果进行语义识别,对比验证适合地铁出行知识图谱嵌入表达的网络搜索深度。不同于默认的2层搜索深度,当搜索深度为3层时,本研究所构建的地铁出行知识图谱的节点嵌入效果最优。因此,地理知识图谱嵌入表达的超参数选择需要顾及时空和人类活动相关的网络规模和拓扑特征,要避免不加甄别地使用其他领域通用知识图谱的已有成果。使用3层搜索深度获得的地铁站点分类结果也更具合理的解释性,可为利用知识图谱和人工智能方法进行站点规划和客流预测提供基础。  相似文献   

17.
遥感卫星数据是地球表面信息的重要来源,但利用传统的遥感分类方法进行土地覆盖分类局限性大、过程繁琐、解译精度依赖专家经验,而深度学习方法可以自适应地提取地物更多深层次的特征信息,适用于高分辨率遥感影像的土地覆盖分类。文中对高分辨率影像中水体、交通运输、建筑、耕地、草地、林地、裸土等进行高精度分类,结合遥感多地物分类的特点,以DeepLabV3+模型为基础,作出了以下改进:(1)骨干网络的改进,使用ResNeSt代替ResNet作为骨干网络;(2)空洞空间金字塔池化模块的改进,首先在并联的每个分支的前一层增加一个空洞率相对较小的空洞卷积,其次在分支后层加入串联的空洞率逐渐减小的空洞卷积层。使用土地覆盖样本库和自制样本库进行模型训练、测试。结果表明,改进模型在2个数据集的精度和时间效率均明显优于原始DeepLabV3+模型:土地覆盖样本库总体精度达到88.08%,自制样本库总体精度达到85.22%,较原始DeepLabV3+模型分别提升了1.35%和3.4%,时间效率每epoch减少0.39 h。改进模型能够为数据量以每日TB级增加的高分影像提供更加快速精确的土地覆盖分类结果。  相似文献   

18.
以图结构表达的知识图谱不仅在语义网络的描述与推理中发挥着重要作用,对于空间实体的结构化抽象与空间推理也具有重要意义。空间实体的联系信息在知识图谱中以图的边记录,通过路径探测、子图对齐、模式发现等基于边的知识图谱计算推理,在空间场景认知可发挥重要作用。地理知识图谱是一种对地理概念、实体及其相互关系进行形式化描述的知识系统,既有通用知识的内涵与特点,也有地理知识特定的时空特征,能够将语义模型和时空模型联系起来,描述语义关系、空间关系和时间关系,在地理知识的表达、理解、获取与推理方面有巨大的应用潜力。现有地理知识图谱的研究工作多集中于语义方面,语义关系的抽取与表达比较丰富,可以支持进一步的地理知识语义搜索等功能;然而地理知识图谱在时空模型上的知识表达比较缺乏,现有的空间关系局限在要素之间,很少涉及空间认知中进一步的分布态势、空间格局等,地理知识图谱在空间语义知识方面有待增强。本文基于知识图谱构建原理,以建筑群地理知识图谱构建为例,实现格网型建筑物模式的识别。先将建筑物抽象成实体,表达为图的节点,基于几何邻近分析提取建筑物之间的空间邻域关系,以此构建建筑群地理知识图谱;在此基础上结合建筑物模式...  相似文献   

19.
本文依据增强现实数字地图与地理场景在时空、尺度和语义等的上下文关联性,研究并划分了包括存在上下文关联的地理实体空间载体、模型实体空间载体,以及不存在上下文关联的虚位空间载体三类AR地图载体。选取二维纸质地形晕渲图、三维打印地形实体模型、以及桌面虚位空间3种不同类型载体的AR地图为研究对象,以目标搜索和路径规划为任务目标,开展不同载体AR地图空间认知实验研究。结果表明,在2组实验中三维实体模型载体AR地图的认知负荷指数(CLI)分别为2.53和4.84均显著低于二维地图和虚位载体,具有认知负荷低、沉浸在场感强的认知特征;二维地图载体的认知负荷指数略低于虚位空间载体,但两者并无显著差异;同时,两组实验对比分析结果显示,随着任务难度提升,二维地图载体和虚位空间载体AR地图的认知负荷显著增加,但三维实体模型载体AR地图的认知负荷未显著增加,表明实体模型载体在面向复杂空间认知任务时具有较低认知负荷的优势。此外CLI和任务难度的同步变化也表明脑电数据对空间认知实验敏感,能有效反映空间认知实验过程中的认知特征变化。  相似文献   

20.
去噪小波包能量法在水声信号识别中的应用   总被引:1,自引:0,他引:1  
对小波包能量法进行改进,提出了一种新的方法——去噪小波包能量法,该算法对信号小波去噪后,再用小波包能量法提取信号的特征;应用去噪小波包能量法研究了不同的小波去噪方法对水声信号分类识别率的影响,在实测信号样本集上用BP神经网络进行了识别实验。结果显示软阈值、硬阈值、弹性阈值3种标准的小波去噪方法均能明显提高信号识别率,其中最为显著的是软阈值标准去噪,信号的识别率可由未去噪的53.3%提高到98.3%,表明算法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号