首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
本文围绕互联网中网页文本蕴含的丰富地理空间信息,抽取网页文本中蕴含的地名实体,提出了一种地名共现网络模型,该模型综合考虑网页中地名的频次信息,表达网页文本中地名的共现及联系传递特征。在此基础上,提出一种基于链接分析的网页文本核心地名的提取方法,通过PageRank算法计算每个地名在共现网络中的链接权重,对网页文本构建的共现地名网络进行核心地名的提取,从而在庞大的网络资源中发现具有显著的焦点特征或导航枢纽特征的重要地名。最后,采用人民日报与新浪新闻体育版2份语料进行实验验证,证明了该方法的有效性。  相似文献   

2.
考虑地理距离的复杂网络社区挖掘算法   总被引:1,自引:0,他引:1  
复杂网络具有社区结构的性质,即社区内节点的连接比社区间的连接更为紧密。目前,具有复杂网络拓扑结构的社区挖掘算法已有很多,但在很多地理空间的复杂网络中节点间的紧密度,不仅与其连接关系有关,同时与它们之间的距离有关。因此,本文提出将节点间的地理距离考虑到社区挖掘的过程中,修改基于模块度增量矩阵的Newman快速算法(简称CNM算法),将1 din(jd为节点i与节点j之间的距离)作为边权,对加权网络进行社区挖掘,从而发现既相互联系紧密又在地理空间上相互接近的社区。最后,本文用国内航线网络作为实例,将算法用于挖掘航线网络中城市的社区结构,得到10个在航线网络中联系紧密且在空间分布上具有一定地域性的城市社区,与我国的主要经济区域分布比较一致。本算法考虑地理相关性和连接紧密性,较好地识别出空间网络的社区结构。  相似文献   

3.
企业间的联系是城市联系的重要组成部分,加强对基于企业间联系的城市功能网络分析对丰富城市网络理论研究具有重要意义。采用2010—2020年上市公司与其前五大客户间的贸易关系数据构建了中国城市网络,基于企业间的贸易联系视角分析城市网络时空演变特征。研究表明:(1) 2010—2020年间城市网络规模呈现先升后降的特征,整体网络密度较低,位于0.014~0.018之间;网络重心呈现“S”形空间轨迹变化和整体向南移动的趋势,网络总体空间结构由沿海向“T”形结构转变;(2)网络流量集中于少数节点城市,资金进出量前20城市总额占资金总流量的71.9%,北京、上海是网络的绝对核心,杭州、武汉、深圳、广州等省会或副省级城市承担着区域中心的功能,佛山、齐齐哈尔、南通等制造业发达城市是重要节点;(3)五大城市群中珠江三角洲网络密度最高,位于0.324~0.334之间,长江三角洲贸易总流量最高,为783.5亿元,长江中游城市群和成渝城市群网络发育相对滞后;(4)新冠疫情对整体网络的贸易流量和网络结构产生了明显影响,网络社团进一步分化重组,广州—深圳社团明显增强,上海社团明显减弱。研究结果对推动国内大循环和统...  相似文献   

4.
出游时长与旅游行为密切相关。基于携程网游记数据,综合利用文本挖掘、地理信息系统空间分析、社会网络分析等方法,挖掘1~3 d、4~6 d和7~10 d三种出游时长下旅游景区到访特征。结果表明:(1)短途旅游受景区知名度、可达性与城市配套的影响,随时长增加,旅游景区“多核摄动”且密织成网;(2)旅游景区到访空间异质性显著,随出游时长增加,从金三角逐步发展为钻石四边形结构,知名景区溢出效应显著;(3)短时旅行只能走马观花,时间充裕有助于灵活多样的线路设计;(4)三种出游时长下旅游景区共现网络整体密度较低,且随出游时长的增加而逐渐变密,均呈现显著的等级层次性和核心–外围结构特性。  相似文献   

5.
基于互联网大数据的区域多层次空间结构分析研究   总被引:1,自引:0,他引:1  
大数据逐渐成为各领域学者开展研究的重要途径,目前在人文-经济地理学界逐渐得到重视,并进行了初步应用,相关研究依据尺度不同可以分为居民出行和消费、城市空间结构、区域社会经济联系等。但目前大数据在人文-经济学的应用研究还属起步阶段,少有研究基于大数据对区域多层级空间结构进行系统甄别分析。本文在采集互联网大数据的基础上,结合统计数据、交通路网等传统数据评价城市综合实力、城际联系强度,并基于此构建区域空间结构计算机算法分析区域多层级空间结构。京津冀案例应用揭示了京津冀多层级体系结构,确定了各城市辐射范围、城际相互作用关系。本文初步探索使用互联网大数据甄别区域空间结构,希望能为人文-经济地理领域开展大数据应用研究提供参考。  相似文献   

6.
基于社交媒体的签到数据,运用社会网络分析方法,选取长三角26个地级市作为研究对象,以从百度地图获得的时间距离作为各城市间距离,结合游客微博签到数据计算了长三角城市联系网络的网络密度、中心度等指标,分析了城市联系的网络特征。同时利用2015年各城市统计年鉴数据与从百度地图获得的城市间的距离,利用经济引力模型计算了城市间的理论联系强度。以社交媒体签到数据为地区实际联系强度,以计算出的经济联系指数为理论联系强度,探讨实际联系强度与理论联系强度之间的耦合协调度,得到各城市理论与实际的协调状况,为相关决策提供支持。  相似文献   

7.
网络游记是旅游者在互联网上发布的自述性旅游过程记录,描述了旅游的前后过程和感受体验。从网络游记文本中提取旅游行程链,分析行程结构,能给游客的行程制定、线路设计提供重要的参考。传统的游记文本行程提取大多依赖于人工识别文本中的行程节点,再进行串联、合并处理,工作量较大。自动提取游记文本中的旅游行程链,能够提高数据处理和分析效率。本文基于自然语言处理技术,在深入分析游记网络文本的段落结构和表达特点的基础上,归纳了行程节点和节点次序关系的句法表达规则,构建了行程节点触发词表,进而提出了基于句法规则的旅游行程链提取方法,主要包含行程节点的识别、节点次序关系的识别和旅游行程链的生成,能实现网络游记文本的旅游行程重构。本文采集了蚂蜂窝平台17 226篇南京市网络游记文本数据,采用最长公共子序列算法,开展了本文方法的试验验证。通过对比分析,本文方法提取的旅游行程链和人工识别的真实行程链相似度达到86.14%,高于实体关系抽取领域的BERT-BiLSTM-CasRel深度学习模型的83.1%。相比现有关系提取类深度学习方法需要开展大量的数据标注,本文方法计算更加便捷,准确率相对较高,仅需构建区域旅游点名...  相似文献   

8.
城市兴趣域的识别对城市研究具有重要的现实意义。当前识别大多是通过遥感影像以及实地调查,采用欧式距离的区域范围估计方法实现,没有考虑城市居民活动以及道路结构约束对兴趣域产生的影响。本研究提出一种结合网络评论数据和道路约束的城市兴趣域识别方法。首先,采用约束Delaunay算法,对空间结构复杂的道路进行简化;继而,设计基于Epanechnikov核函数的网络核密度算法,实现顾及道路约束的城市兴趣域空间范围的划分;最后,通过网络评论数据中的评论次数与评论文本,量化城市兴趣域的吸引程度,并依此判别其功能类型,从而实现兴趣域的识别。实验以广州市越秀区为例,成功识别出了宜安广场、北京路等城市兴趣域。该方法对城市空间结构的精细化识别、分析和规划具有重要的现实意义。  相似文献   

9.
水环境监测数据在水环境敏感性评价中起关键作用,然而受地形、环境、站点布设等因素影响存在缺失或不足的问题。为此,本文选取福建省为实验区,以2017年4-6月该省重点平台采集的网络文本数据为数据源,从水环境网络文本敏感度、污染敏感度和保护敏感度3个方面分析遴选出13个评价因子,基于模糊层次分析法结合网络文本构建水环境敏感性评价模型,分类验证评估结果的合理性。结果表明:① 从网络文本敏感度看,该省东部-中北部地区高于西部-中南部地区,高敏感区分布集中在闽江下游地区;② 从污染敏感度看,该省南部地区高于北部地区,高敏感区主要分布在汀江中下游、晋江下游和龙江等区域;③ 从保护敏感度看,该省西北-中南地区高于东北-西南地区,高敏感区主要分布在闽江上游支流建溪、木兰溪、萩芦溪等区域。综合各敏感度因子分析后发现全省水环境敏感度整体从东南-西南-北部-中部-东北依次减小,东沿海经济发达区和河流入海口等区域呈现出高敏感性,与实际情况相符。本研究使得水环境敏感性评价结果更具合理性,对于预测或排查水环境高敏感污染风险区、重要保护区及公众关注区具有一定的实用意义。  相似文献   

10.
迁徙流作为互联网时代的新产物,信息流、资本流、交通流等流空间的基本载体,能客观地反映城市间地理行为关系,对于刻画城市网络结构具有重要意义。基于地级以上城市的百度迁徙大数据,本文尝试从全域和净迁徙的视角探索研究中国城市网络结构特征,对其网络的层级、关联关系和影响因素等进行挖掘提取。研究发现:① 全国城市网络呈现出稳定的、层级明确的三棱锥四顶点“钻石型”结构,与主要城市群的经济规模空间分布相吻合;② 区域网络表现出向高级别行政中心集聚的“核心—外围”放射状结构;③ 以省会城市为核心的典型小世界特征比较凸出,小世界网络的可达性和连通性较高;周口、阜阳、赣州、上饶、重庆等作为主要劳动力输出型城市,深圳、东莞、广州、北京、上海等城市成为了主要的外来人口聚集地,并形成了对应的人口就近输送网络关系;④ 城市的行政地位、经济规模、交通枢纽建设、劳动力资源等因素都对其网络控制力和影响力起到了决定性作用。最后,研究结合中国城市网络结构特征及其主要影响因素,提出相关政策建议,以期为中国城市网络结构均衡发展与建设提供借鉴依据。  相似文献   

11.
研究城市功能子区域的动态演变特征可以帮助人们理解城市发展规律和进行城市规划,然而对这种动态性进行分析的手段一直以来较为匮乏。城市出行大数据的出现虽然提供了刻画和分析功能子区及其动态的工具,但是在方法层面仍缺乏克服长时期出行数据内在时空随机性的方案。本研究尝试从长时间段人口稳定流动的层面来分析城市内部是否存在具有完备功能的子区域。将具有完备功能的子区域定义为城市结构中内部流量显著高于外部连通流量且相对稳定的子区域的集合,并利用多年份的出租车轨迹数据来构建城市居民出行网络,进而利用网络分析中的社团发现算法来探测城市的完备功能子区域及其随时间的动态变化。为了实现这一目标,本研究提出了一种针对时序轨迹数据的时空耦合网络模型,尝试克服多年份出租车出行数据中潜在的时空随机性(如:时空突变),并在此模型的基础上提出了一种基于多层网络社团发现算法的城市完备功能子区动态探测手段,实现对城市完备功能子区域时空演变的追踪分析。最后,以北京市2012—2017年的出租车轨迹数据为例,使用该方法实现了北京市城区完备功能子区的动态探测,进而揭示了4类不同完备功能子区域的特征与发展态势。  相似文献   

12.
以湖北省为研究对象,基于铁路客流的动态关系数据,采用城市网络连锁模型,以城市之间铁路客流的流动性和集聚性为研究切入点,辨析省域城市的网络关联强度和空间组织结构特征。研究表明:① 湖北省域城市网络结构初步形成,整体呈现“东强西弱,北低南高”的态势,省域“单中心”网络格局特征突出,武汉是链接鄂东、鄂中、鄂西三大区域的核心枢纽;② 中心城市指向性和地域邻近指向性特征明显,整体受省域中心城市武汉的影响较大,与之紧密联系的周边城市是构成武汉“1+8”都市圈的主体;③ 交通轴线是客流联系的主要方向,以“十堰—襄阳—荆门—武汉”、“恩施—宜昌—荆州—武汉”等城市为主体的“>”型城市带,其空间组织结构联系较为紧密,是推动湖北省经济发展和实施城镇化战略的重要载体,同时襄阳、宜昌在鄂西地区的枢纽作用日益凸显。最后基于实证研究结论,为省域空间规划的要义、趋势和取向提出了若干探讨。  相似文献   

13.
研究旅游景点语义交互及交互作用模式,对根据游客需求优化旅游格局有重要意义。现有语义交互挖掘方法忽略了文本中包含人感知信息的上下文词汇;此外,缺少以景点交互为单位分析交互作用模式的研究。为此,本文提出了一个景点间细粒度语义交互作用挖掘和模式分析框架。首先抽取文本中景点交互的语境;然后利用TF-IDF关键词抽取和语义网络分析方法,从讨论焦点和语义结构角度挖掘景点间细粒度的语义交互作用;最后结合Spearman秩相关系数、Graph Kernel图相似度度量方法和网络分析方法,分析语义交互作用模式。以云南省2018年游记数据进行实例分析,结果表明:① 利用本文提出的框架可以挖掘和分析各个景点间细粒度的语义交互作用,辅助有关部门结合游客意见提升旅游体验;可以分析语义交互作用模式,发现优化旅游格局的关键路线片段;② 苍山-洱海应着重提升自然风光体验;而大理古城-洱海应考虑改善游客对品牌旅游资源关注不足的问题;③ 云南省单核心集聚型、单核心辐射型、多区域合作型景点语义交互模式共存,呈现出点轴渐进扩散特征。可利用中介中心性较高且跨区域的景点交互,推动其他2种模式向多区域合作型转化,推进全域旅游战略实施。本文研究可为旅游路线推荐以及平衡旅游格局提供参考。  相似文献   

14.
为对城市各区域出租车OD轨迹流进行可视化分析,需对城市作空间剖分处理,以产生研究所需的子区域。传统的欧氏距离空间剖分方法,在空间上进行硬性切割不能有效地顾及城市人、物的时空流动模式,因此,本文提出了一种空间约束条件下,顾及出租车OD点分布密度的网络Voronoi剖分方法。首先,将道路网的边细分成线性单元,然后,设定空间约束以产生合适的发生元,让各发生元在路网上以线性单元为单位扩散步长,以不同的速度向周围联通道路进行扩散,最终将城市空间划分成一系列与出租车OD点分布密度相适应的空间子区域。利用OD流可视化理论与技术,基于划分的城市子区域分析出租车在这些区域的时空流动,并结合图论知识探究城市空间OD流拓扑图结构的变化,分析不同划分区域出租车流动模式。最后,通过北京地区一天的出租车轨迹数据,对本文提出的算法及分析方法进行了实验。  相似文献   

15.
提升城市群知识创新网络结构韧性,有助于建设安全的区域创新体系,保障城市知识创造职能。基于2011—2021年长三角41个城市间合作发表WOS论文数据构建城市群知识创新网络,基于演进韧性理论与复杂网络理论,构建网络结构韧性的“脆弱性-抗毁性-恢复性-演进性”四维评价指标体系,采用社会网络分析和GIS空间分析技术刻画网络结构韧性的时序演化与空间格局,运用GTWR和MRQAP模型识别其驱动因素。结果表明:(1) 2011—2021年长三角城市群知识创新网络结构韧性呈上升趋势,立体化特征减弱,传输环境优化,异质性联系减弱,一体化属性增强,且呈现“中部高南北低,东高西低”的差异化空间布局;(2)韧性主导节点为上海、南京、杭州、合肥、苏州等核心城市,确保主导节点的稳定性是保障网络结构韧性的关键;(3)科教支持和产业结构对城市节点韧性具有显著正向驱动力,经济发展、对外开放、人力资本与知识基础的解释力具有鲜明的空间异质性,发挥双因子交互作用可有效推动网络结构韧性演化;(4)网络聚合效应、匹配效应、虹吸效应以及邻近性均驱动网络结构韧性演化,网络拓扑结构、产业相似和人资相似、良好的教育环境,以及制度、社会...  相似文献   

16.
网络环境下,如何让用户快速发现所需数据是地学数据共享平台长期面临的挑战之一。本文基于国家地球系统科学数据共享平台网站服务器日志数据获取用户搜索行为及数据集访问行为,使用聚类算法挖掘用户行为模式,并基于会话聚类 模式开发在线搜索和访问预测算法。在数据预处理阶段,对原始服务器日志数据进行清洗、用户识别、用户会话识别、搜索词提取。在模式挖掘阶段,采用DBSCAN算法对会话进行聚类。考虑到会话向量值的二元性,聚类算法中的距离采用Jaccard距离函数计算。视每个会话聚类包含的搜索词集合为一个文本,所有用户历史搜索词集合为语料库,统计各聚类中搜索词的TF-IDF值。在线搜索推荐,以搜索词检索各聚类中TF-IDF值,返回TF-IDF值最高的搜索词所属聚类,并给出该聚类的高频项目作为推荐。在线访问推荐,则以用户实时访问向量为查询向量,计算该向量与聚类中心的聚类。根据聚类排序,给出距离最近的聚类,并产生该聚类中高频项目作为推荐。实验结果表明基于TF-IDF和聚类的搜索推荐有较高的准确率和召回率,访问推荐效果基于高频统计的推荐有较大提高。研究可得出以下结论:① 地学共享网用户访问和搜索行为体现了专业性的特点,其行为较普通网站用户可预测性更好;② 对于地学数据共享用户行为预测,需明确定义用户行为,并采用合适的距离函数描述行为相似性;③ 通过搜索词TF-IDF值来预测用户数据需求的方法可行,以此产生的推荐可作为搜索结果的补充。本研究可服务于地学领域数据共享平台建设,提高共享服务质量,也可为其他领域科学数据共享提供技术方法借鉴。  相似文献   

17.
城市住宅价格时空格局及演变特征是衡量城市房地产市场发展均衡性的重要指标。针对海量的互联网实时房产数据,本文构建了一种长时序时空大数据挖掘方法。首先,利用挂牌数据和成交数据,进行了泛在网络地产数据的可用性验证;其次,提出了“混合像元”的多尺度栅格模型,以构建基于栅格系统的房产统计特征描述,形成了多源网络房产数据融合方法;然后分别采用莫兰指数和地理探测器分析房价的空间自相关性和分异性,并基于P-Bshade和邻近栅格时空插值算法解决了稀疏房产数据的融合与插值问题,构建了长时序房地产时空栅格数据库;最后,以北京六环范围内为研究区域,通过栅格区划算法进行了二手房价格时空演变格局的挖掘分析。  相似文献   

18.
随着智能移动终端和社交网络应用的普及,越来越多的人愿意通过社交网络平台进行交流和表达自己的情感,因此产生了大量含有地理位置、文本内容等多种信息的用户生成数据,为大数据时代的城市研究及特定时空间内个体感知和行为活动研究提供新的数据源。本文基于2012-2014年约54万条微博用户数据,探测民众对包括春节、元宵节、清明节、端午节和中秋节在内的中国传统节日的情感表达和关注热点,以期发现在城市化与全球化影响下,人们对中国传统节日的认知变化和区域特征。通过Python 3.6进行词频分析及LDA主题模型分析可知:① 春节是中国人主题感知最为强烈的节日,且多为对新年美好祝愿的表达,其次是中秋节,以回家团聚为主,另外情人节也成为一个显性的节日;② 传统节日期间,出行方式以飞机和汽车为主,机场和高速成为与节日活动密切相关的场所;③ 共识性岁时习俗整体感知较好,但各地域特色节庆活动及饮食习俗在表现形式上有所差异,且差异在逐渐减小;④ 词频分析较好地反映了微博用户对中国传统节日的普遍感知及具有地方特色的区域差异,而LDA主题模型分析能够反映一定的传统节日主题聚类结果,但对不同节日的主题聚类效果并不十分明显。  相似文献   

19.
多中心组团发展是优化区域空间结构的重要路径,由此带来的城市空间扩展模式包含邻接型与跳跃式,亟需研究顾及城市空间多模式扩展的模拟技术。既有研究难以较好实现跳跃式斑块的模拟,主要存在无法展现城市增长过程或选取的“扩展种子点”随机性过大或模型适用尺度较小等问题。本文提出了一种耦合最大熵模型(MaxEnt)与近邻传播聚类(AP)的MaxEnt-AP-CA模型:利用MaxEnt模型寻找跳跃式扩展备选区域并进行筛选,减小了种子点的搜寻范围,降低了随机性和运算数据量,适用于更大尺度;结合AP算法得到种子点,展现跳跃式斑块的增长过程;引入“生长系数”实现多模式扩展的同步模拟。以重庆市主城都市区为研究区,使用MaxEnt-AP-CA模拟了2010—2020年城市用地的扩展情况,研究发现:(1) MaxEnt-AP所求种子点命中实际跳跃式斑块的准确性显著提高;(2)在精度指标上,最优参数下,MaxEnt-AP-CA的FoM峰值达到0.3061,精度相比传统CA模型具有明显提高;景观形态上,MaxEnt-AP-CA在斑块规模、破碎度、聚集度上与实际情况更为接近,且能保留更多的斑块形状特征,最优模拟结果与实际...  相似文献   

20.
有效识别旅游资源供需空间匹配特征是提升旅游资源利用效率、优化旅游资源空间布局、推进旅游高质量发展的关键所在。随着空间信息技术的迭代更新,多源数据为旅游资源供需空间匹配及其交互关系拓展了新的研究视角,其中POI和数字足迹的挖掘为旅游资源供需匹配的研究提供了有力的数据支持。本研究选取山东省胶东经济圈为研究区域,基于高德地图、同程网和马蜂窝网络游记平台等多源数据渠道,获取2016—2021年胶东经济圈旅游资源的POI数据和旅游流的“O-D”数据,在此基础上运用核密度估计和复杂网络分析分别识别二者的空间结构特征,并进一步结合空间匹配测算模型探索胶东经济圈旅游资源供需匹配的时空演化规律。研究表明:(1)胶东经济圈旅游资源供给呈“康乐游憩类、公共休闲类、观赏科普类、宗教祭祀类”梯度递减的数量结构特征,以及“整体聚集、局部分散”的空间分布特征;(2)旅游流在时间上节假日效应和季相性特征明显,在空间上“陆海”差异显著,其中疫情发生前表现出由海岸向陆域扩散的态势,后疫情常态化下旅游流渐有复苏迹象;在类型结构上,康乐游憩类和公共休闲类成为旅游需求的主导类型;(3)旅游资源供需匹配关系的空间结构可划分为供需...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号