首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
分析中医疾病数据库,寻找有效可靠地算法挖掘疾病症状的权重,为医生临床诊断提供决策支持。以成都中医药大学附属医院的诊疗决策支持系统提供的中风数据、哮喘数据作为实验数据来源,首先对数据进行规范化预处理,再通过Apriori算法对数据降维,最后应用Logistic算法求出疾病症状权重。结果:挖掘结果与临床经验相符,算法运行时间也在可接受范围内。文章提出的方法对中医疾病症状权重进行挖掘是可行的。  相似文献   

2.
为了进一步准确过滤对青少年危害较大的色情网页,在汉语词法分析系统添加去禁用词功能实现中文分词,通过改进的词频-逆文档频率及文档频率-互信息方法完成特征提取,从而实现基于支持向量机的过滤方案。并在给出的余弦夹角公式的基础上,提出了一种基于余弦夹角法的中文网页过滤方案。结合两种方案,实验证明在统一资源符总库存在条件下方案对色情等网页过滤效果进一步提高。  相似文献   

3.
网络新闻文本在环境污染事件感知方面具有重要的应用价值。然而,由于环境污染事件的“多米诺效应”,网络新闻文本往往存在对多类型污染事件的混合描述,现有事件检测方法容易导致文本分类错误。本文提出一种基于联合主题特征的网络新闻文本蕴含环境污染事件检测方法,通过兼顾环境网络新闻文本的全局特征和主题分布特征来改善检测分类效果。该方法采用词频-逆文档频率向量对文档进行全局特征表示,并结合文档的主题分布特征向量,构建联合主题特征向量作为监督分类模型的输入,实现环境污染事件检测。实验结果表明,使用联合主题特征的支持向量机方法进行事件类别检测平均F1值相较于全局特征提高15%,相较于主题特征提高36%。本文提出的网络新闻文本蕴含环境污染事件检测方法可支持污染事件类型检测和影响信息抽取,有助于环境污染事件的时空统计与变化趋势预测。  相似文献   

4.
为建立高精度的BDS钟差预报模型,提出一种基于改进的萤火虫算法优化的分数阶离散型灰色系统SAFA-FDGM(1,1)钟差预报模型。为避免萤火虫算法陷入局部最优解,提高萤火虫算法的优化能力,本文引入惯性权重因子,同时对吸引力因子、步长因子进行改进;利用改进的萤火虫算法自动优化选取FDGM(1,1)分数阶因子来提高FDGM(1,1)数据拟合精度。分别采用C02(GEO)、C09(IGSO)、C12(MEO)三种不同类型卫星的钟差数据进行实验分析,结果表明,本文预报模型优于传统二次多项式模型与GM(1,1)模型,其中3~6 h预报误差小于1 ns,9~12 h预报误差优于2 ns,对建立高精度的BDS卫星通用钟差预报模型具有重要参考价值。  相似文献   

5.
以自建航海英语报刊语料库为基础,探讨如何在航海英语阅读教学中利用报刊英语语料库辅助教学,引导学生借助语境共现、词频表和关键词表等来进行英语学习,以达到快速掌握航海英语词汇,提高阅读速度和增强阅读理解能力,培养学生的跨文化交际意识等教学目标。  相似文献   

6.
应用主分量分析法计算出四川旱、涝、震频率之间的相关权重,提出了灾害之间相继诱发率概念。根据四川旱、涝、震频率之间的相关权重和诱发率矩阵,对3种灾型进行了预测。预测结果与实况符合。  相似文献   

7.
分析针灸处方数据库,从治疗某一种疾病的所有腧穴中寻找主要腧穴,为医生提供决策支持。数据以名老中医针灸处方为基础,将治疗疾病的腧穴字段分解成标准腧穴并建立网络关系。将网络分析方法k-core改进,寻找腧穴网络关系中的主要腧穴。对数据库中存在的67种疾病逐一验证,主要腧穴个数的范围为3~9个,符合针灸腧穴配伍规律。结论:k-core改进方法能够有效地寻找出治疗疾病所用到主要腧穴。  相似文献   

8.
地理实体关系语料库是地理信息获取与地理知识服务的基础数据资源,其规模直接影响机器学习模型训练的效果。快速更新的网络文本不断涌现新的关系实例,要求语料库及时更新以覆盖更丰富的关系实例。手工构建和更新语料库成本高昂,亟需一种快速构建大规模地理实体关系语料库的方法。本文提出一种基于回标技术的地理实体关系语料库构建方法。首先,参考地理实体分类标准与语义关系、空间关系分类标准,针对地理实体关系的自然语言描述习惯,建立地理实体关系的标注体系;然后,结合精确匹配与模糊匹配策略,提高客体匹配的覆盖率;接着,基于优序图法建立句子打分规则,实现种子三元组到句子映射的定量评价;最后,使用中文百度百科文本验证方法的有效性。实验结果显示,本文方法平均回标成功率为67.83%,关系标注的准确率为76.36%。相比人工构建空间关系标注语料库的过程,本文提出的语料自动构建方法,标注速度快,规模大,为自动扩充标注语料库提出了可行方案。同时,该方法兼顾了地理实体间的语义关系和空间关系,且关系类型不受限,可用于开放式关系抽取任务。  相似文献   

9.
为克服多项式模型在卫星频率快速变化期间精度衰减快的问题,提出一种基于LSTM神经网络的钟差预报模型。与多项式模型的对比实验结果显示,在卫星钟平稳运行期间,两种模型的结果几乎一致;在卫星钟输出频率发生快速变化时,LSTM神经网络模型的预报精度较多项式模型提高显著,仍能提供较高精度的钟差预报结果。  相似文献   

10.
基于显著区域提取技术,对复杂的视频镜头中动静结合显著图的提取技术进行了改进,提出由动态模型和静态模型两个特征要素作为线索提取动静结合的提取方法。方法对复杂运动镜头下运动特征的选择敏感度较高,实验验证表明,提出的动态模型和静态模型以自适应权重增减的融合方式得到的动静结合显著图与以往相比,精准度较高,也更接近于人类视觉机制的选择。  相似文献   

11.
矿区地裂缝精准识别对防灾、减灾和生态环境修复具有重要意义。针对高分辨率无人机影像较难自动精确提取地裂缝的问题,本文提出了一种基于改进主动轮廓模型的无人机影像矿区地裂缝提取方法。首先,采用Otsu算法计算背景和地裂缝初值作为先验知识;其次,构建背景和地裂缝初值的提取能量函数,并引入到传统CV主动轮廓模型,增强地裂缝提取的针对性;最后,通过轮廓的不断演化实现地裂缝的提取。以内蒙古扎赉诺尔矿区为研究区、无人机影像为数据源,采用改进主动轮廓模型方法进行地裂缝提取,并与传统的Canny边缘检测算法、支持向量机(SVM)、最大似然(MLM)和传统CV主动轮廓模型方法进行对比分析。结果表明:在地物类型较为单一的小范围区域,传统的Canny边缘检测算法和传统CV主动轮廓模型提取效果较差,改进主动轮廓模型、SVM和MLM共3种方法均可以取得较好的效果,其中,改进主动轮廓模型方法精度最高;在地物类型相对复杂的大范围区域,传统的Canny边缘检测算法、SVM、MLM和传统CV主动轮廓模型方法存在较多的漏提和误提,Kappa系数均低于0.7,而本文改进主动轮廓方法依然可以取得较好的效果,Kappa系数达到0.9左右。因此,本文提出的方法通过引入先验知识可有效提高地裂缝提取的精度和稳定性。  相似文献   

12.
园林植物知识图谱可为顾及区域适应性、观赏性和生态性等因子的绿化树种的选型提供知识支持。植物描述文本的实体识别及关系抽取是知识图谱构建的关键环节。针对植物领域未有公开的标注数据集,本文阐述了园林植物数据集的构建流程,定义了园林植物的概念体系结构,完成了园林植物语料库的构建。针对现有Word2vec、ELMo和BERT等语言模型存在无法解决多义词、融合上下文能力差、运行速度慢等缺点,提出了嵌入ALBERT(A Lite BERT)预训练语言模型的实体识别和关系抽取模型。ALBERT预训练的动态词向量能够有效地表示文本特征,将其分别输入到BiGRU-CRF命名实体识别模型和BiGRU-Attention关系抽取模型中进行训练,进一步提升实体识别和关系抽取的效果。在园林植物语料库上进行方法的有效性验证,结果表明ALBERT-BiGRU-CRF命名实体识别模型的F1值为0.9517,ALBERT-BiGRU-Attention关系抽取模型的F1值为0.9161,相较于经典的语言模型(如Word2vec、ELMo和BERT等)性能有较为显著的提升。因此基于ALBERT模型的实体与关系抽取任务能有效提高识别分类效果,可将其应用于植物描述文本的实体关系抽取任务中,为园林植物知识图谱自动构建提供方法。  相似文献   

13.
研究旅游景点语义交互及交互作用模式,对根据游客需求优化旅游格局有重要意义。现有语义交互挖掘方法忽略了文本中包含人感知信息的上下文词汇;此外,缺少以景点交互为单位分析交互作用模式的研究。为此,本文提出了一个景点间细粒度语义交互作用挖掘和模式分析框架。首先抽取文本中景点交互的语境;然后利用TF-IDF关键词抽取和语义网络分析方法,从讨论焦点和语义结构角度挖掘景点间细粒度的语义交互作用;最后结合Spearman秩相关系数、Graph Kernel图相似度度量方法和网络分析方法,分析语义交互作用模式。以云南省2018年游记数据进行实例分析,结果表明:① 利用本文提出的框架可以挖掘和分析各个景点间细粒度的语义交互作用,辅助有关部门结合游客意见提升旅游体验;可以分析语义交互作用模式,发现优化旅游格局的关键路线片段;② 苍山-洱海应着重提升自然风光体验;而大理古城-洱海应考虑改善游客对品牌旅游资源关注不足的问题;③ 云南省单核心集聚型、单核心辐射型、多区域合作型景点语义交互模式共存,呈现出点轴渐进扩散特征。可利用中介中心性较高且跨区域的景点交互,推动其他2种模式向多区域合作型转化,推进全域旅游战略实施。本文研究可为旅游路线推荐以及平衡旅游格局提供参考。  相似文献   

14.
地理知识库是地理实体及其相互间关系的集合,对于智能搜索、问答、推荐等知识服务有重要的支撑作用。然而,已有的地理知识库由于来源、形式、构建者等的不同,在实体地名、空间位置、类别等方面存在“同义异形”和“同形异义”的语义异构现象,影响了地理知识库间的知识融合与共享。语义对齐是解决语义异构的一种有效方法,其中实体类别对齐是语义对齐的基础,对于提高实体地名和空间位置的对齐精度具有重要作用。现有的实体类别对齐方法主要采用传统的字符相似度和结构相似度等来度量类别的相似度,无法捕捉实体类别深层次的语义相关性,从而影响了类别对齐的精确性。因此,本文提出了一种基于词嵌入的地理实体类别对齐方法,采用词嵌入模型从语料中学习实体类别的语义信息,并通过词向量来表达,以此弥补现有方法存在的缺失,进而提升实体对齐精度。进一步地,通过通用语料与地理信息语料的融合,本文实现了词嵌入模型所用语料在地理语义方面的增强,从而更精准地度量地理实体类别间的相关性。不同地理知识库实体类别对齐的实验表明,本文提出的方法能够有效捕捉地理实体类别的深层次语义信息,其实体类别对齐的调和平均值(Fl)可达0.9568,有效提高了实体类别的对齐精度。  相似文献   

15.
微博中蕴含台风灾害损失信息识别和分类方法   总被引:1,自引:0,他引:1  
社交媒体在灾害信息的实时发布与传播中发挥着越来越重要的作用。在灾害发生过程中,社交媒体中蕴含的实时灾损信息对灾情及时响应和评估有重要意义。然而,这些涉灾文本具有信息破碎度高、文本特征稀疏、标注语料库匮乏等缺点,使得传统的基于监督学习的方法难以有效提取其中的灾损信息。为此,本文提出了一种通过扩展上下文特征和匹配特征词的方法来快速识别和分类社交媒体中蕴含的不同类别的灾损信息。本方法首先基于中文语法规则,抽取小规模不同灾损类别下微博文本中的涉灾关键词构建特征词搭配对。然后,利用词向量模型和已有词库对这些特征词搭配对进行补充和扩展。同时,根据中文词语共现规则,引入外部语料库优化特征词间的语义搭配关系。最终,以此为基础构建台风灾损分类知识库对灾情文本中蕴含的不同类别灾损信息进行识别和分类。本文以2016年9月15日台风“莫兰蒂”登陆事件作为研究案例,以评估本文方法在灾损信息识别和分类上的效果。结果表明,本文方法对微博文本中蕴含的不同类别风灾损失信息的识别和分类效果显著(各类别综合评价指标都达到了0.74以上)。基于灾损信息分类结果,本文绘制了台风影响的时空分布图,从而进一步说明本文方法在灾害损失评估和减灾救灾方面的效用。  相似文献   

16.
????GPS ICD????ж???????18??????????????????????????????????????????????????????????18??????????λ??????????????????????????С???????????????????18???????????????????????????????????????в?????????????????????????????4С???????????????0.01 m??  相似文献   

17.
向量空间模型常被用于计算两个句子的相似度,通过将两个句子转换为词项向量,然后计算两个向量的夹角余弦值,就可以得出两个句子的相似度分数。传统的向量空间模型没有考虑到句子中词语之间的相似度,这就使使用近义词的两个语义相近句子得到的相似度分数较低。提出了一种带有词义特征的向量空间模型,在传统的向量空间模型中引入词语之间的相似度,从而使计算出的两个句子的相似度分数更加准确。  相似文献   

18.
对建筑物进行建模与分析是智慧城市建设的重要任务之一。将城市中数量庞大的建筑物按功能分类,辅助认知城市内部空间结构,对政府部门开展人口估计,土地管理,城市规划等工作具有重要意义。本文以蕴含丰富语义信息的兴趣点(POI, Point of Interest )作为主要信息源,针对POI分布稀疏导致大量建筑物无法识别出功能的问题,改进了传统的城市功能区定量识别方法。该方法为建筑物内部及周边一定区域范围内的POI赋予反距离权重,通过计算不同类型POI的加权频数密度比例来识别建筑物功能类型。文中以北京市西四环中路附近5000多栋建筑物为例进行实验验证,实现了将目标区域内的建筑物按功能类型划分为居住、商业、公服和3种混合类型,识别率达93.04%,与人工判别的结果对比得出总体分类精度达91.18%。该方法采用易于获取的互联网POI数据,可以实现大范围建筑物功能类型的快速自动化识别,丰富了城市建筑模型语义属性,扩展了POI数据的应用范围。  相似文献   

19.
变化检测一直是遥感研究领域的热点,随着遥感技术的不断发展,新型数据源不断涌现,使传统遥感变化检测方法面临新的挑战。本文以Landsat-8影像为主要数据源,使用影像分割算法,设计2期遥感影像的文档-单词映射,将影像中所有的像元作为视觉单词,利用LDA模型将影像文档从单词空间转换到主题空间进行表达。在此基础上,结合实地调查对变化区域进行检测和验证,形成一套面向对象的LDA模型变化检测方法。研究表明:基于图斑的分析可有效消除以像元尺度进行变化检测产生的椒盐现象;利用LDA模型构建的变化检测方法能较好地实现影像文档特征的统一表达,有效去除2期影像相同地物因光谱差异导致的变化误检验;与差值法和波谱角等常规遥感变化检测方法相比,该方法能有效地减少错漏判,提高遥感影像变化检测的正确率,为中高分辨率遥感影像的变化检测提供新思路。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号