首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 974 毫秒
1.
为了进一步准确过滤对青少年危害较大的色情网页,在汉语词法分析系统添加去禁用词功能实现中文分词,通过改进的词频-逆文档频率及文档频率-互信息方法完成特征提取,从而实现基于支持向量机的过滤方案。并在给出的余弦夹角公式的基础上,提出了一种基于余弦夹角法的中文网页过滤方案。结合两种方案,实验证明在统一资源符总库存在条件下方案对色情等网页过滤效果进一步提高。  相似文献   

2.
提出了利用HTMLParser和PDFBox工具包来编程实现对Web网页文本内容自动提取和PDF文档格式的转换并这些数据进行处理来适合HTK语言建模工具的要求。最后通过实验证明了采用该方法可以较好地实现语言模型的自动更新从而适应识别对象不断变化,同时减少了识别过程中的集外词并提高了语言模型的性能。  相似文献   

3.
提出了两种针对分布式目录失效情况时的恢复算法.基于元数据遍历的恢复算法采用遍历所有元数据的方式来近似地恢复目录,该算法能较完整地恢复目录.基于目录缓存的恢复算法采用目录缓存作为恢复的线索来近似地恢复目录,该算法能快速地恢复目录.两种算法在目录恢复上各有优缺点,通过实验验证了两种算法的功能,并对其性能做了比较.  相似文献   

4.
地理要素变化检测已成为国家地理信息"十二五"规划和全国地理国情普查的重要组成部分。网页文本中蕴含海量的地理要素信息,尤其是新闻、政府、社交平台等网站的网页文本更新频繁,可为地理要素变化检测提供现势性的数据源。本文针对网页文本中地理要素变化的语言描述特点,构建了表达地理要素变化的语义知识库,设计了搜索引擎和通用主题相结合的网页爬虫,实现了相关网页文本的高效获取;采用规则模型和条件随机场模型,分别进行网页文本中地理要素变化信息抽取,包括地理要素名称、位置(地名)、时间和属性等。实验结果显示,本文设计的网页爬虫具有较高的相关网页文本获取能力,地理要素变化信息抽取的准确率能够达到70%以上,但是,语义知识库的完备程度对于信息抽取性能具有较大影响。研究成果表明,以网页文本为数据源的地理要素变化信息获取方法,能提供一种快速检测地理要素变化的新途径,与实地调绘和遥感影像检测等方法结合应用具有较好的优势互补性,可作为有力的辅助手段解决地理要素的持续更新和实时更新问题。  相似文献   

5.
针对海量激光点云数据组织与管理困难等问题,结合八叉树在三维空间上的快速收敛能力以及三维R*树对不规则分布的多维点数据性能稳定的优势,提出了一种八叉树与三维R*树集成的空间混合索引结构—3DOR*树。首先,通过对激光点云数据进行八叉树划分;然后,对八叉树叶子节点构建三维R*树,进而实现3DOR*树索引结构的构建;最后,对激光点云数据进行特征分析,构建基于3DOR*树的激光点云数据存储结构,实现基于3DOR*树的激光点云存储与管理。本文以江西理工大学图书馆激光点云数据为例,进行实验对比分析,证明了基于3DOR*树的激光点云数据存储结构比三维R*树、八叉树与三维R树混合树等其他树形结构,具有高效的空间存储与查询等优势,可应用于海量激光点云数据存储、管理与分析应用。  相似文献   

6.
基于JSP的动态网页技术   总被引:5,自引:0,他引:5  
JSP技术为开发动态网页提供了一条简单高效的途径.分析了JSP的原理、特点并介绍了其相关技术,并给出了利用JSP建立动态网页的一个实例.  相似文献   

7.
运用非连续变形分析(DDA)和有限元方法(FEM)对砌体结构进行震动分析。建模中将砌体结构的砖、柱、过梁以及楼板等视为独立的弹性体分别作有限元划分,弹性体之间运动由接触界面的张开、闭合和滑动控制来实现,通过防止弹性体间的侵入来校正弹性块体系统的位移与应变最小二乘拟合结果。弹性块体间滑动采用库仑摩尔定律控制砂浆的作用与失效,输入相当于地震烈度Ⅸ度的加速度峰值的迁安波对砌体结构模型进行震力分析,研究相应震动过程。算例表明,DDA和FEM组合的方法能很好地模拟砌体结构受地震作用的动力响应过程。在较大地震作用下,砌体结构首先从底层开始开裂破坏并导致结构倒塌,与农村砌体结构震害现象吻合较好。  相似文献   

8.
基于山东省17地市经济发展数据,构建反映城市综合实力的指标体系,利用因子分析法确定城市综合实力得分,以此为基础,建立加权Voronoi图揭示1995~2012年山东省各城市的空间影响范围及演变规律,运用Voronoi树图方法实现了城市多层级嵌套结构的表达,有效反映了城市之间的空间竞争关系,为城市合理布局规划提供了有效论证。  相似文献   

9.
以任务教学法和难题教学法为理论基础,研究了在学科教学当中,如何用最有效的方法帮助学生建立动态网页数据库的知识体系.从实践层面上分析了网页数据库教学的基本特点,并提出了该课程教学的若干原则.在实践层面上,为同行工作者提供了一个可供借鉴的课程模型,最终达到培养学生的兴趣和能力的双重教学目的.  相似文献   

10.
地理要素变化发现是地理信息数据库动态更新的重要组成部分。互联网在信息传播中扮演着越来越重要的角色,网页文本中蕴含着一些现势性很强的地理要素信息,可作为地理要素变化发现的数据源。本文结合网络爬虫和朴素贝叶斯分类模型,提出并实现了一种面向网页文本的地理要素变化发现方法。首先,本文在收集分析地理要素变化新闻锚文本的基础上,构建了网络地理要素变化新闻关键词库,并基于关键词库设计了适于地理要素变化发现的网络爬虫,实现了候选网页文本的主动获取;接着为了提取地理要素变化新闻,本文训练构造了适于地理要素变化发现的朴素贝叶斯分类器,对候选网页文本进行筛选。最后通过实验对比了本文方法与现有方法在准确性和全面性上的表现。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号