首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于网络爬虫的Web服务抓取解析器的设计与实现
引用本文:陈晓慧,陈荣国,卫文学.基于网络爬虫的Web服务抓取解析器的设计与实现[J].测绘软科学研究,2010(3):64-68.
作者姓名:陈晓慧  陈荣国  卫文学
作者单位:[1]山东科技大学信息科学与工程学院,山东青岛266510 [2]中国科学院地理科学与资源研究所,北京100101
基金项目:基金项目:国家863高技术研究发展计划重点基金项目(2007AA120400、2009AA062701)资助;国家科技支撑计划基金项目(2007BAH16803、2006BAJ09B10)资助;中科院知识创新工程重要方向基金项目(kzex2-yw-304)资助
摘    要:随着Web服务和网络技术的发展,越来越多的Web服务得以开发并发布到网络上。由于网络上存在的Web服务相互之间没有内在的必然联系,用户很难快速有效地获取和利用这些服务。本文设计了一种Web服务抓取解析器框架,包括URL抓取器、WSDL文档解析器和用于结构化存储Web服务信息的数据库等。该抓取解析器采用网络爬虫程序对互联网中的URL进行搜索,通过搜索发现分布在网络上的Web服务,并最终建立起一个关于Web服务的信息库,为共享Web服务提供条件。

关 键 词:Web服务  服务抓取  服务解析  网络爬虫  服务共享

Design and Realization of Web Service Snatch and Parse Engine Based on Web Crawler
CHEN Xiao-hui,CHEN Rong-guo,WEI Wen-xue.Design and Realization of Web Service Snatch and Parse Engine Based on Web Crawler[J].Research on Sofi Science of Surveying and Mapping,2010(3):64-68.
Authors:CHEN Xiao-hui  CHEN Rong-guo  WEI Wen-xue
Institution:1.College of Information Science and Engineering, Shandong University of Science mad Technology, Qingdao 266510,China; 2. Institute of Geographic Sciences and Natural Resources Research, Chinese Academy of Sciences, Beijing 100101,China)
Abstract:With the development of web service and network technology, more and more web service are developed and published to the Web. As there is no intrinsic and inevitahle relation among the web services on the web, it is difficult for the users to access and use those services quickly and efficiently. In this paper, a web service snatch and parse engine frame is designed, including URL snatcher, WSDL document parser and database for storing web service informalion structurally. The engine adopts a web crawler program to search URLs on the web. With this engine, the web services scattered on the web would be found, a service information database about web services would be built and it would provide conditions for sharing web services.
Keywords:web services  service snatch  service parse  web crawler  service share
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号