您现在正在浏览:首页 > 职教文章 > 职教论文 > 信息网格为信息检索带来的变化

信息网格为信息检索带来的变化

日期: 2012-6-13 23:55:57 浏览: 0 来源: 学海网收集整理 作者: 佚名

摘要:随着计算机技术和网络技术的发展,信息网格得到越来越广泛的应用,信息网格是要利用现有的网格基础设施,协议规范,Web和数据库技术,为用户提供一体化的智能信息平台,其目标是创建一种架构在Os和Web上的基于Internet的新一代信息平台和软件基础设施。本文重点介绍了信息网格的概念,服务特性以及发展前景,同时也提出了网格技术存在的问题,最后对信息网格做了总结。
   关键词: 信息网格, 信息采集, 信息组织,
   引言:自从网络诞生以来,它以其全新的通讯概念和空前的信息量为世界带来了翻天覆地的变化但是在信息爆炸的今天,人们感到传统的信息采集和信息组织方式已经不能满足人们甄别,处理信息的需要。在信息网格下,网络服务变的智能化、个性化,资源利用率大大提高,人们将享受到真正便捷、周到的信息服务。
   网格信息检索是信息检索和网格技术相融合的新领域。网格的出现极大地提升了检索的速度,信息网格解决了管理信息的问题,这些信息跨越异质硬件和软件资源,包括数据库、文件和存储设备。因此信息网格的研究工作显得越来越重要。
   一. 网格和信息网格简介
   1)网格的概念
   网格的思想来源于电力网格,目的是将计算能力和信息资源像今天的电力一样方便地送给每一用户。美国计算网格项目的领导人之一——伊安•福斯特编著的《网格:《21世纪信息技术基础设施的蓝图》中对网格有这样——段描述:“网格是构筑在互联网上的一组新兴技术,它将高速互联网、高性能计算机、大型数据库、传感器、远程设备等融为一体,为科技人员和普通百姓提供更多的资源、功能和交互性。”
   网格主要由6部分组成,即网格节点、数据库、贵重仪器、可视化设备、宽带主干网和网格软件。网格节点是一些高性能的计算机;数据库是存储包括天文、基因等信息和数据的仓库;贵重仪器包括理论物理研究的粒子加速器、大口径雷达、天文望远镜等科学仪器和精细的打印设备;网格软件包括网格操作系统、网格编程与使用环境以及网格应用程序。
   传统互联网实现了计算机硬件的连通,Web实现了网页的连通,而网格试图实现的是将互联网上所有资源的全面连通,包括计算资源、存储资源、通信资源、软件资源、信息资源等,让用户透明的使用这些资源。简言之,网格的核心观点就是“网络就是计算机”,而这个网络可以大到整个因特网,也可以小到一个家庭网。他将整个网络整合成一台超级计算机,为人们有效地提供内容服务、计算服务、存储服务等方面的功能,以最终实现服务点播(Service on Demand)和一步到位服务(OneC1ick Is Enough)。
   通过网格组织起来的“虚拟的超级计算机”有两个优势:一是数据处理能力超强;二是能充分利用网上的闲置处理能力。网格的根本特征是资源共享,消除资源孤岛。网格不仅将对信息资源的获取、传输、共享和利用带来一场革命,而且必将对人类的生产和生活方式带来巨大的变化。而我在这里主要想要讨论的问题,就是网格在信息处理方面的优势,也就是信息网格(Information Grid)。
   2)信息网格的概念和简介
   信息网格是要利用现有的网格基础设施,协议规范,Web和数据库技术,为用户提供一体化的智能信息平台,其目标是创建一种架构在Os和Web上的基于Internet的新一代信息平台和软件基础设施。在这个平台上,信息的处理是分布式,协作和智能化的,用户可以通过单一入口访问所有信息。
   信息网格拥有面向服务的结构,其中在一系列规范和格式下实体可以互相提供服务。信息网格的是一个开放式的系统,自动化的程度很高,支持弹性合作和全球规模的大型计算。在这样的环境里,我们可以将信息网格中的每一种网格服务当作网络服务(Web Service,简称WS)来处理。WS是一种自包含,自描述的模应用,它可以在网络环境中被发布,定位,以及调用。其中WSDL是服务描述协议,UDDI是服务发布和发现协议,SOAP是服务绑定和实施协议,而服务的定义,则要借助于语义网格服务本体库(Semantic Grid Service Ontology Repository, 简称SGSOR)来完成。一个服务客户,例如终端用户,需要和服务者商议服务条款。潜在的信息网格结构复杂性和快速交互需要使得软件代理成为了处理这些协商事务的最佳选择。每个用户都可以通过用户代理(User Agent, 简称UA)访问信息网格。然后代表用户的UA就与代表服务提供者的网格系统服务代理(GSA)进行交互。
   3)网格技术的特点
   资源共享,消除资源孤岛:网格能够提供资源共享,它能消除信息孤岛、实现应用程序的互连互通。网格与计算机网络不同,计算机网络实现的是一种硬件的连通,而网格能实现应用层面的连通。
   协同工作:很多网格结点可以共同处理一个项目
   通用开放标准,非集中控制,非平凡服务质量:这是Ian Foster最近提出的网格检验标准。网格是基于国际的开放技术标准,这跟以前很多行业、部门或者公司推出的软件产品不一样。
   动态功能,高度可扩展性:网格可以提供动态的服务,能够适应变化。同时网格并非限制性的,它实现了高度的可扩展性。
   二. 信息网格提供的主要服务
   1) 知识服务
   知识服务将提供给用户有用和高关联性的知识和解决方案,这一服务包含了两个过程,知识提供和逻辑处理。知识提供是指可帮助用户理解学习知识的智能交互,而逻辑处理是指信息网格通过正确接口收集知识,和将他们发布给正确的人的评价和优化模型。
   2) 解决方案服务
   用户有时候并不关注解决方案中的知识细节而只需要解决方案。智能搜索引擎(基于领域的或是基于网络的)往往通过逻辑处理来解决问题。
   通过上述的许多介绍,我们可以知道信息网格这一概念本身,就是面向用户,面向服务的。它的出现正是为了解决现存的信息饥渴的问题。已经有越来越多的人对这个达成共识。与以往不同的是,这种饥渴并非来源于信息缺乏,而是源自有用信息的缺乏,或者换句话说,人们面前有海量的信息,但是他们并不知道其中哪条才是他们想要的。而这正需要信息网格来解决,需要它的“not fit to design, but design to fit”的思想来解决。在这里我们主要关注上述两种服务中第一种服务的实现,也就是信息采集与信息组织。这也是信息网格能否根据用户需求而设计的关键所在。
   三. 信息网格存在主要问题
   在今天信息网格在地理信息系统、财务管理、军事信息系统等领域得到广泛应用,打破了传统搜索引擎的局限,随着网络的智能化网格给我们的搜索工作提供了更多的方便,同时随之产生的问题也给我们的研究工作提出了挑战。
   1) 网络安全带来的问题
   随着网络技术的发展,网络安全是个核心问题。信息网格与网络有密切的关系,网络的特性在客观上导致了网上信息的窃取、篡改、伪装身份、非法占用等都成为可能,因此,计算机网络遇到的安全问题和安全威胁,如用户认证、访问控制、内部泄漏、非法入侵、以及数据方面(数据精度保证、数据完整性、数据不可否认性、数据保密性等)的问题。随着网格技术的逐步完善,网格计算安全性的提高以及网格虚拟操作系统的体系结构、标准和协议开放性的增强,网格信息检索将会迅速发展。在可预期的将来,人们可以拥有个性化的检索系统,系统可以根据个人的需求、爱好和兴趣自动调节检索机制,并将普通服务和网格服务以新的方式加以整合。 因此利用不断提高网络安全性对信息网格的发展极为重要,当然也没有绝对的网络安全,只能随着网络技术和管理的不断提高来增强信息网格的信息安全性。
   2)网格软件带来的问题
   在当前网格软件还处于一个成长期,网格软件的主要目标是建立科学数据库的统一安全体系,实现科学数据库分布式、异构资源的统一访问接口,由SDG中间件和SDG工具集构成。诸多问题依赖于软件的优化,比如解决节点在应用移植过程中的问题,如何通过使用国家网格交流平台高效的参与项目建设。网格的关键技术有网格结点、宽带网络系统、资源管理和任务调度工具、应用层的可视化工具。网格计算主要是科学计算,它往往伴随着海量数据。如果把计算结果转换成直观的图形信息,就能帮助研究人员摆脱理解数据的困难。这需要开发能在网格计算中传输和读取,并提供友好用户界面的可视化工具。因此网格软件CNGrid GOS稳定性和成熟度急待提高,要成为支撑网格环境运行和应用开发部署的成熟软件系统,还有相当长的路要走。
   3)其他方面问题
   网格技术是从1990年代中期发展起来的新技术,网络安全和网格软件是最主要的问题,还有诸多问题需要我们通过技术和人文的手段来参与网格管理工作中。网格环境的运行管理机制有待进一步探索,实现资源的全面共享和有机协作,使人们能够透明地使用资源的整体能力并按需获取信息;网格应用的深度和广度有待提高;网格环境的运行管理机制有待进一步探索,这些都是要面对的问题。
   网格技术的发展,标准是关键。就像TCP/IP协议是因特网的核心一样,构建网格计算也需要对核心——标准协议和服务进行定义。目前,一些标准化团体正在积极行动。迄今为止,网格计算虽还没有正式的标准,但在核心技术上,相关机构与企业已达成一致,由美国阿贡国家实验室与南加州大学信息科学学院合作开发的Globus 计算工具软件已成为网格计算实际的标准,已有12家著名计算机和软件厂商宣布将采用Globus 计算工具软件。作为一种开放架构和开放标准基础设施,Globus 计算工具软件提供了构建网格应用所需的很多基本服务,如安全、资源发现、资源管理、数据访问等。目前所有重大的网格项目都是基于Globus 计算工具软件提供的协议与服务的。 除了标准以外,可管理性、人才的缺乏也是网格计算亟待解决的一个问题。
   四. 网格技术的发展现状以及对前景的展望
   1)政府支持
   目前,网格的研究主要在美国和欧洲。
   美国政府用于网格技术基础研究经费已达5亿美元。美国军方正规划实施一个宏大的网格计划,叫做“全球信息网格(Global Information Grid)”,预计在2020年完成。作为这个计划的一部分,美国海军和海军陆战队已启动了一个耗资160亿美元历时8年的项目,包括系统的研制、建设、维护和升级。美国能源部的山地国家实验室的“先进战略计算创新计划网格(ASCI Grid)”主要用于核武器研究。美国国防部和欧洲能源机构等在两三年前先后采用了网格技术。
   美国能源部下属的国家能源研究科学计算中心宣布,该中心近日与美国国际商用机器公司(IBM)达成协议,正式开始建造美国能源部内部使用的计算机网格。这一网格计划于今年年底投入使用,将比原定的时间提前两年。
   英国政府已投资1亿英镑,用来研制“英国国家网格(UK National Grid)”。
   日本NTT数据公司联合Intel、SGI等,在2002年中期开展了为期6个月的网格计算试验。印度也启动了建设国家网格计划。
   我国也奋起直追,仅2002年公布的863网格专项,就拨出了上亿元的资金用于China Grid相关的研究。中国科学院计算技术研究所对网格技术的研究已较为深入。
   2)公司参与
   针对商业领域的竞争也已经开始,主要IT厂商早就为获得网格计算的控制权展开了竞争。
   IBM公司在2001年8月2日宣布,它将为网络计算投资约40亿美元。并部署了一个内部研究网格,以便于分散在美国、以色列、瑞士、日本等地的IBM研究人员共享计算资源。同时,IBM被英国政府选中,负责提供英国国家网格项目的关键技术,这项预算达2500万美元的网格项目会把8听大学的计算机相连。此外,IBM还宣布了一项名为北卡罗莱纳生物信息科学网格的项目,涉及60家企业、大学和生物医学研究公司,它的意义在于这是全球第一个主要由私营行业参与的网格项目。
   美国微软公司已经决定支援Globus计划。微软的路线是通过其.Net计划和C++语言实现万维网服务;微软还在开发全面支持网格的下一代Windows操作系统。微软的.net技术宣称是超越浏览器、超越网站的具有革命性的新技术,其基本理念是:不再关注单个网站和与Internet连接的单个设备,而是让所有的计算机、相关设备和服务商协同工作,提供更广泛和丰富的解决方案,使人们能够控制信息并让它在指定的时间以指定的方式传送给自己。计划于2005年完成。
   Sun则通过Open Network Environment(Sun ONE)计划和Java平台来实现它。Sun公司在网格领域先行一步,在2000年就启动了以网格引擎(Grid Engine)分布式资源管理软件为基础的开放源代码战略。
   Compaq与加拿大P1atform Computing结盟,为用户提供完整的、集成的、开放的网络解决方案,将销售一种平台网格套件(P1atform Grid Suite)。
   医药、化工、通信、电子、汽车等领域的一些大公司,如辉瑞、波音、爱立信、日立、宝马、联合利华、葛兰素威康、史可必成等,都已经开始构造使用内部网格,进行有关网格计算的实验。目前它们实验的目标主要着眼于将其应用于大规模的科学仿真。
   3)发展前景
   随着网络技术和通信技术的发展,信息网格的需求越来越强烈,从政府方面加大了科研投入,越来越多的企业也开始参与到信息网格的研究中,国际上的大型企业正在推动信息网格的发展。有业界专家预测,网格计算将成为未来网络市场发展的热点。据《ForbesASAP》预测,网格技术将在本年度达到高峰,并带来因特网的新生。如果网格技术能促使市场按预期的17%年增长率持续成长的话,那么在2020年将会形成一个年产值20万亿美元的大产业.。
   网格中所有的组建都是虚拟的,通过提供一组相对统一的核心接口,所有的网格服务都基于这些接口的实现,就可以很容易地构造出有层次结构的、更高级别的服务,这些服务可以跨越不同的抽象层次,以一种统一的方式来看待。虚拟化也使得将多个逻辑资源实例映射到相同的物理资源上成为可能,在对服务进行组合时候不必考虑其具体的实现,可以以底层资源组成为基础,在虚拟组织中进行资源管理。
   蓝色巨人”IBM正在构筑一项名为“Grid Computing”的计划,旨在通过因特网,向每一台个人电脑提供超级的处理能力。IBM公司副总裁、也是这项计划的总设计师欧文•伯杰说,“Grid Computing”是一种整合电脑资源的新手段,它通过因特网把分散在各地的个人电脑连接起来,不仅可使每台个人电脑通过充分利用相互间闲置的电脑能源,来提升各自的电脑处理能力,还可使成千上万的用户在大范围的网络上共享电脑处理功能、文件以及应用软件。正如网络技术总是从科学开发领域转向企业商务领域一样,我们也希望看到‘Grid Computing’能取得这样的进展。
   另一个业界巨人SUN也推出新软件促进网络计算的发展。2001年11月,Sun推出了Sun Grid Engine企业版软件的、,继续提升它的网络技术计算水平。该软件自推出以来, Sun Grid Engine 企业版软件的用户已经增长了20倍。今天,全球有118000多颗CPU都是采用Sun Grid Engine软件管理的。
  
   五.小结
   面向服务,面向用户,为需求而设计的信息网格正悄悄的介入了人们的生活,也许在不久的将来就会掀起一场信息革命,彻底改变人们现在对于网络信息的看法。信息的搜集和组织方式正在经历由‘fit to design’到‘design to fit’的变革。人们不在需要从网络提供的浩如烟海的内容里寻找自己所要的信息,而是提出要求,然后由网络和计算机将所需的信息筛选,整理并加以提供。从智能和Agent搜索引擎,到语义网,XML和RDF,个性化将在信息网格的服务中成为主题。
  
   参考文献:
   1.古凌岚 信息时代的新星——网格 企业技术开发:新远见上半月.2002(7).
   2.刘忠中 网格计算及其技术需求分析 江西通信科技.2003(2).
   3.徐志伟 织女星信息网格的体系结构研究 计算机研究与发展2002(3).
   4.庞慧娟 新一代互联网—网格的发展和研究 计算机时代2002(10).
   5.王建锋 网格计算的应用及发展 中国论文下载中心
   6.聂哲 基于WEB的面向主题搜索引擎的设计与实现 计算机工程与设计
   7. 曹元大 一个语义Web构架及其实现 第一届智能信息网络学术会议
   8. 网络技术在四大应用领域的发展前景 来源网站:https://tech.51cto.com/
   9. 中国国家网格 来源网站:https://baike.baidu.com/

返回顶部