Print deze pagina

Semantic interoperability of distributed geo-services

PoG 63, Rob Lemmens, Semantic interoperability of distributed geo-services

Rob Lemmens

Publications on Geodesy 63, Delft, 2006. 308 pagina's.
ISBN-13: 978 90 6132 298 6. ISBN-10: 90 6132 298 7.


Summary

The last two decades have shown a major shift from stand-alone software systems to networked ones. As with all information system domains, Geographic Information Systems (GISs) have been influenced to a large extent by recent internet developments, resulting in an increasing availability of client/server applications using distributed geo-(web-)services, such as interactive maps, route planners and gazetteers. There is an increasing need for organisations to perform on demand geo-processing tasks by integrating and reusing geo-information and geo-services from within and outside the organisation. These activities are typically performed in the context of so called Geo-information Infrastructures (GIIs).

The process of integrating services is commonly referred to as service chaining. This requires that services can be easily found, and that they are executable and interoperable. Interoperability means that the services ‘understand’ each other’s messages. A major impediment is formed by the semantic heterogeneity (the differences in meaning) of geo-information and of the functionality of geo-services. Making services semantically interoperable is an important prerequisite for information sharing in today’s networked society. This involves services that rely on different knowledge domains, one of which is the geo-information domain.

Within this context, the research presented in this thesis provides solutions for the computer-aided integration of distributed heterogeneous geo-information and geo-services, based on their semantics (the meaning of their content).

Geo-information distinguishes from other information by its spatial relevance. Geo-services often have to deal integrally with multiple-representations of features in a spatial, temporal and thematic dimension. Geo-services are also implicitly connected by the geographic location of the features they process. This has implications for the interoperability of geo-services. For example, the validity of a service (e.g., a routeplanner) may be bound to a specific geographic area, which could imply it cannot be used in combination with services involving another validity area. On the contrary, services that seem to be incompatible due to differences in feature representation (e.g., geometry, coordinate reference system), may turn out to be useful in combination, because they contain information on the same locations.

On demand geo-processing requires services and the meta-information that describes the services to be available at the time a task is being executed. Moreover, the service descriptions should be based on commonly agreed rules for service characterisation. Inter-service contracts that contain such rules may result in service interoperability and this can be achieved at three levels: syntax, structure and semantics. The influential specifications of the Open Geospatial Consortium (OGC) and the ISO 19100 series of standards, implement formal contracts on the syntactical and structural level, but they prescribe only informal contracting at the semantic level. Despite their rigid conceptualisation, they lack a machine-accessible formalisation that supports the specification of semantics for geo-information and geo-services. This research has developed such a formalisation, which is specified in a so called semantic interoperability framework. In this framework a key role is played by machine ontologies, which are machine-accessible representations of knowledge that are used for inferring intra- and inter-resource relationships. Recent research efforts in the field of the SemanticWeb have contributed considerably to the deployment of ontology-based applications by providing a theoretical foundation (Description Logics), ontology languages (e.g., the Web Ontology Language (OWL)), and tools for ontology creation, access and reasoning with web-based (machine) ontologies. The power of web-based ontologies lies in their interoperable (XML based) representation, the use of unique namespaces and the fact that they allow for automated reasoning.

The semantic interoperability framework developed in this research, contains (1) geo-information modelling ontologies which are based on the ISO General Feature Model, (2) domain specific ontologies (amongst others, one which is based on a data model used by the Dutch Topographic Service), and (3) a geo-operation modeling ontology. The latter is based on a geo-operation taxonomy, an input/output parameter characterisation and a workflow model. The taxonomy and parameter characterisation have been developed as part of this research, the workflow model is based on OWL-S, an OWL-based upper ontology for web services.

Ontology-based service descriptions have been created in the context of four use cases in the following areas: (1) information model integration for risk mapping, (2) ad hoc data integration in a disaster emergency situation, (3) reuse of geodata and geo-services in scientific research, and (4) ad hoc integration of travel services. The ontology-based descriptions are used as representations of service requests and advertisements in a matchmaking process. The matchmaking is performed by an ontology reasoner which can infer implicit relationships that exist in a knowledge base containing service descriptions as sets of concepts. The reasoner is implemented together with the ontologies in a prototype environment. Except for the reasoner, this has been carried out with open source software. Within this environment, basic matchmaking has been successfully performed to support data set integration and service chaining. This has been demonstrated by tests implementing the aforementioned use cases.

The offered solution is flexible and extensible. With respect to flexibility, the research demonstrates the use of incomplete service descriptions. With respect to extensibility, the research shows how service descriptions can be extended with new concepts. It is also demonstrated how existing application domains can be linked through ontology mappings. In the process of service chaining, four steps have been identified, i.e., discovery, abstract composition, concrete composition and execution. The link between the abstract and concrete composition of services is realised by annotation, which connects ontology elements with parameters of executable code. For one of the use cases, this code has been deployed in a prototype software application (the latter being part of an external research effort).

There are also limitations to the approach followed, which are partly due to the limitations of OWL and reasoning with it, i.e., with respect to spatial reasoning and the use of metaclasses. In addition, the current prototype environment has several shortcomings: (1) constraints of the user-interfaces (entering service descriptions in Description Logics is still rather complex), (2) the inflexibility of the reasoning implementation and (3) the incompleteness of mappings between domain ontologies, all of which are thought to be surmountable.

A number of recommendations are made for the improvement of the current design and implementation of the interoperability framework, such as the incorporation of: meta-information propagation, concept similarity quantifiers and result ranking in the matchmaking process. The deployment of the approach requires key organisations such as OGC to develop and maintain domain independent parts of a semantic interoperability framework and organisations with a GII mandate to manage its domain dependent parts.

Application fields that are thought to benefit from the presented approach in the short term are, amongst others: service discovery and chaining in GII, harmonization of geo-information models, multiple-representation of geo-information, profile matching of geo-service users, documentation of geo-processing history (lineage), and quality assessment of meta-information. The target groups of this research are firstly geo-information engineers who are confronted with information integration issues and service interoperability issues, and secondly, information engineers in general confronted with distributed information and with end users that need to access distributed services as one virtual application.


Contents

  • Abstract  i
  • Samenvatting  v
  • Acknowledgements  ix
  • Why interoperability is important  1
  • Interoperable distributed services  19
  • Service models for discovery, composition and execution  49
  • Semantic modelling  69
  • Semantic interoperability framework for geo-services  101
  • Geo-information matching and service chaining  139
  • Use case implementations  161
  • Implementation of prototypes: OnToGeo and GeoMatchMaker  183
  • Conclusions and recommendations  205
  1. UML notation  223
  2. ISO 19100 overview 2 25
  3. OPERA-R geo-operation types  227
  4. OPERA-R I/O parameters for feature processing operations  245
  5. ADL Gazetteer OWL service description  251
  6. ADL Gazetteer WSDL service description  253
  7. ISO 19119 mapping  255
  • Bibliography  263
  • Curriculum Vitae  291

Samenvatting

De laatste twee decennia hebben een verschuiving laten zien van autonome softwaresystemen naar genetwerkte systemen. Zoals alle domeinen in de informatietechnologie zijn Geografische Informatie Systemen (GIS) sterk beïnvloed door de recente ontwikkelingen van het internet. Deze hebben geresulteerd in een toenemende beschikbaarheid van client/server-applicaties die gebruik maken van gedistribueerde geo-(web-)services, zoals interactieve kaarten, routeplanners en gazetteers. Er is een groeiende behoefte binnen organisaties aan het verwerken van geo-informatie 'op verzoek' door middel van het integreren en hergebruiken van geo-informatie en geo-services zowel van binnen als van buiten de organisatie. Deze activiteiten worden doorgaans uitgevoerd in de context van geo-informatie infrastructuren (GII).

Het proces van integreren van services is ook wel bekend als service chaining. Dit vereist dat services vindbaar, uitvoerbaar en interoperabel zijn. Interoperabiliteit betekent dat services elkaars berichten 'begrijpen'. Een grote hindernis wordt gevormd door de semantische heterogeniteit (verschillen in de betekenis) van geo-informatie en van de functionaliteit van geo-services. Het creëren van semantisch interoperabele services is een belangrijke voorwaarde voor het uitwisselen van informatie in de huidige genetwerkte maatschappij. Dit betreft services die betrekking kunnen hebben op verschillende kennisdomeinen, waarvan het geo-informatie domein er één is.

Binnen deze context draagt het onderzoek, beschreven in deze dissertatie, oplossingen aan voor de computer-ondersteunde integratie van gedistribueerde heterogene geo-informatie en geo-services, gebaseerd op hun semantiek (betekenis van hun inhoud).

Geo-informatie onderscheidt zich van andere informatie doordat het een ruimtelijke relevantie heeft. Geo-services worden gekenmerkt door hun vaak integrale verwerking van meervoudige representaties van geo-objecten (representaties van geografische fenomenen) in een ruimtelijke, temporele en thematische dimensie. Geo-services zijn ook onderling impliciet verbonden door de geografische locaties van de geo-objecten die ze verwerken. Dit heeft implicaties voor de interoperabiliteit van geo-services. Bijvoorbeeld, de geldigheid van een service (bijv. een routeplanner) kan verbonden zijn aan een specifiek geografisch gebied, hetgeen kan inhouden dat deze service niet kan worden gebruikt in combinatie met andere services met een afwijkend geldigheidsgebied. Andersom, services die incompatibel lijken door hun verschil in geo-object representatie (bijv. geometrie, coördinaatreferentiesysteem) kunnen in combinatie bruikbaar blijken te zijn, omdat ze informatie bevatten over dezelfde locaties.

Geo-informatie verwerking op verzoek vereist dat services en meta-informatie die deze services beschrijft, beschikbaar zijn op het moment dat een taak moet worden uitgevoerd. Bovendien moeten de service-beschrijvingen gebaseerd zijn op overeengekomen regels voor de karakterisering van services. Inter-service contracten die zulke regels bevatten, kunnen bijdragen aan service-interoperabiliteit op drie niveaus, namelijk: syntax, structuur en semantiek. De invloedrijke specificaties van het Open Geospatial Consortium (OGC) en de ISO 19110 standaarden implementeren formele contracten op het syntactisch en structurele niveau, maar op het semantisch niveau schrijven zij alleen informele contractering voor. Ondanks hun rigide conceptualisering missen ze een machine-toegankelijke formalisatie die ondersteuning zou kunnen bieden voor de specificatie van semantiek voor geo-informatie en geo-services. In dit onderzoek is zo’n formalisatie ontwikkeld. Deze is gespecificeerd in een raamwerk voor semantische interoperabiliteit. In dit raamwerk is een sleutelrol weggelegd voor machine-ontologieën. Dit zijn machinetoegankelijke representaties van kennis, die kunnen worden gebruikt voor de afleiding van relaties tussen informatie-elementen. Recent onderzoek op het gebied van het Semantic Web heeft bijgedragen tot de ontwikkeling van ontologie-gebaseerde applicaties door het beschikbaar maken van een theoretische basis (Description Logics), ontologietalen (bijv. de Web Ontology Language (OWL)), en gereedschappen voor ontologiebouw, -toegang en redeneren met web-gebaseerde (machine) ontologieën. De kracht van web-gebaseerde ontologieën ligt in de interoperabele (XML-gebaseerde) representatie, het gebruik van unieke namespaces en het feit dat ze automatisch redeneren ondersteunen. Het raamwerk voor semantische interoperabiliteit, dat is ontwikkeld in dit onderzoek, bestaat uit (1) geoinformatie modelleringsontologieën die zijn gebaseerd op het ISO General Feature Model, (2) domein-specifieke ontologieën (o.a. één gebaseerd op het datamodel dat wordt gehanteerd door de Nederlandse Topografische Dienst Kadaster), en (3) een geo-operatie modelleringsontologie. De laatste is gebaseerd op een geo-operatie taxonomie, een karakterisering van de invoer/uitvoer parameters en een workflow-model. De taxonomie en parameterkarakterisering zijn ontwikkeld als onderdeel van dit onderzoek, het workflow-model is gebaseerd op OWL-S, een OWL-gebaseerde generieke ontologie voor web services.

De op ontologie gebaseerde service-beschrijvingen zijn gecreëerd in de context van vier gebruikersscenario’s in de volgende toepassingen: (1) informatiemodelintegratie voor risicokartering, (2) ad hoc gegevensintegratie in een rampsituatie, (3) hergebruik van geodata en geo-services in wetenschappelijk onderzoek, en (4) ad hoc integratie van services in een reisscenario. De service-beschrijvingen worden gebruikt als representaties van service-aanvragen en aanbiedingen in een matchmaking proces. Deze matchmaking wordt uitgevoerd door een ontologieredeneer mechanisme (Eng: reasoner), dat impliciete relaties kan afleiden uit een kennisbank waarin services zijn beschreven als concepten. De reasoner is geïmplementeerd samen met de bovengenoemde ontologieën in een prototype omgeving. Met uitzondering van de reasoner, is de implementatie uitgevoerd met open source software. In deze omgeving zijn op succesvolle wijze basale vormen van matchmaking uitgevoerd voor de ondersteuning van gegevensintegratie en service chaining. Dit is gedemonstreerd aan de hand van tests, die implementaties vormen van de bovengenoemde gebruikerscenario’s.

De aangereikte oplossing is flexibel en uitbreidbaar. Wat betreft flexibiliteit wordt dit gedemonstreerd aan de hand van het gebruik van incomplete servicebeschrijvingen. Wat betreft uitbreidbaarheid laat het onderzoek zien hoe servicebeschrijvingen kunnen worden uitgebreid met nieuwe concepten. Tevens wordt getoond hoe applicatiedomeinen kunnen worden gekoppeld middels ontology mappings. In het service chaining proces worden vier stappen onderscheiden, namelijk: het vinden (Eng: discovery), abstracte compositie, concrete compositie en uitvoering (Eng: execution). Het verband tussen de abstracte en concrete compositie van services wordt gerealiseerd door middel van annotatie, die een verbinding maakt tussen ontologie-elementen en parameters in de softwarecode. In één van de gebruikerscenario’s is deze softwarecode daadwerkelijk gebruikt in een computertoepassing (de laatste maakt deel uit van een extern onderzoek).

Er zijn tevens beperkingen in de gevolgde benadering. Deze zijn gedeeltelijk te wijten aan de beperkingen van OWL en het redeneren met haar elementen, bijvoorbeeld met betrekking tot het ruimtelijk redeneren en het gebruik van metaklassen. Bovendien heeft de huidige prototype-omgeving de volgende beperkingen: (1) m.b.t. de gebruikerinterface (de invoer van service-beschrijvingen in Description Logics is nogal gecompliceerd), (2) de inflexibiliteit van de redeneringsimplementatie, en (3) de incomplete set van mappings tussen de domein-ontologieën. Desalniettemin worden deze prototypebeperkingen als tijdelijk gezien en niet als principieel.

Een aantal aanbevelingen wordt gegeven voor het verbeteren van het huidige ontwerp en de implementatie van het interoperabiliteitsraamwerk, zoals het meenemen van: meta-informatie propagatie, de rangschikking van resultaten in het matchmaking proces, en het kwantificeren van concept-gelijksoortigheid. Het operationeel inzetten van het raamwerk vereist dat sleutelorganisaties, zoals OGC, de domein-onafhankelijke delen van het raamwerk zullen ontwikkelen, onderhouden en beschikbaar maken, en dat organisaties met een GII-mandaat de domeinafhankelijke onderdelen beheren.

Toepassingsgebieden die op korte termijn worden geacht te profiteren van de gepresenteerde aanpak zijn o.a. service chaining in GII, harmonisatie van geo-informatie modellen, meervoudige representaties van geo-informatie, profielmatching van geo-service gebruikers, documentatie van de proceshistorie van geoinformatie (Eng: lineage), en kwaliteitsbeoordeling van meta-informatie. De doelgroepen van dit onderzoek zijn als eerste de groep van geo-informatie-technici, die worden geconfronteerd met problemen van informatie-integratie en interoperabiliteitsproblemen met services, en als tweede, informatie-technici, die in het algemeen geconfronteerd worden met gedistribueerde informatie en met eindgebruikers die gedistribueerde services moeten kunnen benaderen als zijnde één virtuele applicatie.