Semantische laag maakt zoeksysteem associatiever

Topic Maps voor ontsluiting informatie

/ nl/ article /semantic_nl.phpOnderwerpen: iso-standaard, kennis, proefprojecten, topic maps, xml-technologie, associatieve, informatie, metadata, navigatiestructuur

Dit artikel is overgenomen uit de Automatiseringgids nr. 8 van 2003.

Met Topic Maps kunnen organisaties hun informatie? dynamisch in kaart brengen, zonder diep in hun systemen in te grijpen. Kennis? is daardoor makkelijker vast te leggen, over te dragen en samen te voegen. Maar bovenal wordt zoeken daardoor een associatieve? bezigheid.

De inmiddels spreekwoordelijke overdaad aan informatie stelt organisaties voor problemen. Internet ontbeert structuur, binnen bedrijven worstelt men met kennismanagement en ook op persoonlijk niveau wordt het beheer van documenten, e-mail en agenda menigeen te veel.

GPS voor informatie

Topic Maps?, een nieuwe ISO-standaard?, kan daarin behulpzaam zijn. Deze XML-technologie? wordt door ingewijden aangeprezen als ‘het GPS-systeem voor informatiesystemen’. "Je gebruikt Topic Maps voor het ontsluiten van informatie. Het ligt meer op semantisch niveau dan op technisch niveau", zegt informatiearchitect Aad Kamsteeg van adviesbureau Diderot Track.

Topic Maps is een van de vele nieuwe XML-standaarden. Deze maakt het mogelijk een ‘laag’ met metadata (informatie over informatie) bovenop bestaande informatie te leggen. Kamsteeg: "In feite zijn topic maps verzamelingen van allemaal kleine begrippen en beschrijvingen die onderling een relatie met elkaar hebben en ook die relatie kun je heel expliciet benoemen in Topic Maps. In een verwante standaard, RDF, heb je daar maar een beperkte mogelijkheid voor."

Op die manier is een netwerk van begrippen te construeren: een topic map. "Die kun je op een hele praktische manier toepassen door er een navigatiestructuur omheen te bouwen; die is voor een eindgebruiker veel intuïtiever te gebruiken dan wanneer je volgens een meer hiërarchisch model werkt."

Begrippenboom

Vanouds wordt beschikbare informatie nogal hiërarchisch geordend en geïndexeeerd om deze toegankelijk te maken. De taxonomie, de ‘begrippenboom’ die zich steeds verder vertakt, is daarbij een veelgebruikt hulpmiddel. Topic Maps, waar je - in jargon - geen taxonomieën maar ontologieën maakt, werkt daarbij niet zo rigide. "In feite heb je geen hiërarchie, waardoor je een veel grotere vrijheid hebt om op associatieve manier begrippen aan elkaar te verbinden."

Omdat de begrippennetwerken (lees: kennis) in een extra semantische laag verwerkt worden en geen ingrepen in bestaande informatiesystemen vergen, heeft het gebruik van Topic Maps bepaalde voordelen.

"Je kunt zo informatie combineren die over verschillende afdelingen verdeeld is", stelt collega Yola Park van Diderot Track. "Je kunt ook kennisgebieden definiëren, waar geen documenten aan ten grondslag liggen. Als je een storingssysteem wilt opzetten bijvoorbeeld, kun je in Topic Maps vastleggen wie er voor welke apparatuur verantwoordelijk is. Handleidingen, telefoonnummers en de te ondernemen actie kun je zo bij elkaar onderbrengen."

Een ander voordeel is dat dezelfde informatieverzameling via verschillende topic maps aan verschillende beroepsgroepen gepresenteerd kan worden. Bovenop een medische database bijvoorbeeld kunnen topic maps voor longartsen en voor cardiologen worden gemaakt. Een aantal begrippen, zoals ‘bloedvaten’ en ‘cholesterol’ zullen dezelfde zijn, maar hun relatie heel anders.

Over de software maken Kamsteeg en Park zich niet veel zorgen. Er zijn gereedschappen waarmee topic maps te definiëren zijn en waarmee de verzamelde begrippen aan feitelijke informatie is te koppelen. Met speciale browsers kunnen eindgebruikers en testers door topic maps ‘wandelen’ en de gevonden informatie benutten. "Daarnaast heb je nog componenten die op een bepaalde topic map afgestemd kunnen worden en die je dus op een bepaald punt laten beginnen." Er is een aantal commerciële en open-sourcepakketten, waarvan de meeste hun Topic-Maps-mogelijkheden als extra functionaliteit ingebouwd hebben gekregen. Een eenmaal gerealiseerde topic map is door zijn XML-aard te migreren naar andere software-omgevingen. "Maar voor het begrijpen van wat een ontologie is en wat je ermee kunt, moet je vrij veel basiskennis hebben", zegt Kamsteeg.

Proefprojecten

In de praktijk zijn organisaties nog aan het aftasten wat ze met topic maps kunnen. Edwin de Jonge, projectmanager Informatiesystemen bij het Centraal Bureau voor de Statistiek (CBS), vindt het echter een veelbelovende technologie. Hij is met collega’s bezig met een onderzoek naar de mogelijkheden.

"Onze cijfers gaan over bepaalde statistische begrippen en wat we willen doen is daarover samenhangende metadata publiceren, omdat de kwaliteit van onze cijfers valt of staat met die metadata. In onze statistische database kennen wij bijvoorbeeld van de begrippen werkgelegenheid en werkloosheid meerdere varianten. Om de samenhang tussen die begrippen duidelijk te maken het je een semantische technologie nodig. Je wilt transparant aan de gebruiker laten zien wat begrippen inhouden en wat de samenhang is met andere."

De Jonge en zijn collega’s willen in eerste instantie ‘een soort opgevoerde begrippenlijsten’ bieden. "Maar je kunt Topic Maps tevens gebruiken als een soort selectiemiddel om tot je data te komen. Dat is wat moeilijker. We hebben op dit moment al behoorlijk gespecificeerde selectiemethoden bij het CBS. Je kunt met behulp van een Java-applet behoorlijk gedetailleerde selecties maken in de database. Als we Topic Maps daarvoor gebruiken zou dat een andere manier zijn, die minder gedetailleerd is maar misschien wel zijn waarde heeft, omdat je dan wat meer associatief door de data heengaat."

Andrea Fritsch, hoofd Content Operations bij Sdu Uitgevers, heeft ook een testonderzoek gedaan met Topic Maps, die een aanvulling zou kunnen bieden aan de bestaande systematische zoeklaag. "We willen een combinatie van de meer vakgerichte content zoals commentaren, nieuwsartikelen, dus heel domeingericht, en de grotere gegevensverzamelingen van wet- en regelgeving." Sdu heeft een aantal online-informatiediensten. Die informatie wordt ontsloten op basis van trefwoorden die eigen redacties toekennen. "We willen nu kijken of we nog een stap verder kunnen gaan en een taxonomie kunnen bouwen die de gebruiker in staat stelt interactief informatie te zoeken die verder gaat dan wat je kunt bereiken met een vaststaande rubriekenmatrix."

Fritsch vindt het nog te vroeg voor invoering van Topic Maps, mede omdat de back-office nu nog even wat meer aandacht vergt. "Wel verwachten we een groeiende behoefte aan zoekvormen waarbij je associatief te werk kunt gaan, maar anderzijds de betrouwbaarheid hebt van systematisch ontsloten informatie."

GPS ...

Begrippenboom ...

Proefprojecten ...