|
Pidgin: een aardig woordje over de grens Pidgin is een interactief dialoogsysteem dat taaluitingen van beide kanten kan vertalen. Op basis van uitgebreide kennis op het gebied van taaltechnologie en een ruime ervaring met de commerciële mogelijkheden daarvan, wordt een systeem ontwikkeld waarmee mensen die elkaars taal niet kennen toch met elkaar kunnen communiceren. Pidgin laat mensen juist volledig vrij in hun taaluitingen, maar het achterliggende systeem leert razendsnel uit de chatsessies hoe uitingen het best in elkaar vertaald kunnen worden. Perfecte vertalingen worden niet nagestreefd, maar wel vertalingen waaruit duidelijk de bedoeling van de gesprekspartners te halen is. Het systeem maakt gebruik van leeralgoritmen, maar daarnaast ook van uitgebreide "semantische netwerken" - een soort superwoordenboeken waarin concepten voor alles wat in een gesprek kan voorkomen met elkaar in verband gebracht worden. De vertalingen worden automatisch verbeterd door het interactieve gebruik van het systeem. De Markt Pidgin opent nieuwe perspectieven voor de zakelijke markt, omdat bedrijven ermee rechtstreeks en interactief contact kunnen maken met klanten over taalgrenzen die nog nooit eerder overschreden waren, in gevallen waar een telefoongesprek juist tot verwarring in plaats van informatie uitwisseling zou leiden. Maar daarnaast is Pidgin ook een oplossing voor organisaties die over de grenzen heen mensen willen bereiken of mobiliseren. Multilinguale interfaces op basis van de Pidgin-technologie kunnen anderstalige content weergeven en het zoeken hierin faciliteren. Tenslotte kan Pidgin ook een cruciale rol spelen bij de communicatie tussen allochtonen of anderstaligen in eigen land. Het consortium Het Pidgin consortium bestaat uit 5 Nederlandse organisaties, die ieder stuk voor stuk hun sporen verdiend hebben op het gebied van de combinatie tussen taaltechnologie en Internet. De taaltechnologische ruggegraat van het project wordt gevormd door Irion Technologies en Carp Technologies, reeds enkele jaren toonaangevende Nederlandse taaltechnologiebedrijven, geruggesteund door het belangrijkste wetenschappelijk centrum voor dit vakgebied: Universiteit Twente. Een vierde partner is het Leidse New Law Facilities, een gerenommeerd bedrijf dat gespecialiseerd is in projecten op het grensvlak van rechtspraak en informatietechnologie. New Law ziet vooral een belangrijke toegevoegde waarde van taaltechnologie voor de ontsluiting van juridische informatie. Karakteristiek voor juridische informatie is, dat zij altijd in overstelpende hoeveelheden, en in voor mensen moeilijk toegankelijke formuleringen aanwezig is, terwijl voor een juist gebruik ervan een uiterst nauwkeurige interpretatie nodig is. Daarnaast speelt vaak ook het probleem van de verschillende talen een rol. New Law Facilities is dan ook geïnteresseerd in alle aspecten van het project, en zal vooral de rol vervullen van probleemanalist en evaluator. Een vijfde partner tenslotte is het Helmondse bedrijf Interplein. Interplein is gespecialiseerd in de bouw van web sites met een sterk interactieve component. Bezoekers van de door Interplein gemaakte web sites kunnen in het Nederlands praten met een "agent", die informatie verschaft over de site. Ook Interplein vervult met name de rol van analist en evaluator, maar veel meer vanuit een technisch perspectief: hoe bruikbaar wordt de nieuwe technologie voor bestaande softwarearchitecturen. New Law Facilities en Interplein zijn de "gebruikers" in het project. Zij zorgen er ieder op hun eigen manier voor dat het project bruikbare resultaten oplevert, en technologisch niet te veel afdwaalt. Een erg laag risico trouwens, want zowel Carp als Irion specialiseren zich sinds jaar en dag in het omzetten van innovatieve technologie in bruikbare producten. De projectaanvraag voor Pidgin werd verzorgd door het Nijmeegse adviesbureau Hezelburcht, die de komende jaren het project tevens zullen blijven begeleiden. Hun ondersteuning kenmerkt zich door een waardevolle overlapping van ICT-inzicht en kennis omtrent subsidietrajecten. Zelflerende vertaaltechnologie Pidgin is gebaseerd op het idee, dat als twee mensen die elkaars taal niet spreken met elkaar proberen te communiceren, zij gebruik maken van handen en voetenwerk en primitieve uitingen, maar al snel in staat zijn om elkaars bedoelingen te begrijpen. Zo ontstonden ook de zogenaamde “Pidgin”-talen, uit de eerste gebrekkige communicatie tussen handelaars tussen het Westen en het Oosten, in de eerste instantie om zaken te doen, want er is geen sterkere prikkel om een andere taal te willen leren. Het woord "Pidgin" is dan ook een oud-creoolse verbastering van het Engelse woord "business". |