AI profiteert van de kennis van je data die SynerScope voor je inventariseert

Profiteren van AI? Zonder kennis van je data mis je meteen al de boot.

Als je succesvol wilt zijn met AI, zul je je eerst moeten focussen op je data. SynerScope inventariseert en wijst de weg in wat bij veel bedrijven en organisaties is uitgegroeid tot een onoverzichtelijke databerg.

Enig inzicht in alle data op je laptop? De vraag is lastig, het antwoord zou een eyeopener moeten zijn. ‘Wat we vandaag of vorige week hebben opgeslagen, dat weten we nog wel,’ zegt Jan-Kees Buenen, ceo bij SynerScope. ‘We kennen de inhoud en het belang ervan. Maar ga je verder terug in de tijd, dan wordt het allemaal diffuus. Welke data is er? Waar vind je het? Wat is belangrijk en wat kun je weggooien?’

Buenen wil maar zeggen: als je op microniveau al worstelt met dit soort vraagstukken, dan mag je terecht vrezen dat het binnen je organisatie of onderneming niet anders zal zijn. ‘De mensen van IT zorgen dat het technisch beheerd wordt, niet inhoudelijk. Lage opslagkosten, zonder actief sorteren en weggooien, laat de onoverzichtelijk berg data steeds sneller groeien.’ Niemand kent het geheel en de vraag is of de losse details goed gekend zijn. En overal vind je de zogenaamde ‘dark data’, gegevens waarvan een organisatie of onderneming niet eens meer weet dat het bestaat.

Het is een weerbarstig probleem, betoogt Buenen: ‘Kijk naar de toeslagenaffaire. Waarom denk je dat de afhandeling daarvan zo lang duurt? Omdat er gespit moet worden in een enorme databerg: oude dossiers, correspondentie, allerlei stukken in vervuilde mappen. Dan kun je wel geautomatiseerd zijn, maar dit is dus ouderwets handwerk. Je moet domweg heel veel mensen inschakelen die niets anders doen dan bestanden inzien en inventariseren.’

AI en data

Alles start met data

Het grote misverstand is dat AI ons kan helpen met het wegwerken van dataproblemen. ‘Dat klopt niet,’ zegt Buenen. ‘Het is juist andersom. AI presteert het beste op basis van gestructureerde en gecategoriseerde data.

Met andere woorden: als je als bedrijf of organisatie je datahuishouding niet op orde hebt, kun je ook niet goed gebruikmaken van AI-toepassingen. Je mist dus al meteen aan het begin van de AI-revolutie de boot. ChatGTP inzetten in je bedrijfscommunicatie? AI toepassen bij een eerste selectieprocedure voor een vacature? Dat functioneert alleen goed als je het systeem voedt of traint met een diversiteit van betrouwbare data. Die moet je kennen, anders injecteer je onbewust al heel snel forse bias in je AI. Als je succesvol wilt zijn met AI, zul je je eerst moeten focussen op je data. Omdat alles start met data.’

Betere bedrijfsresultaten

SynerScope, in 2011 opgericht als spin-off van de Universiteit Eindhoven, heeft een visuele scanner ontwikkeld die data inventariseert. ‘Wat we in wezen doen,’ zegt Buenen, ‘is het maken van een kaart. Daar zijn we in Nederland altijd al goed in geweest.

Tegenwoordig reizen we van A naar B met een GPS-kaart in de auto. Maar waar is de kaart die ons door onze data leidt? Met SynerScope kun je de data – inclusief de ‘dark data’ – van je organisatie automatisch sorteren, labelen en clusteren. Dat sorteren gaat in een heel snel proces op inhoud. Op basis daarvan worden voor elk cluster mogelijke labels berekend.’ Waarmee je, zegt Buenen, als bedrijf of organisatie je eigen data en kennis weer volledig onder controle hebt. Zodra je ontdekt welke data je onderneming of organisatie heeft kun je veel meer (of beter) geïnformeerde beslissingen nemen. En bij een digitale transformatie naar de cloud in Microsoft Azure, neem je precies mee wat van belang is.

Buenen: ‘Goed gelabelde data verhoogt de kwaliteit van de uitkomst van AI. Je kunt er AI mee temmen. En dan bedoel ik: ‘écht inzetten voor jouw doel, met meer succes, minder risico en tegen veel lagere kosten. Je verbetert je bedrijfsresultaten door je (dark) data met SynerScope te ontsluiten.’

 

Bron: Elsevier – TopicTalks 19 – december 2023

 

Wet open overheid: je informatiehuishouding op orde net als ‘je huis op orde’

Wet open overheid (Woo): van verplichting naar verbetering…

In het programma ‘Je huis op orde’ met presentator Viktor Brand kregen gezinnen de duidelijke opdracht om afscheid te nemen van een groot deel van hun spullen zodat ze met een opgeruimd huis verder konden. De spullen die ze selecteerden om weg te doen moesten ze in drie verschillende vakken plaatsen: Doneer, Verkoop of Recycle.

De digitalisering gecombineerd met een drang tot verzamelen heeft bij vele overheidsorganisaties een nagenoeg vergelijkbare chaos met digitale data veroorzaakt.

The story

De programmamakers halen alle spullen op en leggen deze gesorteerd op de vloer van een 2000 m2 grote loods. Dan komt het gezin binnen en direct is daar de verbazing. Eerst over de totale hoeveelheid waarna langzaam de herkenning van de voorwerpen in de verschillende vakken zich ontvouwt. Vevrolgens moeten ze zelf aan de slag, kiezen van welke spullen ze afscheid nemen en die dan verdelen over de vakken doneer, verkoop of recycle.

“Het programma brengt prachtig de verzameldrift van de mens in beeld en de onmogelijkheid om zonder overzicht te kunnen beginnen de chaos om te zetten naar structuur en orde”


( Met dank aan Talpa en sbs6)

De digitalisering gecombineerd met een drang tot verzamelen heeft bij vele overheidsorganisaties een nagenoeg vergelijkbare chaos met digitale data veroorzaakt. Steeds meer en steeds sneller genereren en verzamelen we data en met opslagkosten die bijna nihil groeit dat snel tot een onoverzichtelijke hoeveelheid. De verdeling naar verschillende afdelingen en naar systeemapplicaties resulteren in rigide data silo’s. Niemand kent het geheel en het is maar de vraag of de losse details goed gekend zijn.

Een vergelijk met alle verschillende kasten, kamers, zolders en garages van een huishouden dringt zich op. Het overzicht over de inhoud van de data ontbreekt en dus is een begin van orde scheppen moeilijk zo niet onmogelijk geworden.

Als we eerst al deze data gesorteerd en geordend in overzicht brengen was de helft van het werk voor ‘informatiehuishouding op orde’ al gedaan. Maar daarvoor missen we een team programmamakers. En de ambachtelijke aanvliegroute van inzet van meer mensen, al dan niet van buiten ingehuurd, om dossier voor dossier en pagina voor pagina te inventariseren en te markeren is op de huidige schaal van data en informatie praktisch noch economisch uitvoerbaar. Het zou ook grotendeels een terugkeer zijn naar een type aanpak uit de papieren wereld van vroeger.

SynerScope sorteert, categoriseert en toont patronen

Digitale technologie veroorzaakt het dataprobleem, maar ze levert ook steeds meer de mogelijkheid om een aanpak à la “Je huis op orde” te ontwikkelen en los te laten op alle digitale data. De grote loods vinden we in de schaalbare public could infrastructuur zoals MS Azure. Het aannemen van de data, sorteren en visueel uitstallen kan met software. SynerScope heeft een zeer krachtige versie in dit segment ontwikkeld die naast al (deels) gestructureerde data ook de ongestructureerde data meeneemt.  SynerScope sorteert, categoriseert en toont patronen in de data, waarmee de domein experts van de organisatie de beschikking krijgen over alle informatie en context om data markeringen en labels op detail niveau in de data aan te brengen. Maar dan niet pagina voor pagina maar met hele groepen van pagina’s, documenten of dossiers tegelijk zodat een grote snelheid bereikt kan worden zonder compromis op kwaliteit.

Wet open overheid (Woo)

Natuurlijk is de opgave in de data- en informatie huishouding van overheidsorganisaties complexer dan het recht-toe-recht-aan ‘ont-spullen’ in het tv-programma. Meerdere regels en wetten zijn op het omgaan met overheidsdata van toepassing. De Archiefwet geeft aan welke data bewaard en wat vernietigd moet worden, en wanneer en voor hoe lang.  De Woo geeft aan welke data actief gepubliceerd moet worden en hoe dit de komende jaren in fasen over verschillende categorieën van overheidsdata en -informatie vormgegeven moet worden. Voor de oudere data blijft de mogelijkheid deze op Wob-wijze te blijven opvragen maar dan onder het regime van antwoordtijden van de Woo. Opgaven als de Omgevingswet en het zorgdomein vergroten in belangrijke mate de moeilijkheidsgraad om in control van alle data te komen. Over en door dit alles heen lopen de opgaven en verplichtingen volgend uit de AVG. Privacybescherming vraagt om maskering, openheid vraagt om deze selectief toe te passen, de beslissing wat te maskeren vraagt om goed overzicht, doorzicht en zicht op detail van de data.

Kortom voor alle beslissingen op ieder van de voornoemde gebieden en de beleidsbeslissingen geldt dat het kennen van de data altijd een vereiste is.

SynerScope labelt en ordent

Nadat de computer heeft gesorteerd en zijn patronen uit de data weergeeft gaan gebruikers met domeinkennis ieder gesorteerd data- ‘vak’ voorzien van labels die de inhoud markeren en zo ook de vlakken onderling naar inhoud differentiëren. Deze labels (ook wel tags of meta-data genoemd) zijn zeer waardevol voor hergebruik door de organisatie heen. Ook kan nieuwe onbekende data worden gemixt met dergelijke eerder gelabelde data zodat het mogelijk wordt eerder opgedane kennis direct over te zetten naar nieuw ingebrachte data.

Graag laten we u en uw organisatie ervaren wat een informatiehuishouding op orde brengen betekent als nieuwe methodes en processen ondersteund met SynerScope technologie worden ingezet. Er ligt een kans de Woo van verplichting om te buigen naar een krachtige impuls om uw organisatie beter met digitale assets te laten werken. Waarmee ze haar service aan de burgers en de maatschappij sterk kan verbeteren. De overheidsorganisatie die snel meer weet van en over haar data kan de openbaarmaking van data en informatie beter toesnijden op de behoeftes van de diverse stakeholders en achterbannen. Een verandering van informeren achteraf naar betrekken vooraf, transparant beleidsalternatieven voorleggen en de verschillende afwegingen open te leggen alles met een zo volledig mogelijke context van de onderliggende data.

Webinar

In ons webinar gaven we u een beeld hoe dit er in de praktijk uit zal zien. Het organiseren van een pilot met data van uw eigen organisatie behoort uiteraard ook tot de mogelijkheden. Omdat een pilot met uw eigen data binnen enkele dagen gerealiseerd kan worden is testen efficiënter dan vergaderen over de mogelijkheden…

Bekijk ons webinar (inclusief video en slides):