Duiken in donkere gegevens op Azure – Gegevensbeheer in de cloud
Voor de meeste organisaties is dark data een vaag concept, de wetenschap dat je ergens enorme hoeveelheden opgeslagen gegevens hebt – en je hebt geen echt idee wat het is. Gartner bedacht de term om te verwijzen naar gegevens die organisaties verzamelen maar niet gebruiken of te gelde maken, en uiteindelijk uit het oog verliezen.
Die gegevens, die zijn opgeslagen in netwerkbestandsshares, samenwerkingstools (bv. SharePoint), online opslagdiensten zoals Drive en Dropbox, oude pc’s en back-ups, zijn duister omdat de meeste mensen in de organisatie geen idee hebben wat erin staat. In feite zijn die gegevens vaak opgeslagen in oude systemen of op schijven geplaatst door mensen die de organisatie inmiddels hebben verlaten. Maar nu organisaties overgaan op de cloud en moeten kiezen of ze gegevens laten waar ze zijn of ze verplaatsen naar een Azure Blob, wordt het een groter probleem – niet alleen voor het potentieel aan bedrijfswaarde, maar ook voor naleving van de regelgeving.
Donkere gegevens kunnen privégegevens omvatten
Donkere gegevens bieden geen beloften op het gebied van bedrijfswaarde. Toch kunnen organisaties het niet negeren. Vaak bevatten dark data alles van persoonlijk identificeerbare informatie tot HR-gegevens, juridische contracten, veiligheids- en toegangsinformatie en andere vertrouwelijke of bedrijfseigen informatie. Dit brengt reële risico’s met zich mee op het gebied van informatiebeheer, vooral in sectoren zoals de financiële en de openbare sector. En voor mondiale bedrijven wordt het steeds belangrijker dat gegevensanalyse en -beheer tegelijkertijd worden aangepakt om te voldoen aan de wetgeving inzake gegevensprivacy in de EU en de VS.
Uw bedrijfsgegevens kennen en kunnen opzoeken zou ideaal zijn. Het ontbreken van labels, categorieën en metagegevens in het algemeen maakt het echter moeilijk om te kiezen wat naar AI moet worden gestuurd voor analyse en ontdekking, wie toegang krijgt tot welke gegevens, en welke gegevens moeten worden bewaard (en waar). De meeste bedrijven hebben juist donkere gegevens omdat het sorteren en labelen te veel handwerk kost. Maar donkere gegevens houden onbekende mogelijkheden en risico’s in – zonder inzicht in de inhoud ervan kan geen enkele organisatie optimale beslissingen nemen over wat zij het beste kan doen.
Een aanzienlijke bestuurlijke voetafdruk
Zowel gestructureerde als ongestructureerde gegevens kunnen deel uitmaken van dark data. Er bevinden zich meer ongestructureerde dan gestructureerde gegevens in het donker.
Waarom? Ongestructureerde gegevens bemoeilijken geautomatiseerde verwerking; veel van deze gegevens vereisen aanzienlijke handmatige verwerking. Azure cloud compute en storage gebruiken elasticiteit en schaal om opties te bieden om resources efficiënt en kostenefficiënt te optimaliseren en alle gegevens te verwerken. Deze optie is uiteraard niet gemakkelijk beschikbaar in on-premise datacenters. Met SynerScope bovenop de Azure object store (Blob of ADLS) van de klant, kunnen ondernemingen snel en economisch zien welke content ze hebben. Nog belangrijker is dat zij deze informatie kunnen gebruiken om actie te ondernemen.
Zo kunnen de onderliggende contracten en correspondenties voor 10 jaar oude facturen niet worden behandeld zonder een goede governance. In de Azure-cloud kun je die gegevens genereren. Maar als er meerdere back-ends van verschillende SaaS-leveranciers zijn, wordt het verplaatsen van dark data naar de cloud bemoeilijkt vanuit een governance- en risicoperspectief. Daarom gebruikt de SaaS-achtige applicatie van SynerScope de opslag op de Azure-tenant van de klant. Daarom worden alle gegevensbescherming en -beveiliging geregeld in het ene contract tussen de klant en Microsoft Azure. Dankzij deze eenvoud kan de onderneming met vertrouwen gegevens naar de cloud verplaatsen, in de wetenschap dat de verantwoordelijkheden en aansprakelijkheden duidelijk zijn vastgelegd.
Dark Data categoriseren in de Azure Cloud
Bij Synerscope leveren we de tools om donkere gegevens te ontsluiten met behulp van machine learning voor het sorteren op inhoud, terwijl uw domeinexperts context toevoegen. Onze AI sorteert gegevens visueel, “stapelt” inhoud op basis van visuele gelijkenis – en markeert trefwoorden en descriptoren uit de stapel. Uw domeinexpert kan dat gebruiken om context aan de stapel toe te voegen – snel vaststellen of iets een factuur is, een hypotheekafschrift, de bankgegevens van een enkele klant, enz.
De software wordt geïnstalleerd in uw Azure-tenant, waarbij de gegevens in een systeemstructuur blijven, die alleen door uw Azure-contract wordt geregeld. SynerScope werkt op dezelfde manier als een Azure-module; wij brengen gegevens naar het cachegeheugen, deze worden berekend, en nieuw gegenereerde metadata vullen de oorspronkelijke gegevens aan. Deze data artefacten worden verplaatst naar de opslag, die u als klant inricht en beheert. Wij bieden u de ondersteuning om:
- Vind relevante gestructureerde en ongestructureerde gegevens, open ze voor controle, data governance en onderhoudbaarheid voor GDPR-compliance
- Gegevens vinden en structureren voor governance om te voldoen aan compliance-eisen in de financiële sector, de publieke sector, enz.
- Verbetering van de triage voor dossiers die moeten worden gecontroleerd in KYC-, CDD-, PDD- en AML-onderzoeken.
Het belangrijkste is dat dit zowel geldt voor opgeslagen dark data als voor de enorme hoeveelheden gegevens die worden gegenereerd door CMS, selfservice, enquêtes en specifieke zaken als KYC-programma’s en beveiliging. Synerscope levert tooling om de overstap naar de cloud mogelijk te maken met dark data-analyse – zodat de organisatie een goede governance implementeert op alle gegevens terwijl deze naar de cloud verhuizen – en tegelijkertijd structuur en inzicht creëert in nieuwe gegevens.
Grof inzicht in Big Data
Synerscope geeft massaal inzicht in niet alleen donkere gegevens, maar in alle gegevens. Door gegevens visueel in kaart te brengen en te vertrouwen op gegevensexperts om verbanden te leggen, versnellen wij de analyse van vrijwel alle soorten gegevens.
Een specifiek voorbeeld: KYC is ongelooflijk belangrijk voor banken en andere financiële organisaties. Automatische waarschuwingssystemen kunnen tot meer dan 5% fout-positief zijn – elke waarschuwing moet handmatig worden beoordeeld. Als elke handmatige bestandscontrole meer dan 4 uur in beslag neemt, is een fout-positief percentage van 5% een enorme belasting voor het bedrijf. Maar Synerscope’s machine learning met behulp van AI om gegevens te categoriseren en sorteren, versnelt deze handmatige beoordeling met wel 20x.
Naarmate de gegevens zich in de cloud blijven opstapelen, zal de rol van Synerscope bij het nemen van dagelijkse beslissingen over compliance en governance toenemen. Dat geldt voor het opvragen van gegevens, het beslissen waar ze moeten worden opgeslagen, en of die gegevens überhaupt moeten worden bewaard.
Als u wilt zien hoe het werkt, neem dan contact met ons op voor een demo of pilot.