Data Integratie, hoe doe je dat?

Vaak krijgen we de vraag of data uit verschillende bronnen gecombineerd kan worden tot nieuwe informatie.

Bijvoorbeeld om de salarisadministratie en de marketingdatabase te koppelen. Dan kan er per verkoper gekeken worden naar kosten en opbrengsten. Dat kan door middel van data integratie. Dat is niet altijd even makkelijk maar ik leg u graag uit wat daar allemaal voor nodig is en hoe het precies werkt.

Wat is het voordeel van data integratie

In veel bedrijven en organisaties worden allerlei systemen gebruikt. Er worden vaak separate applicaties gebruikt voor de boekhouding, urenregistratie, salarissen, de HR-administratie, CRM, productie, logistiek enzovoorts. Hoe mooi zou het niet zijn als we data uit die verschillende systemen op een goede manier aan elkaar zouden kunnen knopen tot nieuwe informatie. Dan zou in een overzicht de uren, salariskosten, salesinspanningen en gefactureerde opbrengsten per verkoopmedewerker kunnen worden getoond. Dat is een zeer krachtig stuurinstrument voor uw verkoopafdeling.

Wat is data integratie

De definitie van data integratie is “het combineren van data uit verschillende bronnen om gebruikers een samengesteld beeld te geven van deze data.”. Oftewel, het combineren van data uit diverse systemen tot nieuwe informatie. Dat is niet altijd eenvoudig maar mits het goed wordt gedaan levert het nieuwe informatie en nieuwe mogelijkheden op.

Hoe werkt data integratie

Data-gestuurde systemen hanteren vaak hun eigen methodiek en datastructuur. Dat zorgt ervoor dat al deze systemen los van elkaar staan en geïsoleerd worden. Het is een uitdaging om de data uit deze systemen te herstructureren tot één gezamenlijke structuur. Data integratie gebeurt daarom meestal in drie stappen via het ETL proces: Extract – Transform – Load.

Extract:

Het uit het systeem halen van de data, meestal door gebruik te maken van koppelingen zoals ODBC.

Transform:

Het uit elkaar rafelen van de systeem-specifieke structuur om deze om te vormen tot een nieuwe uniforme structuur. Hierbij moeten vaak data “vertaald” worden. In het ene systeem staat bijvoorbeeld “Dhr” of “Mw” terwijl we het willen combineren met een ander systeem dat “M” of “V” gebruikt. Ook moeten coderingen in de data worden doorgrond en begrijpelijk worden gemaakt.

Load:

Als laatste moeten alle omgevormde data bij elkaar worden gezet in een nieuwe structuur in een database of data warehouse, klaar voor gebruik door rapportage- en analyse-tools.

Wat kun je er nog meer mee

Voor veel vraagstukken is tegenwoordig wel een geautomatiseerde oplossing. Al die systemen hanteren hun eigen taal, methodiek en structuur. Als vanuit een of meerdere systemen door middel van het ETL proces een combinatie is gemaakt, is het aankoppelen van een volgend systeem tot nog meer nieuwe informatie meestal weer een stuk eenvoudiger.
Data is voor veel organisaties een waardevol asset. Hoe meer informatie eruit gehaald kan worden hoe makkelijker het voor u wordt om dit te gebruiken om bij te sturen. En door het combineren van bestaande data tot nieuwe informatie haalt u er nog veel meer waarde uit