De belangrijkste data functies

Leestijd 6 minuten

De belangrijkste data functies

Een verhaal vertellen met data is een reis die meestal niet bij jou begint. Deze gegevens moeten ergens vandaan komen. Om de gegevens op een voor jou bruikbare plaats te krijgen, is inspanning nodig die waarschijnlijk buiten je bereik ligt. En dit vooral met het oog op de onderneming.

De toepassingen en projecten van vandaag kunnen groot en ingewikkeld zijn. Hierbij worden vaak de de vaardigheden en kennis van tal van individuen gebruikt.

Elk persoon brengt een uniek talent en expertise met zich mee. Om een project van concept tot productie goed te laten verlopen, werkt iedereen samen om de taken en verantwoordelijkheden op de juiste manier te coördineren en te verdelen.
 

De verschillende rollen in data

In het recente verleden waren functies als business analisten en business intelligence-ontwikkelaars de standaard voor gegevensverwerking en -begrip. Door de buitensporige uitbreiding van de omvang en de soorten gegevens zijn deze rollen echter geëvolueerd naar meer gespecialiseerde vaardigheden. Vaardigheden die de processen van data-engineering en -analyse moderniseren en stroomlijnen.

De volgende secties belichten deze verschillende rollen in data en de specifieke verantwoordelijkheid in het algemene spectrum van data-ontdekking en -begrip:

  • Business analist
  • Data-analist
  • Data-engineer
  • Data scientist
  • Databasebeheerder

Business analist

Hoewel er enkele overeenkomsten zijn tussen een data-analist en een business analist, is de belangrijkste onderscheidende factor tussen de twee rollen wat ze met data doen.

Een business analist staat dichter bij de business en is een specialist in het interpreteren van de data die uit de visualisatie komt.

Vaak kunnen de rollen van data-analist en business analist de verantwoordelijkheid zijn van één persoon.

Data-analist

Met behulp van een data-analist maximaliseren bedrijven de waarde van hun data-assets door middel van visualisatie- en rapportage tools zoals Microsoft Power BI. Data-analisten zijn verantwoordelijk voor het profileren, opschonen en transformeren van gegevens. Hierbij hoort ook het ontwerpen en bouwen van schaalbare en effectieve datamodellen en het inschakelen en implementeren van de geavanceerde analysemogelijkheden in rapporten voor analyse.

Een data analist werkt samen met de relevante belanghebbenden om geschikte en noodzakelijke gegevens en rapportagevereisten te identificeren. Daarna zetten ze onbewerkte gegevens om in relevante en zinvolle inzichten.

Een data analist is ook verantwoordelijk voor het beheer van business intelligence, waaronder rapporten, dashboards, werkruimten en de onderliggende datasets die in de rapporten worden gebruikt. Ze implementeren en configureren de juiste beveiligingsprocedures, in combinatie met de vereisten van belanghebbenden, om de veilige bewaring van hun gegevens te waarborgen.

Data-analisten werken samen met data ingenieurs om geschikte gegevensbronnen te bepalen en te lokaliseren die voldoen aan de vereisten van belanghebbenden. Bovendien werken data analisten samen met de data engineer en databasebeheerder om ervoor te zorgen dat de analist toegang heeft tot de juiste gegevensbronnen. De data analist werkt ook samen met de data engineer om nieuwe processen te identificeren of bestaande processen te verbeteren voor het verzamelen van gegevens voor analyse.

Data engineer

Data engineers leveren en installeren dataplatform technologieën die on-premises en in de cloud zijn. Ze beheren en beveiligen de stroom van gestructureerde en ongestructureerde gegevens uit meerdere bronnen. De gegevens platforms die ze gebruiken, kunnen relationele databases, niet-relationele databases, gegevensstromen en bestand archieven zijn. Data engineers zorgen er ook voor dat nieuwe data services veilig en naadloos worden geïntegreerd in bestaande data services.

De primaire verantwoordelijkheden van data engineers zijn onder meer het gebruik van on-premises en cloud gegevensservices en hulpmiddelen om gegevens uit meerdere bronnen op te nemen, uit te gaan en te transformeren. Data engineers werken samen met zakelijke belanghebbenden om gegevens vereisten te identificeren en hieraan te voldoen. Zij ontwerpen en implementeren dus oplossingen.

Er kan enige overeenstemming bestaan ​​in de taken en verantwoordelijkheden van een data engineer en een databasebeheerder. Het werk van een data engineer gaat echter veel verder dan het zorgen voor een database en de server waarop deze wordt gehost. Het gaat  waarschijnlijk niet om het algehele operationele gegevensbeheer.

Een data engineer voegt enorme waarde toe aan business intelligence en data science projecten. Wanneer de data engineer data samenbrengt, vaak omschreven als data-ruzie, gaan projecten sneller omdat data wetenschappers zich kunnen concentreren op hun eigen werkterrein.

Als data analist werk je nauw samen met een data engineer om ervoor te zorgen dat je toegang hebt tot de verscheidenheid aan gestructureerde en ongestructureerde data bronnen. Deze bronnen zullen je ondersteunen bij het optimaliseren van datamodellen, die doorgaans worden bediend vanuit een modern datawarehouse of data lake.

Zowel database beheerders als business intelligence professionals kunnen overstappen naar een rol als data engineer. Belangrijk is dan wel dat ze de tools en technologie moeten leren die worden gebruikt om grote hoeveelheden gegevens te verwerken.

Data scientist

Een data scientist voert geavanceerde analyses uit om waarde uit data te halen.

Het werk varieert van beschrijvende analyses tot voorspellende analyses. Beschrijvende analyses evalueren gegevens via een proces dat exploratory data-analyse (EDA) wordt genoemd. Voorspellende analyses worden gebruikt bij machine learning om modelleringstechnieken toe te passen die afwijkingen of patronen kunnen detecteren. Deze analyses zijn belangrijke onderdelen van prognosemodellen.

Beschrijvende en voorspellende analyses zijn slechts gedeeltelijke aspecten van het werk van data scientists. Sommige data scientists werken mogelijk op het gebied van deep learning en voeren iteratieve experimenten uit om een ​​complex data probleem op te lossen met behulp van aangepaste algoritmen.

Anekdotisch bewijs suggereert dat het meeste werk in een data science-project wordt besteed aan data-ruzie en feature-engineering. Data scientists kunnen het experimenteren proces versnellen wanneer data engineers hun vaardigheden gebruiken om met succes data te ruziën.

Op het eerste gezicht lijkt het misschien dat een data scientist en een data analist ver uit elkaar liggen in het werk dat ze doen, maar dit vermoeden is niet waar. Een data scientist kijkt naar data om de vragen te bepalen die beantwoord moeten worden. Hij bedenkt vaak een hypothese of een experiment en wendt zich vervolgens tot de data analist om te helpen bij de datavisualisatie en rapportage.

Databasebeheerder

Een databasebeheerder implementeert en beheert de operationele aspecten van cloud-native en hybride dataplatform oplossingen.

Een database beheerder is verantwoordelijk voor de algehele beschikbaarheid en consistente prestaties en optimalisaties van de database oplossingen.

Ze werken samen met belanghebbenden om het beleid, de hulpmiddelen en de processen voor gegevensback-up- en herstelplannen te identificeren en te implementeren.

De rol van een databasebeheerder is anders dan die van een data engineer. Een database beheerder bewaakt en beheert de algehele gezondheid van een database en de hardware waarop deze zich bevindt. Een data engineer is betrokken bij het proces van gegevens ruzie. Oftewel het opnemen, transformeren, valideren en opschonen van gegevens om aan zakelijke behoeften en eisen te voldoen.

De databasebeheerder is ook verantwoordelijk voor het beheer van de algehele beveiliging van de gegevens. Denk aan, het verlenen en beperken van gebruikerstoegang en -rechten tot de gegevens, zoals bepaald door de zakelijke behoeften en vereisten.



Deze blog is geschreven door:

Dewi de Baat

Mede-eigenaar & data architect

Het is zijn passie om zijn kennis op een eenvoudige en positieve manier te doceren aan zijn studenten.

Interesse?

Of je nu al een hele datastrategie hebt staan, of dat je nog moet starten, wij denken graag met je mee in het realiseren van een datagedreven organisatie. Laat je naam en telefoonnummer achter en wij nemen snel contact met je op.
Bedankt voor het invullen! We bellen je zo spoedig mogelijk terug.
Oops! Something went wrong while submitting the form.

Alle trainingen en opleidingen

Data Science opleidingen in Python en R voor beginners tot aan expert, data engineering met Azure en Spark en data visualisatie in PowerBI.