Data Science waardeketen

Hoe creeren we waarde met data science?

DIKW_003_DSWK_UK_v02.png.

Het Data science waardeketen model is een model dat de verschillende aspecten beschrijft die nodig zijn voor het succesvol inzetten dat data science om waarde te creëren voor uw organisatie.

Het model combineert twee bekende methoden (CRISP-DM en DELTA) tot 1 succesvol raamwerk voor het optimaliseren van de data science waardeketen.

Transformeren naar een Analytische winnaar

Om een analytische speler te worden is het verstandig om als organisatie uw analytische assets in kaart te brengen. In het boek Analytics at work beschrijft Thomas Davenport vijf assen waarlangs een organisatie een meetlat kan zetten om haar analytische ambities in kaart te brengen. DIKW Intelligence heeft vanuit de praktijk een eigen specifieke invulling gegeven aan dit raamwerk (meer over dit raamwerk zie ACMM model). Het resultaat van dit raamwerk is een inschatting van de analytische capaciteiten van uw organisatie.

Om echt het volle potentieel van data science voor uw organisatie te kunnen gebruiken zal uw organisatie moeten uitgroeien tot een analytische winnaar. In ons model kunt u zien welke stappen nodig zijn om deze ontwikkeling door te maken.

Standaard data science proces.

Al in de jaren 90 van de vorige eeuw is er een cyclus ontworpen waarmee iteratief waarde uit data kan worden gehaald. Deze cyclus is nog steeds waardevol en bruikbaar. Het oorspronkelijke CRISP-DM process is een iteratief proces van vijf stappen. DIKW Intelligence heeft deze stappen verder verfijnd en verwerkt in dit model.

Verzamelen: Vanuit het business vraagstuk nadenken over welke bronnen beschikbaar zijn en welke bronnen mogelijk interessant kunnen zijn voor het data science vraagstuk. Ook dient men al rekening te houden met de beschikbaarheid van deze bronnen tijdens de toepassing van een algoritme. En natuurlijk moet men kijken hoeveel historie er per bron beschikbaar kan worden gesteld. 

Bewerken: Bronnen prepareren, opschonen en koppelen is een noodzakelijk onderdeel van de data science pijplijn. Belangrijk hierbij is dat we geen “opschoningsacties” doen waardoor we entropie uit de data verwijderen waar we later spijt van krijgen.

Organiseren: Het organiseren van de datalogistiek is initieel en niet heel erg belangrijk, maar als we eenmaal overtuigd zijn van de waarde van een bepaalde oplossing is het essentieel dat we de data pijplijn productie rijp kunnen maken. Dat betekent dat we de betrouwbaarheid en de kwaliteit van de data pijplijn moeten zien als onderdeel van het op te leveren werk, iets dat niet iedere data scientist tot haar taak ziet en waar ook data engineers een belangrijke rol spelen.

Integreren: Met integreren wordt bedoeld het opnemen van een algoritme in een business proces met alles wat daar bij hoort. Dit heeft natuurlijk een belangrijke technische component maar ook aan de organisatorische en procesmatige kant hoort hier een aantal aanpassingen bij waardoor de business daadwerkelijk de uitkomst van het algoritme vertrouwd en begrijpt, zodat zij beslissingen nemen met vertrouwen in het onderliggende algoritme.

Analyseren: In de CRISP-DM cyclus is het analyseren van de data natuurlijk de kern competentie van de data scientist, hier gebeurd het creatieve proces, hoe gaan we chocola maken van deze berg data? Wat is er mogelijk? Hoe goed kunnen we voorspellen? Welke methodiek kunnen we toepassen en hoe heeft dat impact op de business case? Allemaal vragen die langskomen gedurende de analyse fase.

Visualiseren: Hebben we de analyse eenmaal afgerond en een model of algoritme getraind met voldoende voorspelkracht dan is het zaak dat resultaat zo vorm te geven dat “normale stervelingen” ook begrijpen en kunnen zien wat de waarde is van het resultaat. “Storytelling” met data is een niet te onderschatten skill waarmee je je verhaal verkoopt.

Beslissen: De belangrijkste stap en het uiteindelijke resultaat van het project beklijft pas als je ergens een beslissing kunt beïnvloeden met een algoritme of voorspel model. Als je de product eigenaar kunt overtuigen om op basis van de analyses en het voorspelmodel voortaan een bepaalde actie anders/beter/slimmer te doen dan voorheen heb je daadwerkelijk waarde gecreëerd!

Conclusie

Het DIKW Datascience waardeketen model beschrijft alle componenten die nodig zijn voor het succesvol implementeren van data science in de praktijk. In dit model zijn de benodigde rollen verwerkt die nodig zijn, de analytische competenties die beschikbaar moeten zijn en een proces methode die iteratief verbeteren ondersteunt. Aan de hand van dit model helpt DIKW Intelligence uw organisatie met het opzetten en uitnutten van uw datagedreven waardeketen.

Hugo Koopmans studeerde aan de MTS, de HTS en volgde de studie Werktuigbouwkunde aan de Technische Universiteit Eindhoven. Hij rondde de studie af, maar na 10 jaar werktuigbouwkunde bleek er nog een ander domein dat minstens zo interessant was, dat van de kunstmatige intelligentie. Zijn passie lag ergens anders.   Hugo is nieuwsgierig, creatief en houdt zich bezig met de nieuwste ontwikkelingen en toepassingen op het gebied van kunstmatige intelligentie (AI), algoritmes, (Baysiaanse) statistiek en het verwerken van natuurlijke taal in een semantische kennis graaf. Voor klanten is Hugo iemand die breed kan adviseren maar vooral dingen doet. Hij is pas tevreden als het aantoonbaar is dat een data gedreven toepassing waarde creëert voor de klant  n de klant dus echt verder helpt.  Hugo is de initiatiefnemer en de drijvende kracht achter de DIKW Academy. Hier ligt ook een groot deel van zijn passie. Het opleiden van data scientists en data engineers is waar hij goed in is en waar hij ook zijn didactische vaardigheden kan gebruiken. Referentiemodellen, zoals het  Analytical Capability Maturity Model (ACMM) ontwikkelde hij zelf op basis van het werk van Thomas Davenport. Hugo wil met zijn werk ook de wereld een beetje beter maken. HIj is dan ook al jaren verbonden aan Sensing Clues, een organisatie die in zich inzet om wildlife te beschermen. Daarvoor worden innovatieve apps ontwikkeld met de techniek van AI. Een voorbeeld is de SERVAL geluidsensor. In dit whitepaper wordt uitgelegd wat het is en hoe dit werkt.   De wereld verandert snel, maar dat maakt het werk van Hugo alleen maar uitdagender. Hij is steeds bezig met het vinden van nieuwe vormen en toepassingen van data om de klanten van DIKW nog betere oplossingen te bieden. Voor deze ‘nerd’ is geen dag hetzelfde.

Nieuws

Aedes data science workshop 2 van 3 door Marco van den Doel — last modified 06-09-2021
Voor Aedes organiseert DIKW drie workshops data science.
AEDES innovatie boost datascience powered by DIKW door Marco van den Doel — last modified 06-09-2021
De innovatie boost van AEDES is binnen gehaald door de werkgroep Big data.
AI Hub Midden Nederland gelanceerd! door Marco van den Doel — last modified 06-09-2021
DIKW is partner van de AI Hub Midden Nederland en ondersteund en helpt het MKB in de regio.
Datascience opleidingen gaan weer van start! door Marco van den Doel — last modified 06-09-2021
Vanaf 9 september start ons succesnummer weer! Twaalf weken datascience in R, we hebben er weer zin in.
"Coronaproof" maken van ons Academy lokaal door Marco van den Doel — last modified 06-09-2021
De komende tijd zal Nederland zich langzaam omvormen tot een anderhalve meter samenleving. Wij passen ons leslokaal daar op aan zodat de cursisten veilig kunnen leren.
CPPDS: Een diepgaand doelgericht on business programma door Marco van den Doel — last modified 06-09-2021
Diploma uitreiking en interview met nieuwe data science champions!
Cursisten CDEP opleiding delen hun cases door Marco van den Doel — last modified 06-09-2021
Cursisten van de opleiding CDEP presenteren drie cases.
De Tour van je leven door Marco van den Doel — last modified 07-09-2021
Fred Slimmens fietst van 29 augustus t/m 5 september de Tour for Life

Data Science recente blogs

Data & AI: Kans of bedreiging? door Marco van den Doel — last modified 23-09-2021
Waarde creëren met data en AI zorgt voor nieuwe business mogelijkheden
Data gedreven logistiek onderhoud voorkomt uitval door Marco van den Doel — last modified 06-09-2021
Operationele en logistieke kosten lager door gebruik van data
Er zijn meer logistieke wegen die naar Rome leiden door Marco van den Doel — last modified 03-09-2021
Duurzame innovatieve logistieke oplossing op basis van data science

Data Science Nieuws & Evenementen

Aedes data science workshop 2 van 3 door Marco van den Doel — last modified 06-09-2021
Voor Aedes organiseert DIKW drie workshops data science.
AEDES innovatie boost datascience powered by DIKW door Marco van den Doel — last modified 06-09-2021
De innovatie boost van AEDES is binnen gehaald door de werkgroep Big data.
AI Hub Midden Nederland gelanceerd! door Marco van den Doel — last modified 06-09-2021
DIKW is partner van de AI Hub Midden Nederland en ondersteund en helpt het MKB in de regio.