Machine Learning: De gereedschapskist van de data scientist
Liever deze tekst luisteren? Dat kan hier.
Data science is een veel omvattend vak. Een data scientist maakt gebruik van veel verschillende tools om zo goed mogelijk analyses en voorspellingen te kunnen doen op de beschikbare data. Machine learning is een onderdeel in de gereedschapskist van een data scientist. Om duidelijk te maken op wat voor manier machine learning kan worden ingezet maken gebruik van een metafoor: de timmerman.
Een timmerman gaat een tafel bouwen. De timmerman moet bedenken wat hij allemaal nodig heeft en moet keuzes maken. Voor welk hout kiest hij en van welke kwaliteit moet dat hout zijn? Daarnaast moet hij letten op de hoeveelheid planken die hij kan zagen uit de gekwalificeerde boom die het juiste hout levert. Hij zal voor de tafel verschillende planken van verschillende lengte en dikte nodig hebben.
Vervolgens moet de timmerman ook bedenken hoe hij de tafel gaat maken. Gebruikt hij een hamer om de verschillende planken aan elkaar te spijkeren of kiest hij voor schroeven of lijm? Als de tafel in elkaar is gezet zal deze nog niet af zijn. Wordt de tafel alleen geschuurd of wordt de tafel nog gelakt of geverfd? En als men kiest voor verf, voor welke kleur(en) kiest men dan?
Daarnaast zal het waarschijnlijk niet bij één tafel blijven. Er zullen meer tafels worden gemaakt en ook met verschillende afmetingen. De timmerman zal dan moeten kijken welk productieproces het beste past bij de vraag naar tafels, als de tafel een succes wordt zal hij een zaagmachine aanschaffen en de tafel niet meer handmatig fabriceren.
Er zijn dus verschillende keuzes en opties die van invloed zijn op het proces. Een data scientist heeft die keuzes en opties ook. Het gaat bij het maken van analyse ook om de keuze voor het juiste algoritme en het ontwikkelen van een toepassing die bruikbare resultaten geeft of met zo min mogelijk fouten. Een data scientist heeft daarbij de keuze uit verschillende tools uit de machine learning gereedschapskist, zoals een regressie of een cluster algoritme om te komen tot een waardevolle analyse van de data. Als de gerealiseerde oplossing succesvol blijkt zal de data scientist na moeten denken over de (grootschalige) implementatie van zijn/haar algoritme. Zeker als het om een grote hoeveelheid data gaat en dit veelvuldig herhaald moet worden zijn de tools uit de machine learning gereedschapskist onmisbaar, zoals een hamer onmisbaar is voor een timmerman.
De gereedschapskist van een data scientist bestaat uit meer tools dan machine learning. Elke organisatie vraagt om andere oplossingen en beschikt over verschillende data en heeft verschillende doelstellingen met die data. De data scientist zoekt en gebruikt dan ook het meest geschikte gereedschap om te zorgen dat de klant meerwaarde creëert uit haar data.
Meer weten over wat data voor uw organisatie kan betekenen?
Neem contact op met Hugo Koopmans
Telefoon: +31643106780
E-mail: hugo.koopmans@dikw.com
Blogs
-
Datagedreven werken Deel 3 — door Nick van de Venn — last modified 03-10-2023
- Welke data heeft eigenlijk waarde voor uw organisatie?
-
Differential Privacy — door Nick van de Venn — last modified 18-09-2023
- Gevoelige gegevens verwerken zonder dat de gevoelige informatie kan uitlekken
-
Datagedreven werken Deel 2 — door Nick van de Venn — last modified 03-10-2023
- Welke data heeft eigenlijk waarde voor uw organisatie?
Data Science recente Blogs
-
Datagedreven werken Deel 3 — door Nick van de Venn — last modified 03-10-2023
- Welke data heeft eigenlijk waarde voor uw organisatie?
-
Differential Privacy — door Nick van de Venn — last modified 18-09-2023
- Gevoelige gegevens verwerken zonder dat de gevoelige informatie kan uitlekken
-
Datagedreven werken Deel 2 — door Nick van de Venn — last modified 03-10-2023
- Welke data heeft eigenlijk waarde voor uw organisatie?
Data Science Nieuws & Events
-
Data science opleidingen gaan weer van start! — door marco — last modified 08-02-2022
- Vanaf 21 september start ons succesnummer weer! Twaalf weken data science in R, we hebben er weer zin in
-
Aedes data science workshop 2 van 3 — door marco — last modified 07-02-2022
- Voor Aedes organiseert DIKW drie workshops data science
-
DIKW in top 50 beste data science bedrijven — door marco — last modified 22-10-2021
- DIKW is één van snelst groeiende bedrijven volgens MKB Data Science rapport