Supervised learning en unsupervised learning

Machine learning is een populaire techniek die een rol speelt binnen de kunstmatige intelligentie. waarbij computers bepaalde dingen leren zonder dat deze expliciet worden geprogrammeerd. Goede voorbeelden zijn natuurlijk de zelfrijdende auto of de schaakcomputer, maar ook creditcardbedrijven die fraude detecteren of je Android of iPhone die je stem of gezicht herkent. De vraag is: hoe werkt machine learning precies? Hoe is een machine learning model in staat om te leren en te zien wanneer een creditcardtransactie onbetrouwbaar is? Hoe hoort een telefoon zelfstandig welke stem bij welke persoon hoort? En hoe weet een goedkope schaakcomputer hoe hij moet winnen van de wereldkampioen?

supervised learning en unsupervised learning zijn onderdeel van machine learning

Hoe werkt machine learning uitgelegd

Het antwoord op de bovenstaande vragen is: machine learning. Om uit te leggen hoe machine learning werkt gebruiken we eerst een simpele definitie:

Machine learning is het vermogen van computers om te leren en te doen zonder dat ze daarvoor expliciet worden geprogrammeerd.

Met expliciet programmeren wordt bedoeld dat alle mogelijke keuzes door de programmeur worden ingevoerd. Bij veel problemen waarbij machine learning is dit óf onmogelijk, omdat een programmeur nooit alle mogelijke situaties kan programmeren, óf het is ongewenst, omdat een machine learning model een bepaalde taak beter uit kan voeren dan een mens.

Globaal gezien zijn er 3 verschillende manieren om machine learning te laten werken:

  • Supervised learning: hierbij krijgt het model vaak twee gegevens: de invoer en de uitvoer. De invoer is bijvoorbeeld de locatie van 10.000 huizen. De uitvoer kan zijn de marktwaarde van al deze huizen. Nu wordt het model ‘getraind’ om te leren wat precies het verband is tussen de locatie van een huis en de marktwaarde. Na het trainen kan het model over de marktwaarde van nieuwe huizen, waar deze nog onbekend is, een nauwkeurige voorspelling doen.
  • Unsupervised learning: lijkt op het bovenstaande, maar in dit geval krijgt het model alleen invoergegevens. Categoriseren is hier een goed voorbeeld van. In ons huizenvoorbeeld krijgt het model de marktwaarde en de locatie van huizen en gaat deze zelf indelen in categorieën. De vertaling naar de echte wereld zouden groepen van huizen kunnen zijn: “Dure huizen in Utrecht”, “middenstand huizen in Utrecht”, “goedkope huizen in Utrecht”, enzovoort.
  • Reinforcement learning: hierbij leert het model op basis van een bepaald doel. Dit doel kan zijn het winnen van een potje schaken. Het model wordt niet verteld hoe het moet schaken en krijgt hoogstens te weten wat de mogelijke verplaatsingen zijn. Daarnaast krijgt het model alleen te horen wat het doel is: het uitschakelen van de tegenstander. Op basis hiervan zal het model, waarschijnlijk na eerst tientallen potjes te verliezen, doorhebben hoe het spel werkt en zelfs kunnen winnen van de wereldkampioen.

Vandaag de dag zijn er erg veel consumenten- en bedrijfstoepassingen die met de bovenstaande technieken worden gerealiseerd.

Trainen, valideren en testen met supervised en unsupervised learning

Bij supervised en unsupervised learning spelen grote hoeveelheden data een belangrijke rol. Zonder hier al te diep op in te gaan, is het belangrijk om te weten dat deze data wordt gebruikt om een model te trainen. Wanneer een model getraind wordt, gebeurt dit in 2 of 3 stappen:

  • Het model wordt getraind met trainingsdata. Vaak wordt 70% van alle data gebruikt om te trainen.
  • Vervolgens wordt het model gevalideerd met validatiedata. Vaak wordt 15% van de data gebruikt om het model te valideren.
  • De resterende 15% wordt testdata genoemd. Bij deze data is het model al klaar. Het doel is nu om te kijken hoe goed het model nou echt is geworden en hoe goed uitkomsten kunnen worden voorspeld.

De grootte van deze datasets verschilt behoorlijk. Een bekende dataset voor het herkennen van gezichten bevat iets meer dan 11.000 foto’s van de gezichten van ongeveer 1.200 mensen. Dit lijkt veel, maar een bekende dataset voor het verwerken van natuurlijke taal bevat 1.500.000.000 (1.5 miljard) berichten.

Machine learning in bedrijfsapplicaties

Ook in bedrijfssoftware wordt machine learning gebruikt. Dit kan door data van een bedrijf als trainingsdata te gebruiken, maar ook door bestaande machine learning oplossingen te implementeren. Bij APPelit hebben we veel ervaring met de implementatie van dergelijke oplossingen, maar ook met de ontwikkeling van nieuwe oplossingen. Wilt u aan de slag met machine learning binnen uw bedrijf? Neem dan contact op met één van onze experts. We voorzien u graag van het juiste advies.

Categorieën

Vraag nu een vrijblijvende offerte aan voor de ontwikkeling van uw app idee of software oplossing en ontvang binnen 24 uur reactie.

  • orange
  • openbaarministerie
  • valvoline
  • temptationisland
  • smurfitkappa
  • zodiaknl
  • bekina boots
  • leprastichting
  • apk group
  • boersenlem
  • world fashion centre
  • ijbgroep
  • slijptechniek enter
  • dermatude
  • motoroccasion
  • nouveau contour
  • ssh
  • stichting robijn
  • amstelveen college
  • Zorgaccent
  • afas
  • ridderiq