Learn, Create and Make It Work

Data + AI = Bedrijf van de Toekomst

Data + AI = Bedrijf van de Toekomst

Kennis en expertise zijn de kernwaarden van CIMSOLUTIONS. Gericht op de kwaliteit van zijn detacheringsdiensten, investeert CIMSOLUTIONS continu in de ontwikkeling van eigen medewerkers in de vorm van de thematische groeipadden, Special Interest Groups en Competence Centers. Deze laatste focussen op twee aspecten: het bouwen van interne kennis en expertise en tegelijkertijd het ontwikkelen van de levensvatbare en demonstreerbare producten voor de externe klanten – beide zijn noodzakelijke ingrediënten voor de asset-based consulting [1]. Op het gebied van data en kunstmatige intelligentie (AI) wordt via het ’Competence Center AI, Machine Learning en Robotics’ gericht op de innovatieve ontwikkelingen van de data gedreven applicaties en gebruik van kunstmatige intelligentie; dit omvat een aantal in-house projecten waarvan één is te zien rechts onder deze pagina bij de groene button.

Klim Trans

Traditioneel programmeren vs. zelflerend systeem

Het ontwikkelen van de AI systemen is net iets anders dan van de traditionele software. In traditionele programmering worden expliciete regels vastgelegd in de code. Deze vaste regels samen met de input van nieuwe gegevens zorgen ervoor dat er altijd een eenvoudige output door het systeem wordt geproduceerd. In tegenstelling hierop is een andere aanpak nodig om AI zelf te laten leren. In plaats van de vastgestelde regels (die we vaak zelf niet eens kennen) geven we een aantal bekende antwoorden zodat de machine zelf op basis van deze antwoorden en daaraan gerelateerde input de regels kan formuleren. Als AI de regels heeft vastgesteld, dan kan het systeem voor nieuwe input zelf een antwoord bepalen.

Rules

Figuur 1 – Functioneel verschil tussen de traditionele programmeren en het AI systeem

AI is een breed begrip en kan in twee onderdelen worden verdeeld (Figuur 2): 

  • machine learning richt zich op het zelfleren op basis van enkele statistische eigenschappen van de input gegevens en verbonden antwoorden; 
  • deep learning (onderdeel van zowel AI als machine learning) is meer gericht op het zelfleren op basis van grote (vaak ongestructureerde) gegevens door het trainen van complexe meerlaagse neurale netwerken. 

Dat laatste wordt tegenwoordig met groeiende hoeveelheden data en computer rekenkracht steeds populairder, omdat het veel complexere problemen zoals beeld-, spraak- of tekstherkenning kan oplossen. Deze trend zien we ook terug in de markt – Gartner heeft 7,777 referenties voor het term “deep learning”, veel meer dan voor “machine learning” (5,639) en “AI” (4,457)  [3].

Scope Ai

Figuur 2 – de scope van AI / Machine Learning / Deep Learning [2]

Hoe leert moderne software zien, luisteren en praten?

Net zoals traditionele software werkt het neurale netwerk met de digitale numerieke input (cijfers). Om deze reden kan dit systeem niet rechtstreeks van teksten, audio of video input leren en moet het dus eerst deze informatie naar cijfers omzetten. De manieren waarop deze input wordt omgezet, wisselt per type probleem: 

  • Voor beeld-/videoherkenning leert het netwerk op basis van de pixel codering van een afbeelding: lengte x breedte x RGB (kleuren) schaal; hetzelfde geldt voor video’s, met het verschil dat het daar kijkt naar alle losse frames alsof het losse afbeeldingen zijn;
  • Voor tekstherkenning zet het netwerk eerst alle woorden om in cijfers, welke worden bepaald op basis van de overeenkomsten in betekenis tussen de woorden. Hoe meer de betekenis van de woorden overeenkomt, hoe dichter bij elkaar hun cijfers zullen liggen.
  • Voor spraakherkenning moet eerst het analoge audiogeluid naar een digitaal signaal geconverteerd worden, bijvoorbeeld door een analoog-digitaalomzetter. Het probleem wordt verder gereduceerd tot tekstherkenning door het digitale signaal op te breken in fonemen (kleinste klankeenheden) en er de meest waarschijnlijke woorden aan te koppelen;

Op de schouders van reuzen staan

Het trainen van deep learning modellen op basis van enorme datasets kan zeer rekenintensief zijn en vereist meerdere leeriteraties die vele dagen kunnen duren, zelfs op krachtige Graphics Processing Units (GPU’s). Daarom is het vaak een goed idee om eerst te zoeken naar reeds bestaande modellen die al zijn getraind op vergelijkbare data en van deze vervolgens de modelparameters aan te passen zodat slechts enkele specifieke iteraties kunnen worden gebruikt om het model op de specifieke gegevens door te trainen.

Concept Transfer Learning

Figuur 3 – concept van transfer learning [4] 

Van prototype naar productie

Het belangrijkste doel van het trainen van AI-systemen is om deze systemen uiteindelijk in productie te nemen zodat ze voorspellingen kunnen doen op basis van nieuwe data. Meerdere aanvullende componenten zoals databeheer, model serving en monitoring zijn vereist voor het robuust werken van het zelfvoorspelende systeem. In het kader hiervan is er recent een discipline ontstaan genaamd Machine Learning Operations (MLOps, ofwel DevOps voor Machine Learning [5]) die zich specifiek richt op het robuust, reproduceerbaar en beheersbaar maken van de end-to-end levenscyclus van voorspelmodelontwikkeling in elk deel ervan.

Mlops

 Figuur 4 – Iteratief-incrementeel proces in MLOps [5]

Het volgen van deze principes garandeert stabiele voorspellingen en tijdige signalering wanneer het model opnieuw moet worden getraind (bijvoorbeeld als input gegevens of bedrijfsprocessen veranderen).

Klim Mikhailov
Machine Learning Engineer

[1] https://www.gartner.com/en/documents/3990228

[2] https://master-iesc-angers.com/artificial-intelligence-machine-learning-and-deep-learning-same-context-different-concepts/ 

[3] Overzicht zoekresultaten Gartner (t/m publicatiedatum van deze blogpost)

[4] https://www.v7labs.com/blog/transfer-learning-guide 

[5] https://ml-ops.org/ 

    Benieuwd naar onze vacatures?

    Wij zijn altijd op zoek naar gedreven professionals

    Geïnteresseerd?

    Wij horen graag van je! Neem contact met ons op.