Machine Learning in de praktijk

Bij het gebruik van Machine Learning geldt hoe meer data hoe beter. Het is een slimme manier om waarde uit data te halen, het verzamelen van veel data helpt bij het verhogen van de nauwkeurigheid. Big Data en Machine Learning gaan daarom ook hand in hand.

 

Splunk biedt de mogelijkheid om Machine Learning op een eenvoudige manier ook echt operationeel in te zetten. Voor bijvoorbeeld een alert op afwijkende responsetijden hoef je niet meer af te gaan op statistische modellen die moeite hebben met onregelmatige patronen. Je kunt middels Machine Learning clusters maken van reguliere en afwijkende responsetijden. Deze clustering algoritmen kunnen deze afwijkingen nauwkeuriger signaleren. Clustering kan ook relaties leggen met andere relevante metrics, het kan bijvoorbeeld normaal zijn dat bij veel bezoek de responsetijd iets oploopt.

 

Splunk Machine Learning Toolkit (MLTK)

Bij het gebruik van een big data platform heb je op verschillende manieren toegang tot Machine Learning. Bij Splunk wordt de meest uitgebreide functionaliteit geboden via de gratis add-on “Machine Learning Toolkit”. Deze web-gebaseerde omgeving geeft toegang tot een groot palet aan algoritmen, zonder dat er een regel code geschreven hoeft te worden. De meegeleverde algoritmen zijn direct toepasbaar op een breed scala aan use cases. Er zijn een aantal algoritmen voor het detecteren van afwijkingen van de standaard; Is het aantal webshop-bezoekers op deze zondagmorgen normaal?

Daarnaast zijn er ook algoritmen die helpen om in de toekomst te kijken. Dit helpt een donutverkoper bij het plannen van zijn voorraad. Of een IT-manager met het tijdig bestellen van nieuwe hardware of het bepalen van zijn budget voor het afnemen van clouddiensten in het volgende kwartaal.

Om inzicht te krijgen in onderliggende structuren of afhankelijkheden in data, zijn er clustering algoritmen beschikbaar.Op deze manier heeft een verzekeraar bijvoorbeeld gezien dat huizen van voor 1940 met rieten daken en een schoorsteen bij koud winterweer een buitenproportioneel groot risico op brand hebben. Doordat deze specifieke combinatie van eigenschappen nu bekend is, kan men aan deze specifieke groep klanten een korting op het vegen van de schoorsteen geven. Dan zijn er minder branden waar zowel de klant als de verzekeringsmaatschappij weer van profiteert.

 

Splunk ITSI (IT Service Intelligence)

Premium app – Splunk ITSI laat je via services naar een IT-landschap of organisatie kijken. Een service is een abstract begrip en kan veel verschillende dingen omvatten; denk hierbij aan technische zaken zoals webservers, databases of storage, maar ook business services zoals support desk of webshop-omzet. Iedere service heeft een graadmeter die de status van de service aangeeft. Deze graadmeter wordt bepaald aan de hand van een aantal indicatoren (KPI’s) die bij de service horen. Een KPI voor een database is bijvoorbeeld het aantal queries per seconde en de tijd die het kost om een antwoord te geven. Het kan lastig zijn om een oordeel te geven over de waarde van een KPI. Een minimaal aantal actieve gebruikers in een webshop op zondagochtend is geen probleem, maar als we hetzelfde aantal actieve gebruikers op een, normaal gesproken drukke, donderdagavond zien is er vrijwel zeker een probleem.

Om dit probleem te ondervangen is machine learning een integraal onderdeel van ITSI. Het helpt om een oordeel te vormen over de waarde van KPI’s door te kijken naar het normale gedrag in de voorgaande periode. Afwijkingen worden dan geclassificeerd als een potentieel probleem. Door Machine Learning te gebruiken kan zelfs de status van een service tot 30 minuten in de toekomst voorspeld worden. Er wordt gekeken naar de relaties tussen KPI’s en status van de service in het verleden, waarna het wordt toegepast op de waardes van KPI’s op dit moment. Met de verzamelde data uit het verleden, de real-time data van dit moment en deze voorspelling kan IT-operations preventief onderzoek doen, en optreden. Door deze data-driven benadering kan IT-operations beslissingen nemen voordat er een echt probleem is waar klanten of de business last van hebben.

 

In de praktijk

De web-omgeving van Splunk geeft toegang tot veel verschillende algoritmen, die gebruik kunnen maken van alle data die beschikbaar is in het platform. Deze algoritmen en getrainde modellen kunnen direct operationeel ingezet worden. Er kan een alert gegeven worden als de echte waarden te veel afwijken van de voorspelling. Of er kan een dashboard rood oplichten als een potentieel frauduleuze transactie is gedetecteerd. Hierdoor kunnen we zeggen dat we aan het begin staan van een nieuw tijdperk.

Splunk wist 10 jaar geleden als één van de eersten eenvoudig waarde te halen uit log files en machine data. Nu maakt Splunk Machine Learning toegankelijk voor iedereen.