big data

Big Data wordt steeds waardevoller, zeker door deze nieuwe ontdekking waarmee een computerprogramma menselijke datadeskundigen klopt.

Data Science Machine verslaat met algoritmes menselijke intuïtie

Al weer een typisch menselijk domein lijkt nu gesneuveld. Na rekenkracht, gezichtsherkenning en het spelen van schaak is nu de menselijke intuïtie overtroffen door de Data Science Machine.

Algoritme presteert beter dan meeste menselijke dataspecialisten
Big data analyse bestaat uit het zoeken van verborgen liggende patronen die een bepaald soort voorspellende kracht hebben. De mens is nog nodig met het herkennen van bruikbare patronen binnen de data. In een database met bijvoorbeeld de begin-  en einddata van verschillende uitverkoopperiodes en wekelijkse winsten, bestaat de cruciale informatie mogelijk niet uit de datums zelf, maar uit de periode tussen de actieweken en de gemiddelde winst over deze perioden.

Onderzoekers van de Amerikaanse technische universiteit MIT in Boston, Massachusetts, proberen het menselijke element uit big data analyse te halen. Dit met een nieuw systeem dat niet alleen zoekt naar patronen, maar ook kijkt naar wat de meest veelbelovende parameters zijn. Om hun systeem te testen, lieten ze hun “Data Science Machine” meedoen met  drie wedstrijden tegen menselijke teams. In deze wedstrijden moet het systeem voorspellende patronen herkennen in onbekende datasets.  Van de 906 teams die meededen aan de drie competities, presteerde de “Data Science Machine” beter dan 615.

Big Data wordt steeds waardevoller, zeker door deze nieuwe ontdekking waarmee een computerprogramma menselijke datadeskundigen klopt.
Big Data wordt steeds waardevoller, zeker door deze nieuwe ontdekking waarmee een computerprogramma menselijke datadeskundigen klopt. Bron: mit.edu

In de competities scoorde de Data Science Machine respectievelijk 94 procent, 96 procent en 87 procent van de score van de winnende inzendingen. Waar de winnende teams maanden deden over het bedenken en verfijnen van hun algoritmes, deed de Data Science Machine er tussen twee en twaalf uur over per inzending.

De bedenkers van de Data Science Machine, Max Kanter en Kalyan Veeramachaneni, zien hun systeem als complementair aan de menselijke intelligentie. Volgens hem kan door de Data Science Machine veel meer deep data worden geanalyseerd dan nu door de schaarse deep data specialisten.

Hoe werkte het systeem?
In big data analyse zoals die nu plaatsvindt, is de eerste stap, het ontdekken van variabelen die voorspellende waarde hebben. Dit vereist het bedenken van heel mogelijkheden, met andere woorden de nodige creativiteit en inzicht. De auteurs gaven het voorbeeld van het voorspellen van de drop-out hoeveelheid van studenten. Belangrijke variabelen hierbij bleken vooral de mate waarin studenten de e-learning website bezochten, vergeleken met klasgenoten, en hoe lang voor de deadline de student begint met het werken aan de opdracht. Deze informatie was niet direct uit de brondata (van het e-learningplatform van MIT, MITx) af te leiden, maar indirect wel te berekenen.

Het systeem berekent dingen als gemiddelden en dergelijke uit de database. Dit moet wel een relationele database zijn, voor de IT’ers onder u: een database die op is gebouwd uit tabellen. Dit is overigens met de meeste databases het geval. Het systeem gebruikt de koppelingen tussen tabellen als middel om verbanden te vinden. Ook berekent het systeem zaken als gemiddelden, minima, maxima en dergelijke. Dan bestudeert het systeem hoe deze variabelen met elkaar samenhangen.

Ook zoekt het systeem categorische data, denk aan dag van de week of merknamen.

De volgende stap is deze variabelen uitproberen op voorbeelddata en ze fine-tunen, bijvoorbeeld door iets aan de vergelijkingen waarmee ze worden gecombineerd te veranderen, om zo de voorspellende kracht te verbeteren.

De gevolgen
Big data zal door deze ontdekking nog veel waardevoller worden dan nu. Over het algemeen is dat goed nieuws, want daardoor zullen producten en overheidsdiensten beter en goedkoper worden. Aan de andere kant vergroot dat de voorsprong die bezitters van big data, doorgaans overheden en grote bedrijven nu al hebben op de rest van de mensheid.  Het is daarom denk ik belangrijker dan ooit, om big data-bronnen publiek te maken en te houden en open-source big data analysetools te ontwikkelen.

Meer informatie
Data Science Machine crunches numbers faster and more effectively than most humans, MIT CSAIL News, 2015
Deep Feature Synthesis: Towards Automating Data Science Endeavors, 2015. 

Internet of Things (IoT) betekent dat niet alleen mensen, maar ook machines gaan internetten in een echt Internet der Dingen.

Internet of Things: internet der dingen (IoT) als megatrend

Internet is opgezet als middel voor mensen om met elkaar te communiceren, maar dat is aan het veranderen. Heel snel. Maak kennis met IoT, het Internet of Things (Internet der Dingen).

Internet nieuwe stijl
Internet begon als een manier om mensen met elkaar in verbinding te brengen. Dit bracht al de nodige communicatie tussen webservers met zich mee, denk bijvoorbeeld aan het ophelderen van een IP-adres aan de hand van een domeinnaam. Nieuw is nu dat steeds meer apparaten zelfstandig met elkaar communiceren via internet. Geheel buiten mensen om. Denk bijvoorbeeld aan meetsensoren, onbemande weerstations, maar ook drones en robots. Dit zijn de eerste tekenen van het Internet of Things. Dit IoT deel van internet groeit explosief.

Gadgets
Gadgets worden steeds populairder en het worden er ook steeds meer. Deze gadgets communiceren nu door middel van Wifi, Bluetooth en andere bekende draadloze technieken met elkaar, maar deze vreten teveel stroom. Een probleem voor de vaak kleine sensoren, die het van energy scavenging, het energie oogsten uit de omgeving, moeten hebben. Op dit moment wordt daarom gewerkt aan energiezuiniger methoden om te communiceren. Dat betekent doorgaans ook een lagere bandbreedte. Dat is niet erg als de sensor bijvoorbeeld alleen temperatuur of pH doorseint, maar wel als er gedetailleerde camerabeelden worden verstuurd.

Internet of Things (IoT) betekent dat niet alleen mensen, maar ook machines gaan internetten in een echt Internet der Dingen.
Internet of Things (IoT) betekent dat niet alleen mensen, maar ook machines gaan internetten in een echt Internet der Dingen.

Big Data in een datawolk
In de nabije toekomst zal onze omgeving werkelijk bezaaid zijn met sensoren. Inclusief wijzelf, op ons en op termijn ook in ons. Een steeds groter deel van internet zal niet door glasvezels lopen, maar door de lucht. Wel loopt uiteraard de centrale gegevensstroom nog steeds door de glasvezelkabels, omdat in de lucht maar een beperkte bandbreedte beschikbaar is.

Dit bindt veel mogelijkheden voor inlichtingendiensten en criminelen. En, uiteraard, voor grote dataverzamelende bedrijven als Google en Facebook. Niet voor niets heeft Google de fabrikant van slimme domotica-accessoires Nest voor miljarden opgekocht. De big data die het Internet der Dingen op gaat leveren zal vermoedelijk alles overtreffen wat we tot nu toe aan gegevens hebben kunnen (laten) verzamelen. Voor fabrikanten zijn deze gegevens goud waard. Weten ze bijvoorbeeld de details van het gebruik van hun gadget in een huishouden, dan weten ze ook hoe ze de gadget aantrekkelijker kunnen maken voor klanten en onderdeel kunnen maken van een verslavende, hardnekkige en als het even kan, besmettelijke gewoonte.

Slimmere en socialere apparaten
Waar onze apparaten nu losstaande eilanden vormen, zal het Internet of Things ze met elkaar laten communiceren. Je koelkast zal via een centrale server recepten voorstellen met ingrediënten die bijna over datum zijn en dus snel op moeten. De medische sensoren, zie hierna, zullen data doorseinen aan je gezondheidsapp, waarna deze tips geeft om maaltijden extra te verrijken met vitamines en mineralen die je tekort komt. Wellicht gaat je auto op slot, omdat de gezondheidsapp heeft besloten dat je nu toch echt aan je conditie moet werken, dus dat je op je fiets naar het werk moet.

Medisch en gezondheid
Ook wijzelf zullen zoals gezegd een vruchtbaar werkterrein vormen voor sensoren en kleine robots. Ons lichaam wordt 24 uur per dag in de gaten gehouden door sensoren, zodat gevaarlijke ziekten en afwijkingen al in een vroeg stadium worden opgespoord. Toiletten analyseren onze uitscheidingen op stofwisselingsproblemen en ziektekiemen.

Zwermen zelfstandiger robots en drones
Het Internet der Dingen maakt  ook gedetailleerde besturing van robots en drones mogelijk. Waar deze nu navigeren op GPS, wordt dat straks een veel nauwkeuriger variant van GPS (tot op vijf centimeter nauwkeurig) en realtime communicatie met de controlerende server of een menselijke operator. In combinatie betekent dit dat robots, zelfstandig of met teleoperating, veel gevaarlijke klussen kunnen doen waar nu mensen voor nodig zijn, zoals dakdekken, zonnepanelen installeren of werken in hoogwerkers.

Nog meer toepassingen?
Zoals met internet zelf, zullen er nieuwe toepassingen worden bedacht die we nu nog niet kunnen overzien. Nieuwe toepassingen die misschien wel voor jou een leuk avontuur en een mooie toekomst zullen betekenen. Houd deze ontwikkelingen dus goed in de gaten.