IJsfontein Homepage

23 april 2014

Elke maandagochtend verzamelen alle medewerkers van IJsfontein zich voor de ‘weekopening’. Huishoudelijke mededelingen worden tot een minimum beperkt, doel is inspiratie. Van eigen medewerkers, maar ook van externen.

Vorige week  was deze externe, Eva, een goudvis. Zij zwom rond in een kom op wielen en werd begeleid door Thomas de Wolf. Het filmpje ‘Fish on Wheels’ is op YouTube al meer dan een miljoen keer bekeken. Thomas houdt zich bezig met het ontwikkelen van beeldherkenning systemen en kwam uitleggen hoe deze ‘omgekeerde onderzeeër’ werkt en schreef het op voor ons blog.

_____________________________________________________________

 

Door: Thomas Wolf, mede eigenaar van Studio diip

 

De mogelijkheden van beeldherkenning

Langzamerhand krijgen we in ons dagelijks leven steeds meer te maken met beeldherkenning, vaak zonder dat we het echt door hebben. Door onze kentekens te herkennen worden slagbomen automatisch geopend en camera’s maken pas foto’s als we lachen. Maar er zijn nog veel meer mogelijkheden met de techniek als deze op een juiste manier in een concept verwerkt kan worden.

De discipline beeldherkenning houdt zich bezig met het analyseren van beelden met als doel om er bruikbare informatie uit te halen. Beeldherkenning bestaat al meer dan twintig jaar, maar er is in die tijd vooral gericht op industriële toepassingen zoals product inspectie of het plaatsen en sorteren van producten. Toch zijn er de laatste jaren steeds meer ontwikkelingen die de techniek in nieuwe interessante gebieden toepassen. Met Kinect heeft Microsoft de toegevoegde waarde laten zien op het gebied van games en interactie. Maar hoe werkt beeldherkenning nou eigenlijk, wat is er mogelijk mee en wat voegt het toe aan interactieve systemen?

 

Hoe werkt beeldherkenning?

Over het algemeen heeft software input nodig om een actie uit te voeren. Vaak zijn dat toetsaanslagen, database gegevens of sensor waardes. Voor beeldherkenning zijn dit pixels die via een camera of afbeelding worden ingeladen. Iedere pixel kan gezien worden als drie waarden verdeeld over het rode, groene en blauwe kanaal. Met specifieke algoritmes kunnen deze pixels geselecteerd, gegroepeerd en geanalyseerd worden. Zo is het mogelijk om van een kleuren afbeelding met een oranje vis alleen de pixels te selecteren die tussen een bepaalde kleur vallen en deze als groep te beschouwen. Door de eigenschappen van deze groep te vergelijken met wenselijke eigenschappen kan gekeken worden of dit inderdaad een groep pixels is die overeen komt met een vis, zoals te zien is op de afbeelding.

 
vissen1

 
In veel gevallen komen er echter een stuk complexere identificatie methodes voor bij beeldherkenning. Om de vele eigenschappen van de pixels effectief te kunnen vergelijken wordt vaak gebruik gemaakt van lerende algoritmes en Artificial Intelligence. Zo kan een systeem gemaakt worden dat na het “trainen” met veel voorbeelden in staat is om precies die eigenschappen van het te vinden object er uit pakt die het duidelijkst zijn. Een voorbeeld hier van is Optical Character Recognition (OCR) waar mee letters en cijfers herkend kunnen worden. Door een lerend systeem te trainen op de verschillen tussen de cijfers 0-9 kan direct een indicatie gegeven worden welk cijfer er te zien is voor bijvoorbeeld kenteken herkenning.

vissen2

Wat kan ik er mee?

Het detecteren en identificeren van allerlei objecten is interessant, maar het krijgt pas nut zodra het toegepast kan worden in een applicatie of systeem. Door met beeldherkenning de goudvis van de eerdere afbeelding te herkennen is hebben we bij Studio diip een aquarium gemaakt dat door de vis bestuurd kan worden, zoals te zien is in het filmpje hier onder.

Youtube film: www.youtube.com/watch?v=YbNmL6hSNKw. Maar er zijn veel verschillende voorbeelden te noemen die wat meer direct nut hebben. Zo kan met een foto van een smartphone een strategische analyse gemaakt worden van bordspellen voor spel advies of om een digitale interactie toe te voegen aan het spel. 

vissen3

En met een interactieve opstelling waar een camera en een beamer in zitten is het mogelijk om van boven af allerlei dingen te herkennen en een koppeling te maken tussen fysieke objecten en digitale content. Een voorbeeld hier van is een systeem om recepten aan te raden of om een laag informatie toe te voegen aan kaart spellen.

Wat voegt het toe?

Er zijn dus veel mogelijkheden met beeldherkenning naast het traditionele automatiseren waar het veel voor gebruikt wordt in de industrie. Het maken van de koppeling tussen allerlei fysieke objecten en digitale content creëert nieuwe mogelijkheden voor interactie. Ook herkenning van menselijke handelingen maakt het mogelijk om positief te belonen en is dus uitermate geschikt voor educatieve systemen. Zeker voor jongere kinderen waar het van belang is om motoriek en logica te ontwikkelen zijn beeldherkenning systemen of producten een interessante optie. Daarnaast is er ook nog de rijkheid aan interactiemogelijkheden die de fantasie van kinderen alle ruimte kan geven. Door middel van Augmented Reality toepassingen kunnen ook allerlei digitale karakters en verhalen gaan leven in de eigen omgeving. Het is dus de moeite waard om tijdens de conceptontwikkeling ook eens te bedenken of beeldherkenning een interessant onderdeel kan zijn.