Vakok és Gyengénlátók Közép-Magyarországi Regionális Egyesülete

Aira – a vizuális tolmács

2017. január 12.

Kiválasztani egy fürt banánt vagy bedobni a szemetet a legközelebbi kukába, a legtöbb embernek teljesen hétköznapi, egyszerű cselekedet. Amint tudjuk, ezzel nem mindenki van így. Candice Jordan, az Aira nevű projekt egyik látássérült tesztelője, aki bemutatta a rendszer működését, ezeket hozta fel példának arra, hogy milyen apróságok azok, amelyeket a projekt megadott neki.

Jordan az egyike annak a 200 vak és aliglátó embernek, akik tesztelték a vizuális tolmácsot biztosító rendszert. Így írja le a megtapasztalt előnyöket:

Amikor bemegyek a plázába, ahelyett, hogy meg kellene keresnem a biztonsági őrt vagy az információs pultot, csak megérintem a telefonom és megkérdezem: ‘Szia, milyen üzletek vannak a közelemben?’

Az Aira egy alkalmazás, ami vagy mobiltelefonnal vagy egy okosított szemüvegen át működik. A látássérült felhasználó vagy a telefonján nyitja meg vagy a szemüvegen nyom meg egy gombot. Ezáltal egy vizuális tolmács jelentkezik be, akinek a monitorján megjelenik a szemüveg vagy a telefon kamerája által közvetített kép, valamint néhány speciális adat a környékről és az észlelt emberekről. A vizuális tolmács ezáltal tájékoztatja a felhasználót a kamera előtt megjelenő dolgokról és válaszol minden kérdésre.

A kép forrása: http://aria.io

A kép forrása: http://aria.io

A cég által közreadott bemutatóban egy építési munka miatt lezárt járdaszakasznál kapcsolódik a rendszerhez a látássérült felhasználó. A tolmács elmondja miként kerülhető ki a lezárás. A tolmács közli merre van a zebra, merre van a lámpa nyomógombja, le lehet-e ülni a villamosmegállóban, melyik villamos érkezik a megállóba, hol üljön le a villamoson és szól amikor le kell szállnia. Mivel a találkozóra érkező látássérült engedélyezte a facebook-ismerőseinek az azonosítását az Aria számára, az arcfelismerő alrendszer segítségével még arra vonatkozóan is útbaigazítást kap, hogy az éttermen belül merre foglalt helyet az ismerőse. A vizuális tolmács közben kapcsolódni tud az étterem honlapjához és az étlap kézbevétele nélkül tájékoztatja a látássérültet a választékról és az árakról. Mindez csak egy nagyon szűkre szabott példa arra, hogy mi mindent képes biztosítani ez a fejlesztés!

A kép forrása: http://aria.io

A kép forrása: http://aria.io

A felhasználók az alkalmazás használatát egy személyes megbeszéléssel kezdik, ahol a vizuális tolmácsok megismerik az egyéni igényeit és szokásait, hogy a tolmácsolás hatékony lehessen. Olyanokra kell gondolni, hogyan szereti a látássérült az irány közlését,  illetve részletes információkra vágyik vagy inkább tömör és gyors tájékoztatásra van szüksége.

Jordan elmondta, hogy az Aria számára szabadságot adott, hogy teljesen egyedül is megtehessen dolgokat ismeretlen helyeken is. Bárhol el tud igazodni, azonosítani tudja a hangok forrását, megtudja éppen merre tart az útja során. Különösen nagy örömet okozott neki, hogy a korábbi utazásai során mindig a hátizsákjában gyűjtötte össze a szemetet, de a vizuális tolmács segítségével most már bármikor ki tudja dobni az utcai hulladékgyűjtőkbe. Másik ilyen örömforrás volt számára az, hogy képes volt úgy átmenni New Yorkban a Penn Station pályaudvaron az Aria-nak köszönhetően, hogy egyszer sem akadt el. Nagy örömére, a tolmács segítségével most már a saját kezével válogathatja ki a gyümölcsöket és a zöldségeket.

A fejlesztő cég 2000 konzultációt végzett el eddig a rendszert tesztelő látássérültekkel és a végső céljuk egy olyan mesterséges intelligencia kialakítása, mely a legmesszebbmenőkig képes a vizuális tolmács nélkül is hangos tájékoztatást adni a kamera által érzékelt kép alapján. Ezt nem lehet minden helyzetre megvalósítani, de például a felhasználók által gyakran megjárt útvonalakkal ezt meg lehet tenni vagy a tipikus veszélyhelyzetek kezelését is lehet automatizálni, mint amilyet egy közeledő autó rejt magában.

A rendszer működtetése sok pénzbe kerül. A költségeknek részét képezik a látássérültnek átadott eszközök és azok üzemeltetése, karbantartása. Komoly programozói és fejlesztői csoport dolgozik a háttérben, illetve a vizuális tolmácsok is tisztes bérezést kapnak, hogy lelkesen álljanak a felhasználók rendelkezésére.

Ezeket a költségeket nem a látássérültek fizetik ki, hanem jelenleg magánbefektetők tőkéjéből működik, de már tárgyalnak arról, hogy az egészségbiztosítás fedezze a költségeket. Terveik között szerepel a felhasználói kör kiterjesztése az autistákra és személyes igény esetén az időseknek is elérhető lenne.

Forrás: http://www.cnbc.com/

Aki szeretné, az lejjebb megnézheti az egyik angol nyelvű bemutatót: