Facebook już jakiś czas temu informował o tym, że pracuje nad specjalnym algorytmem, który będzie analizował zdjęcia i dobierał do nich odpowiednie tagi. Wszystko to będzie odczytywane przez asystenta głosowego i będzie służyło osobom niewidomym, zapoznać się zawartością zdjęcia.

Od Kwietnia 2016 tagi są już dostępne w atrybucie alt, a od kilku dni można pobrać prostą wtyczkę dla przeglądarek Chrome i Firefox – Show Facebook Computer Vision Tags, autorstwa Adama Geitgey’a. Wtyczka wyciąga słowa kluczowe z tagu html’owego — alt i wyświetla je w specjalnym boxie w prawym górnym roku.

Zrzut ekranu 2017 01 24 o 09.54.31

Jak widać na powyższym zdjęciu, Facebook naprawdę może wyciągnąć sporo informacji ze zdjęcia. Algorytm jest inteligenty i nie miał problemów z odróżnieniem nieba od oceanu, mimo podobnej kolorystyki. W innych przykładach dostępnych na githubie autora widać, że Facebook jest w stanie rozpoznać nasze aktualne czynności, czy też to, co chcemy sprzedać.

Właśnie — sprzedać. Narzędzie powstało w celu ułatwienia korzystania z Facebooka przez osoby niewidome, ale mam dziwne wrażenie że zostanie wykorzystane jeszcze w inny sposób. Mamy hashtagi, ale one często są niespójne, ktoś użyje polskiego znaku, „podłogi” lub innego specyficznego znaku i już mamy nowy keywords. W przypadku opcji rozpoznawania zawartości zdjęcia pomijam, że jest to automat i nie musimy się martwić manualnym wprowadzaniem opisu zdjęcia, ale chce zwrócić uwagę na jednolitość opisu zdjęć.

aa1fd34a ceac 11e6 98b0 b0b7a6a5d9fb

Przykład z githuba autora wtyczki daję nam jasny przekaz, że może zostać wykorzystana w przyszłości do kategoryzowania ofert. Tak jak wygląda to powyżej. Sprzedam aparat, Facebook automatycznie taguje produkt jako „camera” i wrzuci pod kontener z ofertami kamer.

Podsumowując świetnie, że Facebook chce pomóc niewidomym, super pomysł i naprawdę go szanuje. Czy funkcja rozwinie się w inną stronę, niż pierwotnie planowano? Nie wiem, ale są ku temu możliwości, żeby tak się stało. Geotagging, marka aparatu czy też data wykonania fotografii już nie robią wrażenia w porównaniu z możliwością pobrania opisu bezpośrednio ze zdjęcia.

Wersja na Chrome

Wersja na Firefox

GitHub Autora