W lipcu bieżącego roku Twitter zorganizował pierwszy konkurs bug bounty związany z własnym systemem kadrowania multimediów. Kod odpowiadający za algorytm przycinający zdjęcia został upubliczniony, by społeczność mogła sprawdzić i przeanalizować jego działanie. Twitter rozpatrzył w ten sposób uwagi użytkowników i użytkowniczek, którzy wychwycili stronniczość przy kadrowaniu zdjęć. Serwisowi zgłaszano, że algorytm błędnie przycina np. twarze osób czarnoskórych, podczas gdy problem nie występuje w przypadku białych osób.

Do wygrania w konkursie było pięć nagród pieniężnych: 3 miejsca na podium, wyróżnienie za innowacyjność oraz za najbardziej uogólnione wyniki. Pierwsze miejsce zdobył Bogdan Kulynych, doktorant z Politechniki Federalnej w szwajcarskiej Lozannie. Całe badanie, zastosowaną metodologię oraz wyniki możecie przejrzeć na GitHubie Kulynycha.

Twitter uczy się na błędach

Podczas konkursu bug bounty skupionego na tym, aby rozgryźć algorytm przycinający fotografie, okazało się, że system lepiej radzi sobie – niejako „preferuje” – zdjęcia kobiet niż mężczyzn o 8%. Kadrowanie było też lepsze jeśli porównamy zdjęcia białych i czarnoskórych osób – w tym wypadku algorytm działał lepiej o 4% na korzyść tych pierwszych. Białe kobiety były też lepiej „przycinane” od czarnych o 7%. Z kolei biali mężczyźni byli korzystniej kadrowani od czarnoskórych o 2%. Wnioski Twittera zaprezentowano na oficjalnym blogu serwisu.

twitter image bias

Po co Twitterowi algorytm przycinający zdjęcia ? Odpowiada on za takie kadrowanie grafik,  aby w naszym feedzie pokazały się najważniejsze dla nas elementy zdjęcia. Twitter jeszcze do niedawna preferował konkretne proporcje multimediów. Jeśli wrzucaliśmy do serwisu fotkę o innych rozmiarach, to właśnie algorytm decydował o tym, jak wykadrować zdjęcie dla innych użytkowników.

Maszyna skupia się na konkretnych cechach, które uważa za istotne na podstawie dostępnych danych. To algorytm sam decyduje, która część zdjęcia priorytetowo pojawi się w naszej apce. Jeśli dana twarz nie spełnia kryteriów w wystarczającym dla maszyny stopniu, będzie ją pokazywać mniej precyzyjnie.

Udostępnienie kodu algorytmu Twittera to naprawdę duża sprawa. Firmy bigtechowe nie ujawniają swoich algorytmów, bo im się to zwyczajnie nie opłaca. Mamy nadzieję, że Twitter faktycznie rozprawi się ze swoim algorytmem i tym samym przetrze szlak dla swojej konkurencji.