Pix2pix - świetna biblioteka zmieniająca rysunek w obrazek | DailyWeb.pl - codziennie o sieci

Pix2pix - świetna biblioteka zmieniająca rysunek w obrazek

Opublikowano 5 miesięcy temu - 1


Rynek IT rozwija się, powstaje bardzo dużo projektów pokroju rozpoznawania mowy czy rysunków, uczenia maszynowego. Przoduje w tym, a przynajmniej tak się wydaje Google, choć korporacje pokroju IBM czy Microsoft depczą mu po piętach, są też oczywiście inne mniejsze projekty. Ogólnie przyszłość się dzieje! Więc po kolei.

Jakiś czas temu, znajomy podesłał mi link, niewinny link do strony tworzonej przez niejakiego Christophera Hesse’a traktującej o nowym projekcie. Co to za projekt?

Trochę magii

Projekt prosty, może nie jest to uczenie maszynowe, ale możliwości są ogromne. Cel jest jeden -Zamienić rysunek na obrazek. Ciekawe, prawda? Nie? To może kilka przykładów co możemy otrzymać z takich rysunków. Można stworzyć tytułowego – kotka, pokolorowanego, z oczami, nosem czy uszami tylko konwertując rysunek utworzony za pomocą kursora.

Rysując hipotetyczny but, również można wygenerować przypominający oryginał komputerowy odpowiednik. Tu akurat rysowałem sam (a nie pobierałem grafiki ze strony projektu) stąd taki trochę koślawy rysunek. Trzeba przyznać, że mimo prostoty narysowanego przeze mnie buta, wygląda wyjściowo i całkiem naturalnie.

Plecaki, aktówki, torby i torebki. To wszystko, można wygenerować z odpowiedniego skryptu.

Oraz coś dla architektów – tworzenie budynków. Jak to wszystko możliwe i jak to działa?

Dosyć prosto, skrypt bazuje na zbiorze obrazów danego typu np. kotów, psów, plecaków, butów czy budynków, które są dopasowywane za pomocą kształtów i konturów do obrazów z bazy. Zastosowań tego skryptu jest bardzo dużo, począwszy od tytułowych kotków przez dodawanie kolorów do zdjęć, a kończąc na tworzeniu map wyglądających jak zdjęcia satelitarne czy wypełnianiu wyciętych miejsc ze zdjęć.

Trochę koszmaru

Skąd ten tytułowy koszmar? A ze społeczności internautów, która rozpoczęła zabawę w rysowanie, niekoniecznie odpowiadającym bazie źródłowej rysunków. Efekty są bardzo.. ciekawe, a o to niektóre z nich:

Kot z trzecim okiem.

Mysz.

Czy Cthulhu w wersji kociej.

Jak widać, można stworzyć przeróżne, nawet najdziwniejsze obrazy i mam wrażenie, że nie natknął bym się na ten projekt, gdyby nie rozgłos w postaci tych przeróżnych rysunków powrzucanych do sieci. Projekt stwarza wiele możliwości, zastosowań jest bardzo dużo. Czasem największym problemem w małych projektach jest właśnie wąska grupa osób, która dowie się o jego istnieniu. Może to jest recepta rodem z Hollywood na wybicie się ze swoim pomysłem w stale rozwijającym się świecie? Dać światu coś o czym będzie się mówić?

Demo Pobierz