10.02.2025 18:00

Llama OCR — darmowe rozpoznawanie tekstu z wykorzystaniem AI od Meta

Miałem ostatnio problem, potrzebowałem zeskanować, a potem rozpoznać tekst z pewnej książki, który potem we fragmentach skopiowałbym do notatek. Pomocą okazała się darmowa strona WWW z rozpoznawaniem tekstu OCR, która wykorzystuje do tego AI od Mety.

e paragon sms mail

Co więcej, wszystko to naprawdę działa, jest bezpłatne i nie trzeba nigdzie się rejestrować. To jedna z tych stron, które warto dodać do ulubionych!

Llama OCR od togeher.AI

Llama OCR od togeher.AI

Strona to projekt together.ai, który działa jako biblioteka npm z wykorzystaniem Llama 3.2 Vision. To ostatnie pewnie dobrze znacie, jeśli nie to warto jedynie wiedzieć, że to model językowy AI rozwijany przez Meta, a więc właściciela Facebooka.

Dzięki together.ai udostępniono bibliotekę na GitHubie oraz stworzono wykorzystująca go stronę WWW. Dzięki temu nie trzeba instalować aplikacji, całość jest na razie bezpłatna i nie trzeba się nigdzie rejestrować. Wydaje się też, że usługa działa na bazie limitu fair-play – będziecie mogli korzystać z aplikacji WWW, o ile nie będziecie tego robić na przemysłową skalę.

Llama OCR od togeher.AI
Zobacz, że linie produktów są przesunięte o jedną w dół względem ceny.

Działanie jest tu bajecznie proste. Wgrywacie zdjęcie lub skan tekstu i czekacie na automatyczne rozpoznanie. Może to być zarówno tekst drukowany, pisany ręcznie, jego kombinacje oraz formatowany w tabelach, wykresach oraz innych formach. Po kilku sekundach otrzymujecie w polu obok rozpoznany tekst.

Llama OCR od togeher.AI
Tabelka z danymi została poprawnie zinterpretowana.

Ważne jest tu jednak, że oprócz rozpoznawanego tekstu, rozpoznawane są również formatowania, rodzaj tekstu oraz jego kontekst. Gdy zeskanujecie tabelę, możecie otrzymać pięknie sformatowaną tabelkę z danymi. Skanując paragon (jak mój z Burger Kinga na lotnisku), otrzymacie również informacje o kontekście skanowanego tekstu. W moim przypadku dobrze rozpoznał on paragon oraz to, co na nim było. Jak jednak łatwo zauważyć, w tym przypadku cena względem towaru przesunęła się o jedną linijkę. Warto więc sprawdzić poprawność danych, chociaż tu niewątpliwie zawiniła jakość i czerwony ślad z drukarki.

Był Doom uruchomiony na szczoteczce i kosiarce. Teraz ktoś go odpalił na przejściówce do HDMI

Był Doom uruchomiony na szczoteczce i kosiarce. Teraz ktoś go odpalił na przejściówce do HDMI

To chyba już nikogo nie dziwi. W zasadzie doczekaliśmy się momentu, gdy uruchamianie Dooma na najdziwniejszych sprzętach przybrało formę zawodów — kto znajdzie prostsze lub dziwniejsze urządzenia. Okazuje się, że…

Korzystałem już z Llama OCR kilkanaście razy i nie mam większych zastrzeżeń. Strona powędrowała do mojego katalogu ulubionych narzędzi WWW.

Stronę znajdziecie pod tym linkiem.