Što ima

gImageReader – Ekstrahirajte tekst iz slika i PDF-ova u Linuxu

Anonim

gImageReader je besplatni PDF čitač otvorenog koda s mogućnošću izvlačenja teksta iz slika i PDF-ova. Izgrađen je kao jednostavno Gtk/Qt sučelje za Tesseract-OCR, OCR mehanizam otvorenog koda za prepoznavanje teksta i uzoraka u dokumentima i slikama pomoćuUmjetna inteligencija

Sam po sebi, Tesseract je alat naredbenog retka koji je ograničen na upotrebu od strane korisnika Linuxa koji su dovoljno upoznati sa svojim terminalima. Zahvaljujući gImageReader, sada svatko može iskoristiti OCR učinkovitost motora.

gImageReader radi skeniranjem teksta iz PDF-a ili slikovne datoteke na bilo kojem od nekoliko jezika koje podržava zahvaljujući postojanju Unicode znakova . Sadrži jednostavno, dobro organizirano prilagodljivo korisničko sučelje putem kojeg možete izvršavati zadatke provjere pravopisa i prijevoda.

Značajke u gImageReader-u

gImageReader jednostavan je za korištenje i podržava rad s dokumentima u obliku meke kopije kao i snimkama učitanih medija, npr. snimke zaslona. Čak imate mogućnost odabrati područje teksta koje vas zanima i dodati samo onaj tekst koji vam je potreban. U konačnici, gImagereader funkcionira i kao PDF čitač i kao alat za izdvajanje teksta. Glupa stvar.

Instalirajte gImageReader na Linux

Da biste maksimalno iskoristili gImageReader, morate ručno instalirati Tesseract jezičnih paketa kako biste mogli ispravno analizirati slike i datoteke.Paket se zove 'Tesseract-ocr-eng' i dostupan je od upravitelja softvera u Debiani Fedora distribucije.

Ako koristite Ubuntu, možete jednostavno dodati PPAi pokrenite instalacijsku naredbu koristeći donje naredbe:

$ sudo add-apt-repository ppa:sandromani/gimagereader
$ sudo apt ažuriranje
$ sudo apt instalirajte gimagereader

Na Debian, Fedora, i OpenSUSE instalirajte ga iz upravitelja paketa.

$ sudo apt install gimagereader
$ sudo dnf instalirajte gimagereader
$ sudo zypper instalirajte gimagereader

Nemojte se osjećati izostavljeno ako koristite Arch Linux ili bilo koju od njegovih izvedenica. AUR vas pokriva. A ako biste radije ponovno izgradili aplikaciju iz izvora, upute su na Wiki vezi GitHub repozitorija.

Jeste li vi onaj koji izdvaja tiskani tekst iz slika? Možete čak i napraviti snimke odabranih područja telefonom i prenijeti ih na prijenosno računalo. Ono što je još bolje je njegova višejezična podrška – koja iako nije savršena, već je trenutno jedna od najboljih opcija u zajednici.

gImageReader je među najboljim PDF čitačima u svijetu otvorenog izvornog koda, posebno sa svojom OCR mogućnošću, pa ga isprobajte i pogledajte kako ti se sviđa.

Kao i obično, slobodno s nama podijelite svoja iskustva s aplikacijom ako ih imate. I za dodavanje drugih prijedloga u odjeljku za komentare ispod.