Tulosta sivu - Hyvin toimiva COR ohjelma TW:lle (Optical character recognition)

Joskus olisi tarvetta saada "luettua" kuvasta tekstiä ja pystyä tallentamaan se tiedostoon. Minulla sellainen ohjelma olikin, mutta en muista enää minkä niminen se oli.
Olisiko palstalaislla antaa vihjettä?

https://github.com/tesseract-ocr/tesseract?tab=readme-ov-file (https://github.com/tesseract-ocr/tesseract?tab=readme-ov-file)
Olisiko tuollainen?

Ei oikein ottanut tuulta purjeisiin.
Asensin molemmat zypperillä (tesseract ja tesseract-ocr) ja hyvin asentuivat, mutta siihen se sitten jäikin ts. en ymmärtänyt kuinka käynnistää ohjelman jne.

Olisikohan tarjolla yksinkertaisempaa ohjelmaa eläkeläiselle :)

Tesseractissa taitaa tosiaan olla vain komentorivikäyttöliittymä. Periaatteessa se on yksinkertainen:

Koodia: [Valitse]

tesseract --dpi 300 -l fin kuvatiedoston_nimi.png tulostiedoston_nimi
GUI taitaa löytyä ainakin GOCR:stä, paketin nimi openSUSEssa gocr-gui.

Noin yleisesti sanoisin silti, että Linuxin tekstintunnistusohjelmat ovat kaukana perässä siitä, mitä Wintendoon saa, sekä käyttöliittymiltään että ennen kaikkea tunnistuslaadultaan. Paras käyttämäni on ollut ABBYY FineReader, ja he tarjosivat kyllä pitkään Linuxiin komentoriviltä käytettävää OCR-moottoria sähköpostirekisteröitymisellä, mutta sekin tuntuu kadonneen ABBYYn muutettua koko bisnesideaansa.

https://youtu.be/QhJiOCwz-_I?si=xJbqJ5VpCnNrU3G2 (https://youtu.be/QhJiOCwz-_I?si=xJbqJ5VpCnNrU3G2)
Yritän laittaa linkin You tubesta, tuossa ylhäällä siinä kerrotaan tarkemmin kuinka tesseract toimii.

En minä mitään isoa hommaa tuolla aikoisi tehdä. Ihan vaan napata ehkä pari riviä skannaamastani paperista.
Eli siis:
1.mulla on paperikopio jostain tekstistä tms.
2.skannaan em. paperikopion kuvaksi
3.nappaisin kuvasta muutamat rivit tekstiä

Jos vielä alkaoisin tuota kokeilemaan niin mitä minun pitäisi asentaa?

Koodia: [Valitse]

i  | libtesseract5                                        | Open Source OCR Engine                                                      | package
i  | libtesseract5-x86-64-v3                              | Open Source OCR Engine                                                      | package
   | python311-pytesseract                                | Python wrapper for Google's Tesseract-OCR                                   | package
   | python311-tesserocr                                  | A Python wrapper around tesseract-ocr                                       | package
   | python312-pytesseract                                | Python wrapper for Google's Tesseract-OCR                                   | package
   | python312-tesserocr                                  | A Python wrapper around tesseract-ocr                                       | package
   | python313-pytesseract                                | Python wrapper for Google's Tesseract-OCR                                   | package
   | python313-tesserocr                                  | A Python wrapper around tesseract-ocr                                       | package
   | tesseract                                            | First-person shooter with cooperative in-game map editing                   | package
   | tesseract-data                                       | Data files for Tesseract                                                    | package
   | tesseract-ocr                                        | Open Source OCR Engine                                                      | package
mahdottomasti eri kieliä ja sitten 
   | tesseract-server                                     | Tesseract standalone server                                                 | package

Lainaus käyttäjältä: RaijaR - 18.02.2025 - klo:17:18

Jos vielä alkaoisin tuota kokeilemaan niin mitä minun pitäisi asentaa?
Koodia: [Valitse]
i | libtesseract5 | Open Source OCR Engine | package i | libtesseract5-x86-64-v3 | Open Source OCR Engine | package | tesseract-data | Data files for Tesseract | package | tesseract-ocr | Open Source OCR Engine | package mahdottomasti eri kieliä ja sitten | tesseract-ocr-fin

Luultavasti nämä riittää ...

Tosin saattaa tarvita serveriä, mutta ennen sitä kuitenkin kokeilisin noilla.

Pitäähän tuota kokeilla :)

Löysin kyllä se entisenkin ohjelman. Se on TextSnatcher ja asensin Discoverilla. Piti kyllä vähän editoida tuota alla olevaa tekstia, koska ohjelma sekoili pisteiden kanssa eli jätti pisteen jälkeen välin ja aloitti isolla kirjaimella, mutta voin sietää tuon...

Tässä esimerkki eli TextSnatcherillä imaistu teksti liitteenä olevasta kuvasta

Koodia: [Valitse]

openSUSE.fi

Hei RaijaR
Näytä edellisen käyntisi jälkeen kirjoitetut viestit.
Näytä uudet vastaukset viesteihisi.
18.02.2025 - klo:17:18

openSUSEa suomeksi

openSUSE => Multimedia ja grafiikka => Aiheen aloitti: RaijaR - 17.02.2025 - klo:17:36