openSUSEa suomeksi

openSUSE => Multimedia ja grafiikka => Aiheen aloitti: RaijaR - 17.02.2025 - klo:17:36

Otsikko: Hyvin toimiva COR ohjelma TW:lle (Optical character recognition)
Kirjoitti: RaijaR - 17.02.2025 - klo:17:36
Joskus olisi tarvetta saada "luettua" kuvasta tekstiä ja pystyä tallentamaan se tiedostoon. Minulla sellainen ohjelma olikin, mutta en muista enää minkä niminen se oli.
Olisiko palstalaislla antaa vihjettä?
Otsikko: Vs: Hyvin toimiva COR ohjelma TW:lle (Optical character recognition)
Kirjoitti: png - 17.02.2025 - klo:17:46
https://github.com/tesseract-ocr/tesseract?tab=readme-ov-file (https://github.com/tesseract-ocr/tesseract?tab=readme-ov-file)
Olisiko tuollainen?
Otsikko: Vs: Hyvin toimiva COR ohjelma TW:lle (Optical character recognition)
Kirjoitti: RaijaR - 18.02.2025 - klo:12:45
Ei oikein ottanut tuulta purjeisiin.
Asensin molemmat zypperillä (tesseract ja tesseract-ocr) ja hyvin asentuivat, mutta siihen se sitten jäikin ts. en ymmärtänyt kuinka käynnistää ohjelman jne.

Olisikohan tarjolla yksinkertaisempaa ohjelmaa eläkeläiselle  :)
Otsikko: Vs: Hyvin toimiva COR ohjelma TW:lle (Optical character recognition)
Kirjoitti: SuperOscar - 18.02.2025 - klo:13:48
Tesseractissa taitaa tosiaan olla vain komentorivikäyttöliittymä. Periaatteessa se on yksinkertainen:

Koodia: [Valitse]
tesseract --dpi 300 -l fin kuvatiedoston_nimi.png tulostiedoston_nimi
GUI taitaa löytyä ainakin GOCR:stä, paketin nimi openSUSEssa gocr-gui.

Noin yleisesti sanoisin silti, että Linuxin tekstintunnistusohjelmat ovat kaukana perässä siitä, mitä Wintendoon saa, sekä käyttöliittymiltään että ennen kaikkea tunnistuslaadultaan. Paras käyttämäni on ollut ABBYY FineReader, ja he tarjosivat kyllä pitkään Linuxiin komentoriviltä käytettävää OCR-moottoria sähköpostirekisteröitymisellä, mutta sekin tuntuu kadonneen ABBYYn muutettua koko bisnesideaansa.
Otsikko: Vs: Hyvin toimiva COR ohjelma TW:lle (Optical character recognition)
Kirjoitti: png - 18.02.2025 - klo:16:39
https://youtu.be/QhJiOCwz-_I?si=xJbqJ5VpCnNrU3G2 (https://youtu.be/QhJiOCwz-_I?si=xJbqJ5VpCnNrU3G2)
Yritän laittaa linkin You tubesta, tuossa ylhäällä siinä kerrotaan tarkemmin kuinka tesseract toimii.
Otsikko: Vs: Hyvin toimiva COR ohjelma TW:lle (Optical character recognition)
Kirjoitti: RaijaR - 18.02.2025 - klo:17:18
En minä mitään isoa hommaa tuolla aikoisi tehdä. Ihan vaan napata ehkä pari riviä skannaamastani paperista.
Eli siis:
1.mulla on paperikopio jostain tekstistä tms.
2.skannaan em. paperikopion kuvaksi
3.nappaisin kuvasta muutamat rivit tekstiä

Jos vielä alkaoisin tuota kokeilemaan niin mitä minun pitäisi asentaa?
Koodia: [Valitse]
i  | libtesseract5                                        | Open Source OCR Engine                                                      | package
i  | libtesseract5-x86-64-v3                              | Open Source OCR Engine                                                      | package
   | python311-pytesseract                                | Python wrapper for Google's Tesseract-OCR                                   | package
   | python311-tesserocr                                  | A Python wrapper around tesseract-ocr                                       | package
   | python312-pytesseract                                | Python wrapper for Google's Tesseract-OCR                                   | package
   | python312-tesserocr                                  | A Python wrapper around tesseract-ocr                                       | package
   | python313-pytesseract                                | Python wrapper for Google's Tesseract-OCR                                   | package
   | python313-tesserocr                                  | A Python wrapper around tesseract-ocr                                       | package
   | tesseract                                            | First-person shooter with cooperative in-game map editing                   | package
   | tesseract-data                                       | Data files for Tesseract                                                    | package
   | tesseract-ocr                                        | Open Source OCR Engine                                                      | package
mahdottomasti eri kieliä ja sitten
   | tesseract-server                                     | Tesseract standalone server                                                 | package
Otsikko: Vs: Hyvin toimiva COR ohjelma TW:lle (Optical character recognition)
Kirjoitti: peran - 18.02.2025 - klo:17:42
Jos vielä alkaoisin tuota kokeilemaan niin mitä minun pitäisi asentaa?
Koodia: [Valitse]
i  | libtesseract5                                        | Open Source OCR Engine                                                      | package
i  | libtesseract5-x86-64-v3                              | Open Source OCR Engine                                                      | package
   | tesseract-data                                       | Data files for Tesseract                                                    | package
   | tesseract-ocr                                        | Open Source OCR Engine                                                      | package
mahdottomasti eri kieliä ja sitten
   | tesseract-ocr-fin

Luultavasti nämä riittää ...

Tosin saattaa tarvita serveriä, mutta ennen sitä kuitenkin kokeilisin noilla.
Otsikko: Vs: Hyvin toimiva COR ohjelma TW:lle (Optical character recognition)
Kirjoitti: RaijaR - 18.02.2025 - klo:18:05
Pitäähän tuota kokeilla  :)

Löysin kyllä se entisenkin ohjelman. Se on TextSnatcher ja asensin Discoverilla. Piti kyllä vähän editoida tuota alla olevaa tekstia, koska ohjelma sekoili pisteiden kanssa eli jätti pisteen jälkeen välin ja aloitti isolla kirjaimella, mutta voin sietää tuon...

Tässä esimerkki eli TextSnatcherillä imaistu teksti liitteenä olevasta kuvasta
Koodia: [Valitse]
openSUSE.fi

Hei RaijaR
Näytä edellisen käyntisi jälkeen kirjoitetut viestit.
Näytä uudet vastaukset viesteihisi.
18.02.2025 - klo:17:18