Kirjoittaja Aihe: Hyvin toimiva COR ohjelma TW:lle (Optical character recognition)  (Luettu 838 kertaa)

0 jäsentä ja 1 Vieras katselee tätä aihetta.

Poissa RaijaR

  • Jäsen
  • Viestejä: 1500
  • Sukupuoli: Nainen
Joskus olisi tarvetta saada "luettua" kuvasta tekstiä ja pystyä tallentamaan se tiedostoon. Minulla sellainen ohjelma olikin, mutta en muista enää minkä niminen se oli.
Olisiko palstalaislla antaa vihjettä?
Pöytäkone ASUS ExpertCenter PN52, Tumbleweed, jossa nippu distroja QEMU/KVM:ssä.
Ja Väinö-minibulli :D
Huom! Kirjoitusvihreet tulee jostain aravuudesta...

Poissa png

  • Jäsen
  • Viestejä: 415
  • Sukupuoli: Mies
Kukaan ei voi tehdä kaikkea, mutta jokainen
voi tehdä jotakin; ja jos jokainen tekee jotakin,
tulee kaikki tehdyksi.

Poissa RaijaR

  • Jäsen
  • Viestejä: 1500
  • Sukupuoli: Nainen
Ei oikein ottanut tuulta purjeisiin.
Asensin molemmat zypperillä (tesseract ja tesseract-ocr) ja hyvin asentuivat, mutta siihen se sitten jäikin ts. en ymmärtänyt kuinka käynnistää ohjelman jne.

Olisikohan tarjolla yksinkertaisempaa ohjelmaa eläkeläiselle  :)
Pöytäkone ASUS ExpertCenter PN52, Tumbleweed, jossa nippu distroja QEMU/KVM:ssä.
Ja Väinö-minibulli :D
Huom! Kirjoitusvihreet tulee jostain aravuudesta...

Poissa SuperOscar

  • Käännösryhmä
  • *
  • Viestejä: 952
  • Sukupuoli: Mies
  • Tänään täällä, huomenna poissa
    • Legisign.org
Tesseractissa taitaa tosiaan olla vain komentorivikäyttöliittymä. Periaatteessa se on yksinkertainen:

Koodia: [Valitse]
tesseract --dpi 300 -l fin kuvatiedoston_nimi.png tulostiedoston_nimi
GUI taitaa löytyä ainakin GOCR:stä, paketin nimi openSUSEssa gocr-gui.

Noin yleisesti sanoisin silti, että Linuxin tekstintunnistusohjelmat ovat kaukana perässä siitä, mitä Wintendoon saa, sekä käyttöliittymiltään että ennen kaikkea tunnistuslaadultaan. Paras käyttämäni on ollut ABBYY FineReader, ja he tarjosivat kyllä pitkään Linuxiin komentoriviltä käytettävää OCR-moottoria sähköpostirekisteröitymisellä, mutta sekin tuntuu kadonneen ABBYYn muutettua koko bisnesideaansa.
pöytäkone 1, NUC, kannettava 1: openSUSE Leap 15.6; kannettavat 2–3: Debian GNU/Linux 12; pöytäkone 2: openSUSE Tumbleweed; RPi 1: FreeBSD 14-RELEASE; RPi 2: LibreELEC 11

Poissa png

  • Jäsen
  • Viestejä: 415
  • Sukupuoli: Mies
https://youtu.be/QhJiOCwz-_I?si=xJbqJ5VpCnNrU3G2
Yritän laittaa linkin You tubesta, tuossa ylhäällä siinä kerrotaan tarkemmin kuinka tesseract toimii.
Kukaan ei voi tehdä kaikkea, mutta jokainen
voi tehdä jotakin; ja jos jokainen tekee jotakin,
tulee kaikki tehdyksi.

Poissa RaijaR

  • Jäsen
  • Viestejä: 1500
  • Sukupuoli: Nainen
En minä mitään isoa hommaa tuolla aikoisi tehdä. Ihan vaan napata ehkä pari riviä skannaamastani paperista.
Eli siis:
1.mulla on paperikopio jostain tekstistä tms.
2.skannaan em. paperikopion kuvaksi
3.nappaisin kuvasta muutamat rivit tekstiä

Jos vielä alkaoisin tuota kokeilemaan niin mitä minun pitäisi asentaa?
Koodia: [Valitse]
i  | libtesseract5                                        | Open Source OCR Engine                                                      | package
i  | libtesseract5-x86-64-v3                              | Open Source OCR Engine                                                      | package
   | python311-pytesseract                                | Python wrapper for Google's Tesseract-OCR                                   | package
   | python311-tesserocr                                  | A Python wrapper around tesseract-ocr                                       | package
   | python312-pytesseract                                | Python wrapper for Google's Tesseract-OCR                                   | package
   | python312-tesserocr                                  | A Python wrapper around tesseract-ocr                                       | package
   | python313-pytesseract                                | Python wrapper for Google's Tesseract-OCR                                   | package
   | python313-tesserocr                                  | A Python wrapper around tesseract-ocr                                       | package
   | tesseract                                            | First-person shooter with cooperative in-game map editing                   | package
   | tesseract-data                                       | Data files for Tesseract                                                    | package
   | tesseract-ocr                                        | Open Source OCR Engine                                                      | package
mahdottomasti eri kieliä ja sitten
   | tesseract-server                                     | Tesseract standalone server                                                 | package
Pöytäkone ASUS ExpertCenter PN52, Tumbleweed, jossa nippu distroja QEMU/KVM:ssä.
Ja Väinö-minibulli :D
Huom! Kirjoitusvihreet tulee jostain aravuudesta...

Poissa peran

  • Käännösryhmä
  • *
  • Viestejä: 457
Jos vielä alkaoisin tuota kokeilemaan niin mitä minun pitäisi asentaa?
Koodia: [Valitse]
i  | libtesseract5                                        | Open Source OCR Engine                                                      | package
i  | libtesseract5-x86-64-v3                              | Open Source OCR Engine                                                      | package
   | tesseract-data                                       | Data files for Tesseract                                                    | package
   | tesseract-ocr                                        | Open Source OCR Engine                                                      | package
mahdottomasti eri kieliä ja sitten
   | tesseract-ocr-fin

Luultavasti nämä riittää ...

Tosin saattaa tarvita serveriä, mutta ennen sitä kuitenkin kokeilisin noilla.

Poissa RaijaR

  • Jäsen
  • Viestejä: 1500
  • Sukupuoli: Nainen
Pitäähän tuota kokeilla  :)

Löysin kyllä se entisenkin ohjelman. Se on TextSnatcher ja asensin Discoverilla. Piti kyllä vähän editoida tuota alla olevaa tekstia, koska ohjelma sekoili pisteiden kanssa eli jätti pisteen jälkeen välin ja aloitti isolla kirjaimella, mutta voin sietää tuon...

Tässä esimerkki eli TextSnatcherillä imaistu teksti liitteenä olevasta kuvasta
Koodia: [Valitse]
openSUSE.fi

Hei RaijaR
Näytä edellisen käyntisi jälkeen kirjoitetut viestit.
Näytä uudet vastaukset viesteihisi.
18.02.2025 - klo:17:18



Pöytäkone ASUS ExpertCenter PN52, Tumbleweed, jossa nippu distroja QEMU/KVM:ssä.
Ja Väinö-minibulli :D
Huom! Kirjoitusvihreet tulee jostain aravuudesta...