Kaikki aiheet

+
Home > Resurssin > PDF > tuntemus Optical Character Recognition (OCR)

Tuntemus Optical Character Recognition (OCR)

Mikä on OCR?

Optical Character Recognition, OCR, yleensä lyhennetty on skannattuja kuvia käsin, kirjoituskoneella tai painetun tekstin mekaanista tai elektronista käännöksen kone-tekstitiedosto.

Miksi käyttää OCR?

OCR käytetään laajalti muuntaa erilaisia asiakirjoja, kuten skannatut paperiasiakirjat, PDF-tiedostoja tai kuvia otettu digitaalikameralla otetaan muokattavaksi ja hakea tietoja. Ammatillinen ympäristöissä (kuten kirjastot, toimistot) tuhansia kirjoja ja asiakirjoja skannataan säännöllisesti varmuuskopioida ja arkisto. Skanneri vie vain valokuvia alkuperäisasiakirjat jolloin kuvapohjaisia skannatut dokumentit PDF-muodossa. Käsittelyä ja varastointia niin suuria määriä skannatut asiakirjat suuri ongelma on kyvyttömyys etsiä tarkkaa ilmausta tai sisällä tiedoston nimi. Myös tekstiä ei voi olla korostettuna, kopioida tai muokata, koska asiakirja on yksi iso kuva-tiedosto eikä tekstimerkit.

OCR Sample

Ennen tekstintunnistuksen koko alueen sivulla ensiluokkainen ja kohokohta ja tekstiä voi etsiä ja muokata.

Kun tekstintunnistuksen teksti sivulla valittu valinta työkalu, voit etsiä ja muokata merkki, sana ja kappaleet helposti.

Miten Wondershare PDF OCR työkaluja auttaa sinua?

Wondershare PDF OCR työkalut voit tunnistaa tekstiä skannattu PDF, nopeasti ja tarkasti ja säilyttää useita muokata muotoja tunnustettu tulokset.

Wondershare PDF Editor Pro for Mac: erinomainen Tekstintunnistuksen tarkkuutta ja muoto säilyttäminen, avulla voit etsiä, korjata ja kopioida tekstiä skannattu tai kuvapohjaisia PDF suoraan Mac. Sen avulla voit viedä skannattu PDF muotoiltu teksti perustuu Word, Excel, PowerPoint, EPUB, HTML, ja tekstimuodot.

Wondershare PDF Converter Pro: tunnistaa tekstiä skannattu PDF erinomainen Tekstintunnistuksen tarkkuutta ja muuntaa useita PDF-tiedostoja tekstimuodossa Word, Excel, PowerPoint, EPUB, HTML ja teksti tiedostot Windows.


Wondershare PDF Converter Pro for Mac: tunnistaa tekstiä skannattu PDF erinomainen Tekstintunnistuksen tarkkuutta ja muuntaa useita PDF-tiedostoja tekstimuodossa Word, Excel, PowerPoint, EPUB, HTML ja teksti asiakirjat Mac.

Miten OCR tunnustamisen laadun parantamiseksi?

OCR tunnustaminen laatu riippuu pitkälti laatu kuvan, joka on suuresti riippuvainen aikana kartoittava jalostaa asiakirjojen asetuksia. Jotta saat OCR tunnustamista laadukkaampi skannattuja asiakirjoja, tässä on muutamia vinkkejä asiakirjan skannaus:

Fontti on liian pieni
Optimaalisen tunnustamista tuloksia skannata asiakirjoja tulostaa erittäin pienet fontit suurilla tarkkuuksilla.
Voit määrittää haluamasi tarkkuuden ScanSourceSettings -objektin Resolution -ominaisuus.


Alkuperäisen kuvan Suositeltu ratkaisu
Reader 300 dpi tekstien (painettu fonttien kokoa 10 pt tai suurempi)
Reader 400-600 dpi: n tekstit painettu pienet fontit (9pt tai pienempi)

Tuning kirkkaus
Joudut ehkä kirkkauden säätäminen mustavalkotilaan skannattaessa. Voit valita haluamasi kirkkaus ScanSourceSettings -objektin kirkkautta -ominaisuuden. Noin 50 prosenttia keskipitkän arvo pitäisi riittää useimmissa tapauksissa.
Jos kuvien sisältää liikaa "revitty" tai "jumissa" yhdessä kirjaimia, vianmääritys seuraavan taulukon mukaisesti.

Kuvasi näyttää tältä Suositukset
Good Quality Tämä kuva sopii tunnustamista
Very Light
merkit ovat "revitty" tai erittäin kevyt
  • Pienempi kirkkaus tekee kuvasta tummempi.
  • Skannaa harmaasävyisinä. Kirkkaus on viritetty automaattisesti.
  • Very Dark
    merkit ovat hyvin vääristynyt kiinni toisiinsa tai täytetään
  • Lisää kirkkautta kirkkaampana
  • Skannaa harmaasävyisinä. Kirkkaus on viritetty automaattisesti.
  • Tulostuslaatu
    Huono laatu asiakirjoja "kohina" (satunnainen mustia pisteitä tai pilkkuja), näön ja epätasainen kirjaimia tai vinossa linjat ja siirtyvät taulukon reunojen voi vaatia erityisiä skannausasetuksia. Esimerkiksi tämä Faksi ja sanomalehti:

    Print Quality

    Huono laatu asiakirjoja skannataan parhaiten harmaasävyisinä. Kun skannaat harmaasävykuvia, ohjelma valitsee optimaalisen kirkkauden arvo automaattisesti.
    Harmaasävyissä säilyttää lisätietoja kirjaimet Skannatun tekstin tunnustamista tulosten aikaansaamiseksi, kun tunnustetaan asiakirjat keskipitkän ja huono laatu.


    Aiheeseen liittyviä artikkeleita

    Liittyviä kysymyksiä? Puhua suoraan asiakaspalveluumme >>

    Alkuun