Scanner (grafisch)
Een scanner (Nederlands: aftaster) is een apparaat waarmee een object in de echte wereld systematisch afgetast omgezet kan worden in data. Deze data kan opgeslagen worden op een computer, waarna de data geanalyseerd of bewerkt kan worden. In de kantooromgeving gaat het vaak om documenten in kleur of zwart/wit ter grootte van een A4'tje.
Inhoud |
[bewerk] Optische documentscanner
Eigenlijk moet juist bij dit soort optische apparatuur goed onderscheid gemaakt worden tussen de hardware en de software en hun wisselwerking. Voor de koppeling met de PC zijn momenteel verschillende soorten interfaces mogelijk:
- Parallelle printerpoort (bidirectioneel)
- USB (versie 1 of 2 maakt veel verschil in snelheid)
- SCSI, vooral bij de meer professionele machines
- Firewire (IEEE 1394)
- De Apple OS X machines en scanners werken ook veelal met USB 2.0, maar ze doen dit pas echt snel en goed vanaf Mac OS X versie 10.3 of 10.4
Soms kan ook nog apart met opvallend of doorvallend licht als bron voor dia's, overheadsheets enz. gewerkt worden, ook is er soms een aparte sheetfeeder (invoer van losse A4 vellen) extra verkrijgbaar, maar dan zit je al bijna in professionele toepassingen en minder voor huishoudelijk en/of hobby gebruik. Qua werking is nog verschil te maken in doorvoer-, glasplaat- (=flatbed) of drum types, waarbij voor huis-tuin-keuken gebruik ook in de prive sector de A4 flatbed scanner anno 2006 het meest in omloop is. Vroeger had men nog handscanners (vaak in grijs tinten), maar die zijn langzamerhand technisch gezien achterhaald. Nu zien we een combinatie van printer, fax, scanner en kopieermachine in een compact multifunctioneel apparaat (all-in-one) aan populariteit snel terrein winnen. Softwarematig wordt programmatuur meegeleverd (gebundeld), die een TWAIN protocol of een ISIS aansturing van de PC gebruikt. Onder Linux gaat de aansturing volgens het SANE protocol en voor wie het leuk vindt om de betekenis van deze kreten te weten; ze betekenen eigenlijk niets : Twain = Technology Without Any Important Name en SANE = Scanner Access Now Easy. Dit gaat van heel simpel tot zeer complex qua beeldbewerkingsmogelijkheden, waarbij de OCR (zie verderop) optie ook qua instellingen, mogelijkheden en uitvoer wisselend succes geeft. Denk niet dat alle automatische software de beste resultaten met een scanner geeft; met uitproberen en handmatig wijzigen van de vele instellingen krijg je na uitgebreide oefening vaak veel betere resultaten. Volhouden met experimenteren van instellingen op contrast, helderheid, kleur enz. is dan het devies: zie de tips & trucs verwijzing hieronder.
[bewerk] Afbeeldingen en teksten
Door middel van een scanner kunnen afbeeldingen en teksten gedigitaliseerd worden. Digitale afbeeldingen in kleur, grijstinten of zwart/wit kunnen bewerkt worden met daarvoor geschikte computerprogrammatuur en daarna worden afgedrukt met behulp van een printer of verzonden in e-mail, dan wel gebruikt in web pagina's.
Bij het digitaliseren van teksten volgt nog een volgende stap: het herkennen van de tekst door de computer. De gangbare Engelse term hiervoor is Optical Character Recognition, afgekort tot OCR of in begrijpelijk Nederlands Optische Teken Herkenning OTH, maar dat zal wel nooit een NL woord worden. Lettervormen worden door speciale patroonherkenning software opgezocht en vertaald naar de corresponderende digitale fonts, grootte en opmaak (vet schuin, onderstreept e.d.) presentatie. Op deze manier kan tekst, mits opgemaakt in een door de software goed leesbare letter goed herkend worden. Bekende software in deze is Caere met haar Omnipage, die een paar jaar geleden vele andere producenten als Wordscan en Recognita inlijfde. Omdat de begin letter veelal niet juist is, werken spellings controle programma's vaak minder goed (denk aan heeft, beeft, leeft, zeeft, weeft, geeft enz.) Ook de rn voor m, of de l, 1, I en o, O 0 (nul) leveren soms problemen, dus men moet de ge-ocr-de tekst toch zeker wel controleren. Ook zal een OCR actie van een fotokopie of doorslag vaak slechtere resultaten geven dan van het origineel, en het klinkt raar maar een stofdoek over de glasplaat halen doet soms ook wonderen qua herkenningspercentage. Ook Adobe Acrobat 6(Prof) heeft een OCR mogelijkheid, waarbij de werkwijze sterk verschilt van de traditionele aanpak: de layout is uitvoer bepalend en niet primair de woordherkenning. Het Adobe/Acrobat OCR gereedschap heet 'capturen', waarmee toch een sterke bestandscompressie haalbaar is.
Wanneer herkenning 100% betrouwbaar dient te zijn in verband met bijvoorbeeld volledig automatische verwerking van de gescande documenten dan wordt over het algemeen niet voor OCR of ICR (handschriftherkenning) gekozen maar voor Barcode herkenning.
[bewerk] Gerelateerde onderwerpen
- Computertomografie (CT-scannen)
- Digitale beeldbewerking
- OCR
[bewerk] Externe (Optische) Scanner links
- Hardware, weliswaar Engels, maar zeer uitgebreid
- Software: Scansoft = Paperport, Caere + Omnipage
- Datapen
- Scanning woordenlijst