Ebooks, Audobooks and Classical Music from Liber Liber
a b c d e f g h i j k l m n o p q r s t u v w x y z





Web - Amazon

We provide Linux to the World


We support WINRAR [What is this] - [Download .exe file(s) for Windows]

CLASSICISTRANIERI HOME PAGE - YOUTUBE CHANNEL
SITEMAP
Audiobooks by Valerio Di Stefano: Single Download - Complete Download [TAR] [WIM] [ZIP] [RAR] - Alphabetical Download  [TAR] [WIM] [ZIP] [RAR] - Download Instructions

Make a donation: IBAN: IT36M0708677020000000008016 - BIC/SWIFT:  ICRAITRRU60 - VALERIO DI STEFANO or
Privacy Policy Cookie Policy Terms and Conditions
Dokumentklassifisering - Wikipedia

Dokumentklassifisering

Frå Wikipedia – det frie oppslagsverket

Automatisk dokumentklassifisering er, innafor språkteknologien, ei algoritme for å få ei datamaskin til å klassifisere dokument i ulike klasser. Bruksområde for slike program er bibliotek, ulike arkiv, telegrambyrå, søkemotorar, store firma, og andre som handsamar store mengdar tekst. Dokumenta kan vere t.d. bøker, artiklar, www-sider, e-post eller interne dokument.

Eit svært aktuelt bruksområde for dokumentklassifisering er å klassifisere e-post i to klassar, søppelpost og anna post.

[endre] Bakgrunn

I utgangspunktet har dokument blitt klassifisert av menneske som forstår det dei les, og som er sakkunnige innafor dei sjangrane dokumenta er henta frå. Denne manuelle framgangsmåten er ressurskrevande og sein, og til ein viss grad også subjektiv. Ulike arkivarar kan klassifisere ulikt, og ein og same person kan klassifisere same dokument ulikt frå ein gong til neste.

Viss klassifiseringsmetodane blir operasjonalisert, t.d. til å fungere etter eit definert sett av reglar, blir nokre av problema med den manuelle metoden retta på, men det er framleis ein ressurskrevjande metode.

Samanlikna med manuell klassifisering er maskinell klassifisering rask, og det er framforalt mogleg å gje det same systemet same dokument ein gong til, og få det klassifisert på same måte. Så lenge dei maskinelle systema blir halde konstant er dei altså forutseibare.

[endre] Framgangsmåtar

Den første fasen i dokumentklassifiseringa er å velje klassifiseringstrekk. Sentrale er orda i teksten, og frekvensen deira. Viss eit sett av ord har markant høgare frekvens i teksten enn dei har i normalspråket, og viss dette settet høyrer til same predefinerte fagområde, er dette eit argument for å klassifisere dokumentet innafor dette fagområdet. Eit anna viktig moment kan vere eventuelle metadata.

Trekka blir så gjeve til ei klassifiseringsalgoritme, t.d.

  • naiv Bayes-klassifikator
  • vektorautomatar
  • maskinlæringsalgoritmar
Puslespillbit Denne artikkelen er ei spire. Du kan hjelpe Nynorsk Wikipedia å vekse seg stor og sterk gjennom å utvide han.
Sjå òg: Oversyn over spirer.
Our "Network":

Project Gutenberg
https://gutenberg.classicistranieri.com

Encyclopaedia Britannica 1911
https://encyclopaediabritannica.classicistranieri.com

Librivox Audiobooks
https://librivox.classicistranieri.com

Linux Distributions
https://old.classicistranieri.com

Magnatune (MP3 Music)
https://magnatune.classicistranieri.com

Static Wikipedia (June 2008)
https://wikipedia.classicistranieri.com

Static Wikipedia (March 2008)
https://wikipedia2007.classicistranieri.com/mar2008/

Static Wikipedia (2007)
https://wikipedia2007.classicistranieri.com

Static Wikipedia (2006)
https://wikipedia2006.classicistranieri.com

Liber Liber
https://liberliber.classicistranieri.com

ZIM Files for Kiwix
https://zim.classicistranieri.com


Other Websites:

Bach - Goldberg Variations
https://www.goldbergvariations.org

Lazarillo de Tormes
https://www.lazarillodetormes.org

Madame Bovary
https://www.madamebovary.org

Il Fu Mattia Pascal
https://www.mattiapascal.it

The Voice in the Desert
https://www.thevoiceinthedesert.org

Confessione d'un amore fascista
https://www.amorefascista.it

Malinverno
https://www.malinverno.org

Debito formativo
https://www.debitoformativo.it

Adina Spire
https://www.adinaspire.com