Regularni izrazi
Izvor: Wikipedija
Regularni izrazi (engl. regular expressions; skr. regex, regexp) su, prema strogoj definiciji (kako će reći npr. na zagrebačkom FER-u) podskup pravilnih izraza (PI).
Regularnim se izrazima opisuje, označava ili odabire određeni niz znakova unutar većeg teksta. Vrlo se često koriste u informatici i (naprednijem) radu s računalima; oni su programerska svakidašnjica, jer se pomoću njih pronalaze tekstovi (stringovi) kojima se potom manipulira (po načelu Search and Replace). No, upravo zato što se mogu koristiti za manipuliranje tekstovima, regularni su izrazi zanimljivi i za lingviste. Napokon, dobro pisanje regularnih izraza --- poput programiranja općenito --- jest umijeće za sebe.
Niz posebnih znakova koji se upotrebljavaju pri tvorbi regularnih izraza čini čitav jezik, s vlastitom sintaksom i pravilima, no sintaksa nekih programskih jezika (Perl, Tcl), pa i aplikacija (Emacs, čak i Microsoft Word) već uključuje regularne izraze kao poseban podskup.
[uredi] Osnove
Regularni izraz opisuje skup stringova, pri čemu nije potrebno navesti sve njihove elemente. Skup sastavljen od stringova "došao, dosao, došo, doso" može se opisati regularnim izrazom "do(ša*|sa*)o"; odnosno, pretraživanje po ovom regularnom izrazu pronaći će svaki od navedenih stringova.
[uredi] Vanjske poveznice
Regularni izrazi: teorija i praksa (Tomislav Šereg)