Privacy Policy Cookie Policy Terms and Conditions TMILG - Wikipedia

TMILG

Na Galipedia, a wikipedia en galego.

Atención: Este artigo precisa un traballo de revisión.
Por favor vexa a lista de Artigos con problemas e mellóreo de acordo coas indicacións que aparecen nesa páxina. Cando os problemas se resolvan retire esta mensaxe e borre a páxina da lista de artigos con problemas, pero por favor non quite esta mensaxe ata que estea todo solucionado.

O Tesouro Medieval Informatizado da Lingua Galega é un recurso informático levado a cabo polo ILG (a cargo de Xavier Varela) en convenio coa DXPL que permite a busca de léxico na documentación medieval. Non ten parangón na historia da lingua de ningunha das linguas románicas. As obras que ofrece é moi variada, e vai dende a lírica profana ou relixiosa (Cantigas de Santa María, Milagres de Santiago), ou tratados técnicos (Tratado de Albeitaría, Flores de Dereito, Foro Xuzgo?, Arte de Trovar) até documentos en prosa narrativa (Crónica Troiana, Historia Troiana, Tradución da Crónica Xeral e de Castela, Xeral Historia, Livro de Tristán, Partidas?) e notarial (Libro de Notas de Álvaro Pérez). Para acceder a el é preciso rexistrarse.


Índice

[editar] Equipo, historia e patrocinio

O equipo, dirixido por Xavier Varela, está formado por investigadores, bolseiros e colaboradores da Universidade de Santiago de Compostela e da Universidade de Vigo. Desde 1993, e en coordinación co equipo do TILG, vén enriquecendo permanentemente as súas bases textuais. Nestes anos modificáronse en varias ocasións os procedementos de etiquetaxe e de lematización para refinalos. Ao cabo da terceira revisión dos textos decidiuse poñer o TMILG en rede con acceso libre. O proxecto puido realizarse polo esforzo institucional do ILG e polo patrocinio da Dirección Xeral de Política Lingüística da Consellería de Educación, que para a posta en rede facilitou a colaboración técnica da sección de informática do CORGA e do CODOLGA.

[editar] Características e datos

En outubro de 2005 a base do TMILG contén a totalidade das obras non notariais publicadas da Galicia medieval (literarias, históricas, relixiosas, xurídicas e técnicas). Das obras notariais xa está incluída unha boa parte das publicadas (aproximadamente o 85%) e están moi avanzados os traballos para a carga das restantes, prevista para mediados de 2006. En número os documentos colectados son máis de 12.500. O arco cronolóxico vai do século XIII a principios do XVI (con rexistros romances desde o VIII). Os textos non foron modificados, agás na unión de palabras cortadas ao final da liña, polo que o usuario non queda eximido de bater cos erros inevitables na lectura e edición de textos medievais. Respectáronse as grafías da edición impresa empregada como base (os diferentes tipos de "s", o signo tironiano ou o til de nasalidade sobre vogais e consoantes). O etiquetado dos textos axeitouse a cada tipoloxía textual. Na versión para a internet excluíronse algunhas etiquetas para facela máis homoxénea e manexable. Quedaron as seguintes: nome estandarizado, indicacións para a localización dos exemplos (volume, capítulo e páxina), referencias cronolóxicas (ano ou rango de anos, século e, no caso dos documentos notariais, tamén o mes), autoría, localización xeográfica, tipoloxía textual (ata tres niveis xerárquicos), carácter orixinal ou non do texto e lingua orixinal se se trata dunha tradución.

[editar] Estatísticas

  • En número de palabras o TMILG pasa na actualidade dos nove millóns, que dan arredor de 170.000 formas gráficas distintas.
  • As dez máis frecuentes son, por esta orde, d(e), e(t), a, que, o, en, por, el, os e se; constitúen o 29,62% de todo o corpus.
  • Os primeiros substantivos comúns son carta, parte, rrey, lugar e terra.
  • Os primeiros antropónimos son Fernando e Afonso.
  • Os primeiros topónimos galegos son Lugo, Orzellon, Oseira e Tuy.
  • Os foráneos son Castella, Troya, Toledo, Cordoua e Leõ.
  • As formas gráficas de ocorrencia única rondan as 95.000.
  • Polo número de sílabas as máis frecuentes son as bisílabas, seguidas de cerca polas trisílabas, monosílabas, tetrasílabas e pentasílabas.

[editar] Consultas e utilidade

O corpus é de acceso libre, previo rexistro como usuario. O sistema de consulta permite buscar unha ou varias palabras, facer buscas booleanas e utilizar comodíns. Pódense refinar as buscas facendo restricións cronolóxicas, por xénero, por subxénero ou por obra.

Este corpus foi fabricado para a elaboración dunha gramática histórica. Ten utilidade en todas as ramas lingüísticas e literarias da filoloxía, así como en moitas outras disciplinas, entre as que destacan a historia, a paleografía, a xeografía, o dereito e a política, a antropoloxía, as ciencias da saúde, a náutica, a botánica, a zooloxía, etc.

[editar] Ligazóns externas


Corpus dixitais
Galego textual: CODOLGA - TMILG - TILG - CORGA - CLUVI - CTG - TUVI
Galego oral: ASG
Portugués: CPM - CPM - DPM - AC/DC
Castelán textual: CREA - CORDE - Cumbre - Lexesp
Castelán oral: COREC - MNLCCMH - SoCREA - Val.Es.Co - C-ORAL-ROM - PRESEEA - Corpus del Español Histórico y Moderno

Static Wikipedia (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -

Static Wikipedia 2007 (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -

Static Wikipedia 2006 (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu

Static Wikipedia February 2008 (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu