TexeK

Klasificadors Textuals.



Detector de Llengua

En aquesta pàgina, es pot probar un Klasificador TexeK treballant com a detector de llengua.
El Klasificador ha estat construit declarant simplement quatre clases, una per a cada llengua que es vol detectar:
I fent servir com a exemples de cada una de les llengues 3 textes procedents del catàleg del Project Gutemberg , específicament:
El procés de creació del Klasificador ha estat fet en meyns de 5 minus. No s'ha fet servir cap criteri en especial al seleccionar aquests textes com a exemples de les llengues a detectar, excepte el fet de vigilar que no continguèsin alguna barreixa de llengües.

Per probar aquest Klasificador TexeK, només cal entrar una frase en cualsevol del quatre idiomes i preme el botó 'submit'. El Klasificador intentará detectar el llengua emprada en la vostra frase.



Detecció de Notícies en Anglès

En aquesta secció es disposa de un Klasificador TexeK disenyat per a treballar com a detector de tipus de notícies escrites en llengua anglesa.
Aquest Klasificador ha estat construit declarant cinc menes de notícies.
Per a cada una de les clases s'han fet servir uns 100 exemples de notícies  tretes de Google News entre els dies 6 i 15 de Juny del 2005.

La única consideració que s'ha tingut en compte al triar aquests exemples  ha estat de mirar d'evitar llocs web basats en subscripcions o bé que redirigeixin a altres llocs.

Per a probar el Klasificador TexeK, només cal entrar la url sencera de la pàgina web amb la notícia en anglès que es desitji clasificar i preme el botó 'submit'. El Klasificador es baixará la pàgina, e intentará detectar de quina mena de notícies es tracta.