Texe
K es
una tecnologia de clasificació estadística
d'informació textual desenvolupada per
EnSoft.
La tecnologia Texe
K
aplica avanzats sistemes d'anàlisi estadístic per
permetre construir de manera sencilla 'klasificadors' de continguts
textuals.
Texe
K
no fa servir coneixement linguistic de cap mena, i per tant no
és depenent d'idioma o domini.
Els klasificadors fets amb Texe
K
funcionen analitzant les características
estadístiques
rellevants dels textes que es proposen com a exemple de cada
clase
que es vol detectar. Per crear un klasificador, només cal
especificar les clases que es desitjen detectar, i proporcionar uns quants textes
de cada clase, el sistema els analitza, i extreu les propietats
estadísticament rellevants, un cop fet aixó
está
llest per a klasificar (calcular la clase més probable) dels
nous textes que es vulguin consultar.
El terme 'texte' fet servir al paràgraf anterior, fa referència a
cualsevol unitat textual que es vulgui, pot ser un document, una
pàgina web, un fitxer .pdf o en qualsevol del
formats
textuals soportats.
Texe
K es
també
una tecnologia disenyada per treballar en la web, els seus
klasificadors no sols poden indexar documents web, si no que
també poden ser consultats a traveś de la web.
S'ent un tecnologia no depenent de llenguatge, permet multiples usos,
per exemple:
- Detecció de correu no solicitat (spam).
- Detectors de temátiques o llenguatge.
- Clasificació de correo, notícies, etc.
La posibilitat de configuracions client-servidor, permet desenvolupar
solucions escalables amb distribució automática
de
càrrega per a sistemes amb alta demanda. A més a
més,
els klasificadors están disenyats per a poder
amagar la
informació textual que processen, permeten processos
completament
privats i segurs, inclús en entorns oberts com la web.
Texe
K está
desenvolupat sobre plataformes linux/unix, peró al ser una
tecnologia pensada per a la web, pot ser consultada desde cualsevol
sistema amb capacitats web.
Nota Legal:
La tecnologia TexeK es © (2005-2009) de Joan Vilaseca Corbera.