TexeK

Klasificadors Texuals.




TexeK es una tecnologia de clasificació estadística d'informació textual desenvolupada per EnSoft.

La tecnologia TexeK aplica avanzats sistemes d'anàlisi estadístic per permetre construir de manera sencilla 'klasificadors' de continguts textuals.

TexeK no fa servir coneixement linguistic de cap mena, i per tant no és depenent d'idioma o domini. 

Els klasificadors fets amb TexeK funcionen analitzant les características estadístiques rellevants dels textes que es proposen com a exemple de cada clase que es vol detectar. Per crear un klasificador, només cal especificar les clases que es desitjen detectar, i proporcionar uns quants textes de cada clase, el sistema els analitza, i extreu les propietats estadísticament rellevants, un cop fet aixó está llest per a klasificar (calcular la clase més probable) dels nous textes que es vulguin consultar.

El terme 'texte' fet servir al paràgraf anterior, fa referència a cualsevol unitat textual que es vulgui, pot ser un document, una pàgina web, un fitxer .pdf o en qualsevol del formats textuals soportats.

TexeK es també una tecnologia disenyada per treballar en la web, els seus klasificadors no sols poden indexar documents web, si no que també poden ser consultats a traveś de la web.

S'ent un tecnologia no depenent de llenguatge, permet multiples usos, per exemple:


La posibilitat de configuracions client-servidor, permet desenvolupar solucions escalables amb distribució automática de càrrega per a sistemes amb alta demanda. A més a més, els klasificadors están disenyats per a poder amagar la informació textual que processen, permeten processos completament privats i segurs, inclús en entorns oberts com la web.

TexeK está desenvolupat sobre plataformes linux/unix, peró al ser una tecnologia pensada per a la web, pot ser consultada desde cualsevol sistema amb capacitats web.


Nota Legal:
La tecnologia TexeK es © (2005-2009) de Joan Vilaseca Corbera.