TexeK

Klasificadores Textuales.




TexeK es una tecnología de clasificación estadística de información textual desarrollada por EnSoft.

La tecnología TexeK aplica avanzados sistemas de análisis estadístico para poder construir de forma sencilla 'klasificadores' de contenidos textuales.

TexeKno usa información de origen linguístico, y es por tanto una tecnología independiente de lenguaje y dominio.

Los klasificadores de TexeK funcionan analizando las características estadísticas relevantes de los textos que se proponen como ejemplos de las clases que se desean detectar. Para crear un klasificador, basta con especificar que clases se desean detectar, y proporcionar unos cuantos textos de cada clase, el sistema los analiza, y extrae las propiedades estadísticamente relevantes. Una vez este proceso termina, el klasificador está listo para 'klasificar' (calcular la clase más probable) de los nuevos textos que se desee consultar.

El término 'texto' del párrafo anterior hace referencia a qualquier unidad textual, puede ser un documento, una página web, un fichero .pdf o en qualquiera de los numerosos formatos textuales soportados.

TexeK es también una tecnología diseñada para trabajar en la web, sus klasificadores no sólo pueden indexar documentos web, si no que también pueden ser consultados a traveś de la web.

Siendo una tecnología no dependiente de lenguaje, permite múltiples usos, por ejmplo:


La posibilidad de configuraciones tipo cliente-servidor, permite desarrollar soluciones escalables con distribución automática de carga para sistemas de alta demanda. Además, los klasificadores de TexeK están diseñados para poder ocultar la información textual que procesan, permitiendo procesos completamente privados y seguros, incluso en entornos abiertos como la web.

TexeK está desarrollado sobre plataformas linux/unix, pero al ser una tecnología pensada para la web, puede ser consultada desde cualquier sistema con capacidades web.


Nota Legal:
La tecnología TexeK es © (2005-2009) de Joan Vilaseca Corbera.