Texe
K es
una tecnología de clasificación estadística
de información textual desarrollada por
EnSoft.
La tecnología Texe
K
aplica avanzados sistemas de análisis estadístico para
poder construir de forma sencilla 'klasificadores' de contenidos
textuales.
Texe
Kno usa
información de origen linguístico, y es por tanto una
tecnología independiente de lenguaje y dominio.
Los klasificadores de Texe
K funcionan
analizando las características
estadísticas
relevantes de los textos que se proponen como ejemplos de las
clases que se desean detectar. Para crear un klasificador, basta con
especificar que clases se desean detectar, y proporcionar unos
cuantos textos de cada clase, el sistema los analiza, y extrae las
propiedades
estadísticamente relevantes. Una vez este proceso termina, el
klasificador
está
listo para 'klasificar' (calcular la clase más probable) de los
nuevos textos que se desee consultar.
El término 'texto' del párrafo anterior hace referencia a qualquier unidad textual, puede ser un documento, una
página web, un fichero .pdf o en qualquiera de los numerosos formatos textuales soportados.
Texe
K es
también
una tecnología diseñada para trabajar en la web, sus
klasificadores no sólo pueden indexar documentos web, si no que
también pueden ser consultados a traveś de la web.
Siendo una tecnología no dependiente de lenguaje, permite múltiples usos,
por ejmplo:
- Detección de correo no solicitado (spam).
- Detectores de temáticas o lenguaje.
- Clasificadores de correo, notícias, etc.
La posibilidad de configuraciones tipo cliente-servidor, permite desarrollar
soluciones escalables con distribución automática
de
carga para sistemas de alta demanda. Además,
los klasificadores de Texe
K están diseñados para poder
ocultar la
información textual que procesan, permitiendo procesos
completamente
privados y seguros, incluso en entornos abiertos como la web.
Texe
K está
desarrollado sobre plataformas linux/unix, pero al ser una
tecnología pensada para la web, puede ser consultada desde cualquier
sistema con capacidades web.
Nota Legal:
La tecnología TexeK
es © (2005-2009) de Joan Vilaseca Corbera.