• Etiquetas: procesamiento de lenguaje natural
Open source Python modules, linguistic data and document

The basic PHP N-gram Functions These short functions, combined with an extensive set of finger-prints, do all the work for a Statistical Language Detection. There's also a simple script at the bottom of this page

Vocabulario controlado que extrae los términos de los conceptos definidos en Wikipedia y establece las relaciones entre conceptos a partir del análisis de enlaces de la Wikipedia

Zemanta es un servicio web que permite hace un análisis de contenido de un post o artículo y sugiere palabras clave, recursos e imágenes relacionadas o artículos de la wikipedia

Herramienta que extrae palabras clave y las pondera en relación a un vocabulario controlado

Maui automatically identifies main topics in text documents. Depending on the task, topics are tags, keywords, keyphrases, vocabulary terms, descriptors, index terms or titles of Wikipedia articles

Vías de solución y configuración para la codificación de caracteres en varios ambientes y plataformas

extractor de palabras clave en base a tesauros desarrollado por PoolPary. Lo más interesante es el esquema funcional propuesto, con imágenes relacionadas, etiquetas, análisis de sitios en base a URL.

script en PHP que permite implementar un esquema de clasificación basado en bayesiano ingenuo naive

web services que permite extraer palabras claves o clasificadores de un texto

tutorial sobre analisis bayesiano en php

Artículo de P. Mika publicado en Journal of Web Semantics, Elsevier, v. 5, n. 1(2007) que propone un modelo y metodología para extrapolar ontologías conceptuales en base al análisis de folksonomías

Esta herramienta permite analizar la frecuencia de frases (N-gramas) en recursos bibliográficos según fechas e idiomas. Es útil para una infinidad de propósitos, además... se pueden descargar las fuentes de datos estructurados para realizar experimentos propios

Curso en línea y gratuito de la Universidad de Stanford sobre procesamiento de lenguaje natural

Herramienta que analiza texto y genera resúmenes en línea (en inglés)

Excelente ejemplo de explotación de las posibilidades del procesamiento de fuentes lingüísticas formales. Permite analizar y utilizar el Diccionario de la Real Academia según lemas, raíz morfológica, extensión del término y facilidades de ordenamiento según varios criterios de relevancia. Además permite descargar las fuentes terminológicas ya estructuradas. Muy bueno