• Etiquetas: procesamiento de lenguaje natural
Artículo de P. Mika publicado en Journal of Web Semantics, Elsevier, v. 5, n. 1(2007) que propone un modelo y metodología para extrapolar ontologías conceptuales en base al análisis de folksonomías

BabelNet es un diccionario enciclopédico multilingüe cuya alcance lexicográfico está basado en entidades y conceptos provistos por diferentes fuentes de datos en línea. Es un proyecto orientado a construir y ofrecer una infraestructura de servicios lexicográficos similar a la de WordNet pero con un alcance multilingüe. Compila y vincula más de 50 fuentes. Dispone de una API y la posibilidad de descargar datos fuente

arText redactor asistido para el español que ayuda a escribir textos de ámbitos especializados y textos en lenguaje claro. Desarrollado y mantenido por la UNED (España), la herramienta analiza pequeños textos según criterios de estructura textual, frecuencia léxica, parámetros morfológicos y sintácticos, detecta y marca potenciales problemas y realiza sugerencias. Es una herramienta gratuita y no requiere registro

Herramienta desarrollada por la Universidad Iberoamericana de la Ciudad de México que analiza corpus textuales y detecta usos del lenguaje no inclusivos en términos de género

Vocabulario controlado que extrae los términos de los conceptos definidos en Wikipedia y establece las relaciones entre conceptos a partir del análisis de enlaces de la Wikipedia

Maui automatically identifies main topics in text documents. Depending on the task, topics are tags, keywords, keyphrases, vocabulary terms, descriptors, index terms or titles of Wikipedia articles

Zemanta es un servicio web que permite hace un análisis de contenido de un post o artículo y sugiere palabras clave, recursos e imágenes relacionadas o artículos de la wikipedia

The basic PHP N-gram Functions These short functions, combined with an extensive set of finger-prints, do all the work for a Statistical Language Detection. There's also a simple script at the bottom of this page

Open source Python modules, linguistic data and document

El Auto-Clasificador de Mole guru es una plataforma que provee autómatas de clasificación en línea para facilitar el etiquetado de textos especializados. Utiliza vocabularios controlados para normalizar la asignación de descriptores, herramientas de procesamiento de lenguaje natural analizar los contenidos y aprendizaje automático para moderar la asignación de descriptores.

Wink es una librería javascript que permite analizar y procesar texto. Permite entrenar modelos, realizar análisis estadísticos sobre textos en inglés

Sitio dedicado a la investigación en tecnologías digitales aplicadas a los estudios lingüísticos. Reúne las investigaciones, aplicaciones y servicios desarrollados por Irene Renau y Rogelio Nazar , investigadores de la Pontificia Universidad Católica de Valparaíso

Plataforma que reúne diversas herramientas para publicar, buscar y analizar literatura científica. Permite explroar según pautas de citación, detección de términos y conceptos, detección de plagio y otras utilidades

Analizador de frecuencia de palabras (ngram) utilizando como corpus Google books

Sobek es una herramienta de minería de texto para usos educativos. Se ha utilizado en diversas tareas, como ayudar a los docentes en el proceso de evaluación de actividades de producción textual, o en actividades de lectura y escritura. Tiene soporte para portugués e inglés

TAPoR (Text Analysis Portal for Research) reúne herramientas y metodologías para el análisis, descripción y tratamientos de corpus textuales. Permite explorar las herramientas disponibles según el modelo de definición de las humanidades digitales establecido por TaDiRAH.

Herramienta que permite extraer y acceder a los subtítulos generados automáticamente por Youtube para sus videos

Tutorial elaborado inicialmente para el SWIB19 y actualizado para la DCMI Virtual 2020. Incluye instrucciones paso a paso y ejercicios

Herramienta web para el análisis y tratamiento de corpus basados en texto digitalizado (XML, txt y HTML). Dispone de diversas herramientas de análisis estadístico de corpues textuales