• Etiquetas: procesamiento de lenguaje natural
Wink es una librería javascript que permite analizar y procesar texto. Permite entrenar modelos, realizar análisis estadísticos sobre textos en inglés

El Auto-Clasificador de Mole guru es una plataforma que provee autómatas de clasificación en línea para facilitar el etiquetado de textos especializados. Utiliza vocabularios controlados para normalizar la asignación de descriptores, herramientas de procesamiento de lenguaje natural analizar los contenidos y aprendizaje automático para moderar la asignación de descriptores.

Analizador de frecuencia de palabras (ngram) utilizando como corpus Google books

Sobek es una herramienta de minería de texto para usos educativos. Se ha utilizado en diversas tareas, como ayudar a los docentes en el proceso de evaluación de actividades de producción textual, o en actividades de lectura y escritura. Tiene soporte para portugués e inglés

TAPoR (Text Analysis Portal for Research) reúne herramientas y metodologías para el análisis, descripción y tratamientos de corpus textuales. Permite explorar las herramientas disponibles según el modelo de definición de las humanidades digitales establecido por TaDiRAH.

Herramienta que permite extraer y acceder a los subtítulos generados automáticamente por Youtube para sus videos

arText redactor asistido para el español que ayuda a escribir textos de ámbitos especializados y textos en lenguaje claro. Desarrollado y mantenido por la UNED (España), la herramienta analiza pequeños textos según criterios de estructura textual, frecuencia léxica, parámetros morfológicos y sintácticos, detecta y marca potenciales problemas y realiza sugerencias. Es una herramienta gratuita y no requiere registro

Herramienta desarrollada por la Universidad Iberoamericana de la Ciudad de México que analiza corpus textuales y detecta usos del lenguaje no inclusivos en términos de género

BabelNet es un diccionario enciclopédico multilingüe cuya alcance lexicográfico está basado en entidades y conceptos provistos por diferentes fuentes de datos en línea. Es un proyecto orientado a construir y ofrecer una infraestructura de servicios lexicográficos similar a la de WordNet pero con un alcance multilingüe. Compila y vincula más de 50 fuentes. Dispone de una API y la posibilidad de descargar datos fuente

Sitio dedicado a la investigación en tecnologías digitales aplicadas a los estudios lingüísticos. Reúne las investigaciones, aplicaciones y servicios desarrollados por Irene Renau y Rogelio Nazar , investigadores de la Pontificia Universidad Católica de Valparaíso

Tutorial elaborado inicialmente para el SWIB19 y actualizado para la DCMI Virtual 2020. Incluye instrucciones paso a paso y ejercicios

Herramienta web para el análisis y tratamiento de corpus basados en texto digitalizado (XML, txt y HTML). Dispone de diversas herramientas de análisis estadístico de corpues textuales

Compilación de herramientas para análisis de corpus lingüísticos mantenida por Kristin Berberich y Ingo Kleiber

Annif es una herramienta que combina herramientas de procesamiento de lenguaje natural y vocabularios controlados para la clasificación e indización automática de textos. Permite utilizar diversos algoritmos o esquemas alternativos para la clasificación de textos. Desde algoritmos especializados en la extracción de entidades (por ejemplo reconocimiento de nombre propios o instituciones), análisis de frecuencias (para extracción de palabras clave) o clasificación con vocabularios controlados. Dispone además de una herramientas de OCR para celulares que permite tomar fotos de textos para luego indizarlos en 2 sencillos pasos. La herramienta esta desarrollada mayormente en Python y es mantenida por la biblioteca nacional de Finlandia

Módulo Python para procesamiento del lenguaje natural. Pemite identificar catergorías léxicas y funcionales, determinar estructuras de frase y flexionar palabras. Soporta inglés, francés, italina y español

AntConc es una herramienta freeware desarrollada por Laurence Anthony en JAVA que permite analizar corpus textuales. Permite extraer frecuencia de palabras, palabras clave, palabras en contexto, lemas (ngram) entre otras facilidades

Sitio mantenido por un grupo de estudiantes y egresados de la carrera de Letras que nos hemos especializado en el área de la Lingüística Computacional que reúne recursos, tutoriales y cursos sobre procesamiento del lenguaje natural

Base de datos que reúne las descripciones y accesos a los artículos y ponencias de diferentes eventos científicos dedicador al procesamiento de lenguaje natural y linguística computacional.

ORES (Objective Revision Evaluation Service) es un servicio web de machine learning basado y provisto por Wikipedia. Es utilizado por Wikipedia para detectar y prevenir acciones de vandalismo web en Wikipedia. Dispone de una API RESTful abierta

El analizador de textos de JSTOR permite utilizar un documento o texto para buscar otros documentos similares o relacionados. El servicio soporta diferentes formatos de archivo (imágenes, documentos de texto, texto plano, csv, etc) y esta disponibles para 14 idiomas.