• Etiquetas: procesamiento de lenguaje natural
Herramienta que permite analizar texto no estructurado. Ofrece informes de frecuencia, contexto, relación entre términos y más.

Herramienta Google derivada del Google Trends que permite identificar expresiones de búsqueda que tienen una distribución de frecuencia de búsqueda cercana o similar a una expresión de búsqueda determinada

Herramienta que permite establecer un indicador de felicidad en base al análisis de publicaciones en tweeter. Permite analizar la felicidad en períodos específicos, según eventos y otros parámetros.

App que permite la toma de registro de entrevistas psiquiátricas/psicológicas y luego el análisis aplicando de diferentes algoritmos. Desarrollada por Facundo Carrillo

Directorio de tutoriales sobre el uso medios informáticos para el procesamiento, análisis, codificación y digitalización de fuentes documentales (textuales, sonido, imágen, etc) en el campo de las humanidades

Librería que permite utlizar algoritmos compatibles con el machine learning en PHP

El analizador de textos de JSTOR permite utilizar un documento o texto para buscar otros documentos similares o relacionados. El servicio soporta diferentes formatos de archivo (imágenes, documentos de texto, texto plano, csv, etc) y esta disponibles para 14 idiomas.

ORES (Objective Revision Evaluation Service) es un servicio web de machine learning basado y provisto por Wikipedia. Es utilizado por Wikipedia para detectar y prevenir acciones de vandalismo web en Wikipedia. Dispone de una API RESTful abierta

Base de datos que reúne las descripciones y accesos a los artículos y ponencias de diferentes eventos científicos dedicador al procesamiento de lenguaje natural y linguística computacional.

Sitio mantenido por un grupo de estudiantes y egresados de la carrera de Letras que nos hemos especializado en el área de la Lingüística Computacional que reúne recursos, tutoriales y cursos sobre procesamiento del lenguaje natural

AntConc es una herramienta freeware desarrollada por Laurence Anthony en JAVA que permite analizar corpus textuales. Permite extraer frecuencia de palabras, palabras clave, palabras en contexto, lemas (ngram) entre otras facilidades

Módulo Python para procesamiento del lenguaje natural. Pemite identificar catergorías léxicas y funcionales, determinar estructuras de frase y flexionar palabras. Soporta inglés, francés, italina y español

Annif es una herramienta que combina herramientas de procesamiento de lenguaje natural y vocabularios controlados para la clasificación e indización automática de textos. Permite utilizar diversos algoritmos o esquemas alternativos para la clasificación de textos. Desde algoritmos especializados en la extracción de entidades (por ejemplo reconocimiento de nombre propios o instituciones), análisis de frecuencias (para extracción de palabras clave) o clasificación con vocabularios controlados. Dispone además de una herramientas de OCR para celulares que permite tomar fotos de textos para luego indizarlos en 2 sencillos pasos. La herramienta esta desarrollada mayormente en Python y es mantenida por la biblioteca nacional de Finlandia

Compilación de herramientas para análisis de corpus lingüísticos mantenida por Kristin Berberich y Ingo Kleiber

Herramienta web para el análisis y tratamiento de corpus basados en texto digitalizado (XML, txt y HTML). Dispone de diversas herramientas de análisis estadístico de corpues textuales

Tutorial elaborado inicialmente para el SWIB19 y actualizado para la DCMI Virtual 2020. Incluye instrucciones paso a paso y ejercicios

Herramienta que permite extraer y acceder a los subtítulos generados automáticamente por Youtube para sus videos

TAPoR (Text Analysis Portal for Research) reúne herramientas y metodologías para el análisis, descripción y tratamientos de corpus textuales. Permite explorar las herramientas disponibles según el modelo de definición de las humanidades digitales establecido por TaDiRAH.

Sobek es una herramienta de minería de texto para usos educativos. Se ha utilizado en diversas tareas, como ayudar a los docentes en el proceso de evaluación de actividades de producción textual, o en actividades de lectura y escritura. Tiene soporte para portugués e inglés

Analizador de frecuencia de palabras (ngram) utilizando como corpus Google books