• Etiquetas: procesamiento de lenguaje natural
Tutorial elaborado inicialmente para el SWIB19 y actualizado para la DCMI Virtual 2020. Incluye instrucciones paso a paso y ejercicios

Sitio dedicado a la investigación en tecnologías digitales aplicadas a los estudios lingüísticos. Reúne las investigaciones, aplicaciones y servicios desarrollados por Irene Renau y Rogelio Nazar , investigadores de la Pontificia Universidad Católica de Valparaíso

BabelNet es un diccionario enciclopédico multilingüe cuya alcance lexicográfico está basado en entidades y conceptos provistos por diferentes fuentes de datos en línea. Es un proyecto orientado a construir y ofrecer una infraestructura de servicios lexicográficos similar a la de WordNet pero con un alcance multilingüe. Compila y vincula más de 50 fuentes. Dispone de una API y la posibilidad de descargar datos fuente

Herramienta desarrollada por la Universidad Iberoamericana de la Ciudad de México que analiza corpus textuales y detecta usos del lenguaje no inclusivos en términos de género

arText redactor asistido para el español que ayuda a escribir textos de ámbitos especializados y textos en lenguaje claro. Desarrollado y mantenido por la UNED (España), la herramienta analiza pequeños textos según criterios de estructura textual, frecuencia léxica, parámetros morfológicos y sintácticos, detecta y marca potenciales problemas y realiza sugerencias. Es una herramienta gratuita y no requiere registro

Herramienta que permite extraer y acceder a los subtítulos generados automáticamente por Youtube para sus videos

TAPoR (Text Analysis Portal for Research) reúne herramientas y metodologías para el análisis, descripción y tratamientos de corpus textuales. Permite explorar las herramientas disponibles según el modelo de definición de las humanidades digitales establecido por TaDiRAH.

Sobek es una herramienta de minería de texto para usos educativos. Se ha utilizado en diversas tareas, como ayudar a los docentes en el proceso de evaluación de actividades de producción textual, o en actividades de lectura y escritura. Tiene soporte para portugués e inglés

Analizador de frecuencia de palabras (ngram) utilizando como corpus Google books

El Auto-Clasificador de Mole guru es una plataforma que provee autómatas de clasificación en línea para facilitar el etiquetado de textos especializados. Utiliza vocabularios controlados para normalizar la asignación de descriptores, herramientas de procesamiento de lenguaje natural analizar los contenidos y aprendizaje automático para moderar la asignación de descriptores.

Wink es una librería javascript que permite analizar y procesar texto. Permite entrenar modelos, realizar análisis estadísticos sobre textos en inglés

Papers with Code es un sitio gratuito y abierto que reúne con documentos, código, set de datos, métodos y de evaluación relativos al campos del Machine Learning (aprendizaje automático) y el procesamiento de lenguaje natural (NLP). Incluye una sección que sintetiza el "estado del arte" (state-of-art) en cada campo de investigación

Conferencia Magistral a cargo de Diego Ferreyra realizada el 20 de octubre de 2023 en el marco de la XXXIV Asamblea General de la Asociación de Estados Iberoamericanos para el Desarrollo de las Bibliotecas Nacionales de Iberoamérica (ABINIA)

Plataforma que reúne diversas herramientas para publicar, buscar y analizar literatura científica. Permite explroar según pautas de citación, detección de términos y conceptos, detección de plagio y otras utilidades

ConceptNet es una base multilingüe que representa palabras y frases que la gente usa y las relaciones de sentido que se establecen entre ellas. Los datos se recopilan de una variedad de recursos y fuentes colectivas y abiertas (Wiktionary y Open Mind Common Sense), juegos orientados a fines (Verbosity y nadya.jp) y recursos creados por expertos ( WordNet y JMDic).

Corrector ortográfico, gramatical y de estilo multilingüe que te ayuda, además, a parafrasear textos.