Navegar por los elementos (52 items total)
Sort by:
Papers with Code es un sitio gratuito y abierto que reúne con documentos, código, set de datos, métodos y de evaluación relativos al campos del Machine Learning (aprendizaje automático) y el procesamiento de lenguaje natural (NLP). Incluye una sección que sintetiza el "estado del arte" (state-of-art) en cada campo de investigación
Wink es una librería javascript que permite analizar y procesar texto. Permite entrenar modelos, realizar análisis estadísticos sobre textos en inglés
El Auto-Clasificador de Mole guru es una plataforma que provee autómatas de clasificación en línea para facilitar el etiquetado de textos especializados. Utiliza vocabularios controlados para normalizar la asignación de descriptores, herramientas de procesamiento de lenguaje natural analizar los contenidos y aprendizaje automático para moderar la asignación de descriptores.
Analizador de frecuencia de palabras (ngram) utilizando como corpus Google books
Sobek es una herramienta de minería de texto para usos educativos. Se ha utilizado en diversas tareas, como ayudar a los docentes en el proceso de evaluación de actividades de producción textual, o en actividades de lectura y escritura. Tiene soporte para portugués e inglés
TAPoR (Text Analysis Portal for Research) reúne herramientas y metodologías para el análisis, descripción y tratamientos de corpus textuales. Permite explorar las herramientas disponibles según el modelo de definición de las humanidades digitales establecido por TaDiRAH.
Herramienta que permite extraer y acceder a los subtítulos generados automáticamente por Youtube para sus videos
arText redactor asistido para el español que ayuda a escribir textos de ámbitos especializados y textos en lenguaje claro. Desarrollado y mantenido por la UNED (España), la herramienta analiza pequeños textos según criterios de estructura textual, frecuencia léxica, parámetros morfológicos y sintácticos, detecta y marca potenciales problemas y realiza sugerencias. Es una herramienta gratuita y no requiere registro
Herramienta desarrollada por la Universidad Iberoamericana de la Ciudad de México que analiza corpus textuales y detecta usos del lenguaje no inclusivos en términos de género
BabelNet es un diccionario enciclopédico multilingüe cuya alcance lexicográfico está basado en entidades y conceptos provistos por diferentes fuentes de datos en línea. Es un proyecto orientado a construir y ofrecer una infraestructura de servicios lexicográficos similar a la de WordNet pero con un alcance multilingüe. Compila y vincula más de 50 fuentes. Dispone de una API y la posibilidad de descargar datos fuente
Sitio dedicado a la investigación en tecnologías digitales aplicadas a los estudios lingüísticos. Reúne las investigaciones, aplicaciones y servicios desarrollados por Irene Renau y Rogelio Nazar , investigadores de la Pontificia Universidad Católica de Valparaíso
Tutorial elaborado inicialmente para el SWIB19 y actualizado para la DCMI Virtual 2020. Incluye instrucciones paso a paso y ejercicios
Herramienta web para el análisis y tratamiento de corpus basados en texto digitalizado (XML, txt y HTML). Dispone de diversas herramientas de análisis estadístico de corpues textuales
Compilación de herramientas para análisis de corpus lingüísticos mantenida por Kristin Berberich y Ingo Kleiber
Annif es una herramienta que combina herramientas de procesamiento de lenguaje natural y vocabularios controlados para la clasificación e indización automática de textos. Permite utilizar diversos algoritmos o esquemas alternativos para la clasificación de textos. Desde algoritmos especializados en la extracción de entidades (por ejemplo reconocimiento de nombre propios o instituciones), análisis de frecuencias (para extracción de palabras clave) o clasificación con vocabularios controlados. Dispone además de una herramientas de OCR para celulares que permite tomar fotos de textos para luego indizarlos en 2 sencillos pasos. La herramienta esta desarrollada mayormente en Python y es mantenida por la biblioteca nacional de Finlandia
Módulo Python para procesamiento del lenguaje natural. Pemite identificar catergorías léxicas y funcionales, determinar estructuras de frase y flexionar palabras. Soporta inglés, francés, italina y español
AntConc es una herramienta freeware desarrollada por Laurence Anthony en JAVA que permite analizar corpus textuales. Permite extraer frecuencia de palabras, palabras clave, palabras en contexto, lemas (ngram) entre otras facilidades
Sitio mantenido por un grupo de estudiantes y egresados de la carrera de Letras que nos hemos especializado en el área de la Lingüística Computacional que reúne recursos, tutoriales y cursos sobre procesamiento del lenguaje natural
Base de datos que reúne las descripciones y accesos a los artículos y ponencias de diferentes eventos científicos dedicador al procesamiento de lenguaje natural y linguística computacional.
ORES (Objective Revision Evaluation Service) es un servicio web de machine learning basado y provisto por Wikipedia. Es utilizado por Wikipedia para detectar y prevenir acciones de vandalismo web en Wikipedia. Dispone de una API RESTful abierta