• Etiquetas: linguistica
Base de datos que reúne las descripciones y accesos a los artículos y ponencias de diferentes eventos científicos dedicador al procesamiento de lenguaje natural y linguística computacional.

Esta herramienta permite analizar la frecuencia de frases (N-gramas) en recursos bibliográficos según fechas e idiomas. Es útil para una infinidad de propósitos, además... se pueden descargar las fuentes de datos estructurados para realizar experimentos propios

AntConc es una herramienta freeware desarrollada por Laurence Anthony en JAVA que permite analizar corpus textuales. Permite extraer frecuencia de palabras, palabras clave, palabras en contexto, lemas (ngram) entre otras facilidades

El Archivo de los Idiomas Indígenas de Latinoamérica es un repositorio orientado a la preservación de fuentes y materiales sobre lenguas indígenas de Latinoamérica. Desarrollado y mantenido por la Universidad de Texas, incluye textos, grabaciones sonoras y audiovisuales.

arText redactor asistido para el español que ayuda a escribir textos de ámbitos especializados y textos en lenguaje claro. Desarrollado y mantenido por la UNED (España), la herramienta analiza pequeños textos según criterios de estructura textual, frecuencia léxica, parámetros morfológicos y sintácticos, detecta y marca potenciales problemas y realiza sugerencias. Es una herramienta gratuita y no requiere registro

El Atlas Sintáctico del Español (ASinEs) es un proyecto de investigación que releva y describe aspectos sintácticos de las variedades geográficas del español.El ASinEs se desarrolla en colaboración con diferentes instituciones, entre las que se encuentra la Real Academia Española.

BabelNet es un diccionario enciclopédico multilingüe cuya alcance lexicográfico está basado en entidades y conceptos provistos por diferentes fuentes de datos en línea. Es un proyecto orientado a construir y ofrecer una infraestructura de servicios lexicográficos similar a la de WordNet pero con un alcance multilingüe. Compila y vincula más de 50 fuentes. Dispone de una API y la posibilidad de descargar datos fuente

Internet Based EXperiments es una herramienta libre que permite realizar experimentos psicolingüísticos en línea. El sitio permite alojar e implementar experimentos

La biblioteca digital de Lenguas es un repositorio de la Facultad de Lenguas de la Universidad del Comahue, alberga documentos en múltiples formatos: textos, imágenes, sonidos, videos y otros documentos multimedia

Repositorio institucional de la Facultad de Lenguas de la Universidad Nacional del Comahue.

Repositorio de recursos sobre la lengua recopilado y mantenido por el proyecto CLARIN

Herramienta desarrollada por la Universidad Iberoamericana de la Ciudad de México que analiza corpus textuales y detecta usos del lenguaje no inclusivos en términos de género

Diatopix es una herramienta que permite observar, en un espacio web virtual delimitado por una lengua, la distribución geográfica del uso de palabras, términos, expresiones, etc. La herramienta usa el motor de búsqueda personalizado de Google y divide los resultados obtenidos entre los principales países donde se usa dicha lengua (Argentina, Chile, Colombia, Cuba, España, México, Venezuela).

El Diccionario de ideas afines de Eduardo Benot es un tesauro, en el que el léxico está organizado alrededor de una red semántica jerarquizada formada por 1.216 clases semánticas.Las unidades léxicas que integran las entradas del Diccionario están organizadas en grupos de clases de palabras, concretamente, NOMBRES, VERBOS, ADJETIVOS, ADVERBIOS, LOCUCIONES y, en algunos ocasiones, INTERJECCIONES. Dentro de dichos grupos, el léxico se organiza en subgrupos, cuyo orden de aparición está determinado por el grado de afinidad semántica de las unidades léxicas que integran dichos subgrupos con el concepto prototípico que caracteriza a cada clase semántica.

Dico es un servidor de diccionarios de código abierto desarrollado por Sergey Poznyakoff y Wojciech Polak. Permite implementar diccionarios de monolingües y multilígües

Proyecto realizado por José Bartol y Natividad Hernández dedicado al desarrollo de diccionarios de disponibilidad léxica para las diversas zonas del mundo hispánico

Herramienta que permite convertir fuentes terminológicas en PDF a formato XML estructurado para diccionarios

Base de datos sobre la producción científica lexicográfica

ELRA es un catálogo mantenido por la ELRA (European Language Resources Association) que reúne y recopila corpus lingüísticos en diversas lenguas y de diversos ámbitos

Etiquetas

,

ESLORA es un corpus de español oral formado por entrevistas semidirigidas y conversaciones espontáneas registradas en Galicia (España) entre 2007 y 2015. Actualmente consta de 83 documentos (768.005 palabras ortográficas, que corresponden a 898.914 elementos gramaticales). Incluye una herramienta de consulta y acceso a los materiales transcritos ortográficamente con alineación texto-audio, lematizados y etiquetados morfosintácticamente.