Conjunto de librería PHP que permite analizar textos a través de técnicas de procesamiento de lenguaje natural
Español

Librería PHP que permite clasificar textos utilizando estadística bayesiana
Español

Plug in que permite anexar recursos codificados en TEI en Omeka

Editor HTML5 que permite crear presentaciones para Impress.js.

Etiquetas


Editor de texto general que permite componer textos y codificaciones que utilicen esquemas XML. Permite utilizar plug ins para esquemas XML específicos

Editor visual que puede ser integrado en cualquier entorno web.

Etiquetas


Blog mantenido por Antonia Oses, especialista en terminología aplicada a la elaboración de vocabularios controlados. El blog analiza las problemáticas específicas que van surgiendo en la creación y mantenimiento de vocabularios controlados.

Prototipo de editor BIBFRAME (Bibliographic Framework Initiative), herramienta libre que permite describir recursos de según el marco BIBFRAME: entidades, personas, organizaciones, eventos, jurisdicciones, instancias, manifestaciones, etc).
Herramientas
Español

Herramienta JAVA que permite imlementar un buscador Web con sus rutinas y parámetros (descubrimiento, indexación y representación de sitios)

El Basel Register of Thesauri, Ontologies and Classifications (BARTOC) recopila, releva y describe vocabularios controlados existentes según datos de disponibilidad, formato, idioma y cobertura.

Repositorio de vocabularios mantenido por el Joint Steering Committee for Development of RDA (JSC) que permite descargar el set de elementos, designaciones de relación y toda la terminología controlada contemplada en las RDA.

Excelente ejemplo de explotación de las posibilidades del procesamiento de fuentes lingüísticas formales. Permite analizar y utilizar el Diccionario de la Real Academia según lemas, raíz morfológica, extensión del término y facilidades de ordenamiento según varios criterios de relevancia. Además permite descargar las fuentes terminológicas ya estructuradas. Muy bueno

Directorio de herramientas open source para bibliotecas, archivos y museos

Práctico OCR libre desarrollado en javascript

Herramienta que analiza texto y genera resúmenes en línea (en inglés)

OCR en línea que convierte JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu to Text

Extensión para el navegador que convierte en texto las inscripciones en imágenes. Es como un OCR embebido en el navegador. Permite seleccionar texto desde la imagen, traducirlo o copiarlo.

Curatescape es una iniciativa orientada a registrar representaciones y recursos (relatos, fotos, videos, historias orales, etc) como una estrategia para tangibilizar experiencias culturales en contextos urbanos. Para la implementación del proyecto desarrollaron un template Omeka que permite exponer relaciones basadas en geolocalización y temporalidad.

Taxonomía que ofrece una acceso centralizado a las denominaciones y ubicación de las especies. Interesante ejemplo de gestión y explotación de estructuras formales de representación del conocimiento biológico