Los datos de investigación, entendidos como aquellos recursos documentales (evidencia) generados o recopilados durante el desarrollo de un proyecto de investigación, requieren ser gestionados en sistemas de información especializados conocidos como Repositorios de Datos de Investigación (RDI).
Los Repositorios de Datos de Investigación (RDI) son sistemas de información desarrollados para organizar, almacenar, publicar datos de investigación, con el fin de potenciar su descubrimiento, acceso, uso y reutilización a largo plazo para las máquinas y los seres humanos.
Dichos sistemas toman como insumo los datos de investigación y los transforman en objetos digitales compuestos y heterogéneos denominados DataSets que son representados como un contenedor que agrupa: Archivos de Datos(DataFiles), Documentación, Metadatos, Identificadores persistentes y Código/Scripts para su manipulación. “Los datasets se almacenan y gestionan en repositorios interoperables en red integrados en una infraestructura global de investigación, desarrollados conforme a estándares internacionales”.
Los Repositorios de Datos de Investigación son implementados con base a tres principios fundamentales (administración, preservación y descubrimiento):
La utilización de metadatos normalizados son un componente fundamental en la gestión de los repositorios de datos de investigación, permiten establecer un marco común de descripción de los recursos que puedan ser entendido y procesado por máquinas y humanos y de esta forma garantizar la reutilización de los datos y promover su validación, verificación, reproducción y certificación. Con este fin, se desarrollaron las “Directrices de Metadatos para Repositorios de Datos de Investigación de la Red Colombiana de Información Científica (RedCol)”, buscado ofrecer a los administradores de los repositorios de datos de investigación, una guía detallada sobre los estándares, elementos de descripción y alcance de los campos de metadatos para su configuración e implementación.