El acceso a los datos de investigación es fundamental para el avance de la ciencia ya que permite que los resultados puedan ser validados o reutilizados en otro proyecto, generando un valor constante que impacta tanto en las instituciones que financian los proyectos, como a los investigadores que participan en estos y los investigadores que toman estos productos como insumo para sus propias investigaciones. Para que esto sea posible, es necesario que el investigador considere dentro de la formulación del proyecto de investigación el tratamiento que van a recibir los datos de investigación que recopila, procesa o genera antes, durante y luego de finalizar la investigación.
En ese sentido el Plan de Gestión de Datos (PGDI) es un documento elaborado por el investigador para describir las tareas asociadas a la gestión de datos de investigación tales como: el contexto de creación de los datos, las características intrínsecas de estos, el cumplimiento de requisitos legales, las estrategias para su preservación y reutilización, entre otros, con el objetivo de respaldar el cumplimiento de los principios FAIR (Encontrables, Accesibles, Interoperables y Reutilizables) y se facilite una mejor interacción con otros proyectos.
Los detalles de su estructura están vinculados a especificaciones a nivel general (explicados en este documento), así como los requisitos asociados al desarrollo del proyecto (Contratos o términos de financiación), por ello antes de elaborar el PGDI del proyecto, es indispensable que el investigador revise todos los términos de referencia asociados para que dicho documento se ajuste a la naturaleza de los datos, área de conocimiento, licencias de uso, entre otros.
El propósito de esta guía, es orientar al investigador respecto a la elaboración del PGDI para los proyectos de investigación, así como los criterios para tener en cuenta en la descripción de los datos.
¶¿Qué es un Plan de Gestión de Datos de Investigación - PGDI?
El Plan de Gestión de datos de Investigación - PGDI (en inglés Data Management Plan - DMP) es un documento que complementa la propuesta del proyecto de investigación, y que se crea con el objetivo de establecer las actividades para la organización, almacenamiento y acceso a los datos que se van a producir en la investigación.
El uso de este documento, es promovido principalmente por las agencias de financiación enmarcado en las recomendaciones de la Unesco sobre ciencia abierta asociados a la publicación de datos de investigación abiertos, colaboración abierta, principios de calidad del dato, entre otros (UNESCO Biblioteca Digital, 2021), por lo que el PGDI busca que los datos cumplan los principios FAIR para garantizar el acceso normalizado a los datos, junto con sus respectivas licencias de uso y su posible reutilización.
En consecuencia la importancia de los PGDI radican en la posibilidad de brindar a futuras investigaciones la oportunidad de reutilizar los datos para avanzar en la creación de conocimiento, generar un reconocimiento a los creadores de los datos de investigación y evitar reprocesos y pérdida de presupuesto destinado a recopilar o procesar los mismos datos varias veces.
¶Pasos para elaborar un Plan de Gestión de Datos - PGDI
Un PGDI es un documento estructurado (pensado para ser procesado por las máquinas), que contiene un conjunto de secciones establecidas y que puede construirse de dos formas: una manual y otra automatizada a través de herramientas online.
La primera consiste en la creación de un documento en un procesador de texto (Word, LibreOffice, etc) a partir de una plantilla que oriente la construcción del PGDI con áreas temáticas específicas.
La construcción automatizada de Planes de Gestión de Datos de Investigación - PGDI, se hace a través de sistemas de información especializados web los cuales orientan al investigador paso a paso y permiten generar un documento en línea con la posibilidad de elegir entre diferentes plantillas y canales de ayuda para la descripción de los datos.
Ambas modalidades de construcción (manual y automatizada) se enmarcan en el desarrollo del proyecto de investigación y en el ciclo de vida de los datos de investigación. Por esta razón un Plan de Gestión de Datos de Investigación - PGDI, se considera un documento vivo que se actualiza constantemente según las necesidades del proyecto. Se recomienda verificar y actualizar el PGDI siempre que haya cambios significativos al menos dos veces durante la ejecución del proyecto: a mitad del proyecto y a la finalización del mismo así:
Previo a la formulación del proyecto
Durante la ejecución del proyecto
Posterior a la finalización del proyecto
El PGDI formulado contiene toda la información relacionada con la planeación de la gestión de los datos que se van a recopilar, procesar y analizar.
Durante la ejecución del proyecto el plan de gestión de datos de investigación - PGDI, es susceptible de actualizar debido a una modificación en el alcance de los datos a recopilar, la estructura de almacenamiento, la seguridad de los datos, entre otros.
Al finalizar el proyecto el PGDI da cuenta de todas actividades necesarias que requirieron los datos para su recolección/creación, procesamiento, análisis, preservación, así como los requisitos necesarios para acceder, compartir y reutilizar los productos de la investigación.
La construcción de un PGDI debe realizarse considerando varios factores, entre estos, los requisitos exigidos por la agencia de financiación, el área de conocimiento, la reglamentación nacional aplicable, entre otros, sin embargo la mayoría de plantillas y herramientas para elaborar el PGDI comparten características similares como el contexto del proyecto, recopilación de datos, documentación y metadatos que son importantes para la entender y gestionar los datos (Gajbe et al., 2021). Algunas plantillas gestionan campos especiales debido a la naturaleza del área de conocimiento aplicado, dentro de las plantillas que se encuentran públicas en la comunidad, se destacan las plantillas provistas por el proyecto Parthenos, el cual ofrece unas plantillas enfocadas en las áreas de conocimiento de los estudios lingüísticos, humanidades, patrimonio cultural, historia, arqueología y campos relacionados, por lo que el proyecto trabaja en la construcción de estándares comunes para la elaboración de PGDI en esas áreas. La plantilla brinda pautas sobre la elaboración del PGDI asociadas a la publicación de datos de investigación en el marco de los principios FAIR y se enfocan en las siguientes áreas (Parthenos, s/f):
La construcción de un PGDI debe realizarse considerando varios factores, entre estos, los requisitos exigidos por la agencia de financiación, el área de conocimiento, la reglamentación nacional aplicable, entre otros, sin embargo la mayoría de plantillas y herramientas para elaborar el PGDI comparten características similares como el contexto del proyecto, recopilación de datos, documentación y metadatos que son importantes para la entender y gestionar los datos (Gajbe et al., 2021). Algunas plantillas gestionan campos especiales debido a la naturaleza del área de conocimiento aplicado, dentro de las plantillas que se encuentran públicas en la comunidad, se destacan las plantillas provistas por el proyecto Parthenos, el cual ofrece unas plantillas enfocadas en las áreas de conocimiento de los estudios lingüísticos, humanidades, patrimonio cultural, historia, arqueología y campos relacionados, por lo que el proyecto trabaja en la construcción de estándares comunes para la elaboración de PGDI en esas áreas. La plantilla brinda pautas sobre la elaboración del PGDI asociadas a la publicación de datos de investigación en el marco de los principios FAIR y se enfocan en las siguientes áreas (Parthenos, s/f):
Identificación del investigador. En este apartado se solicitan los datos de identificación y contacto del investigador tales como el nombre, correo electrónico, área de conocimiento, afiliación institucional, rol dentro de la investigación, y la versión del plan.
Resumen de los datos. Aquí se le pide al investigador describir el propósito de la creación y/o recolección de los datos y su relación con los objetivos del proyecto de investigación. Adicionalmente se debe indicar el tipo y formato de los datos con los que va a trabajar, el tamaño esperado de los datos, la granularidad de los datos, el origen de los datos, la metodología como se crearán o recopilarán los datos, la utilidad de los datos dentro del proyecto y la descripción de cualquier restricción que puedan tener los datos.
Datos Justos (FAIR). Para que los datos cumplan con los principios FAIR es necesario que el investigador describa aspectos asociados a los datos como el estándar de metadatos que usarán los datos para la creación de estos,
Asignación de recursos. En este apartado se describen los mecanismos de almacenamiento y publicación (licenciada) de los datos recolectados durante el proyecto de investigación en distintos sistemas de información especializados.
Seguridad de los datos. Se busca establecer las distintas metodologías aplicables para determinar los controles de acceso, políticas de privacidad y modelos de preservación de los datos.
Aspectos éticos. En este apartado se establecen los alcances de los datos a obtener de las distintas poblaciones en las cuales se aplicaran los instrumentos de recolección de datos y los posteriores filtrados y procesos de anonimidad que se aplicarán sobre los datos publicados.
Otros Aspectos. Se incluyen aspectos de organización, almacenamiento, condiciones técnicas de uso, entre otros.
En el ámbito global se han creado diferentes herramientas en línea para apoyar al investigador en la elaboración del PGDI. A continuación se presentan algunas herramientas que pueden servir para el ámbito de América Latina y el Caribe como experiencias para elaborar éstos documentos de manera normalizada.
La Digital Curation Center (DCC) -una organización inglesa- cuyo plan de gestión de datos en línea surgió en el 2010 con el objetivo de apoyar a los investigadores en la elaboración de PGDI (Donnelly et al., 2010), recomienda desarrollar un PGDI basado en ocho temas específicos para garantizar que el plan sea viable y funcional, entre los que se encuentran:
Información administrativa de los datos. Donde se registra información básica del proyecto como: el título, el nombre del investigador, los datos de contacto, identificadores de proyecto o del investigador.
Recolección de datos. En este apartado se sugiere al investigador especificar el tipo de datos que va a recopilar, el formato de estos datos, así como el software que permita su reutilización y acceso a largo plazo.
Documentación y metadatos. Aquí se recomienda establecer la documentación necesaria para que los datos puedan ser entendidos y reutilizados por lo que debe describir la estructura de metadatos necesaria para que esto se pueda lograr.
Ética y requisitos legales. El conjunto de sus datos debe especificar si existen restricciones legales o éticas que limitan la reutilización de los datos
Almacenamiento y copias de seguridad. Debe indicar donde se almacenarán los datos y así como los requisitos que se deben considerar para el acceso y la seguridad de los datos.
Selección y preservación. Aquí se recomienda revisar los valores a largo plazo de los datos por tal razón debe indicar cuáles datos se conservarán a largo plazo y cuál será la mejor forma de preservarlos.
Datos compartidos. Considerando los aspectos legales de los datos, en este apartado debe definir qué datos serán susceptibles de compartir y cómo serán compartidos.
Responsabilidades y recursos. Este apartado requiere que se asignen roles y recursos para la ejecución del PGDI, todos debidamente justificados y descritos en el plan, que también puede requerir que estén especificados en el presupuesto del proyecto.
Además de contar con las recomendaciones descritas, la DCC también tiene una herramienta en línea llamada “DMP ONLINE” (figura 1) que orienta al investigador en la elaboración del PGDI, en cada uno de los ocho temas, estableciendo un conjunto de campos con distintas preguntas asociadas. Este sistema de información es actualizado constantemente con nuevas plantillas que incluyen los campos solicitados por las instituciones de financiación Europea (Horizonte 2020) y del Reino Unido (https://dmponline.dcc.ac.uk/public_templates), Esta herramienta permite a los usuarios compartir los PGDI con otros usuarios (si es necesario). Para usarla debe registrarse y crear una cuenta. Una vez ingresa, el sistema tiene una guía de cada uno de los campos con ejemplos para registrar la información sobre la gestión de datos de su proyecto.
El sistema “DMP ONLINE” ha sido traducido, adaptado y utilizado por distintos países para implementar portales nacionales de Planes de Gestión de Datos de Investigación PGDI como por ejemplo:
Portal PaGoDa: Portal para la gestión de Planes de Gestión de Datos de Investigación del Consorcio Madroño, que ha sido traducido al español e integrado un conjunto de recursos asociados para apoyo de los investigadores españoles.
Portal eINA DMP: Basado en “DMP ONLINE” y traducido al Catalán por el Consorcio de Servicios de las Universidades Catalanas - Recerca.
Portal DMP Assistant: Implementado por la “Digital Research Alliance of Canada” en colaboración con la University of Alberta, para ayudar a los investigadores a preparar planes de gestión de datos de investigación de los investigadores canadienses (PGDI).
La organización OpenAire y la red europea EUDAT desarrollaron el portal especializado llamado ARGOS que tiene como objetivo apoyar la gestión de datos de investigación en Europa a través de la implementación de datos FAIR, mejores prácticas para datos abiertos, así como la gestión validación y monitoreo de los Planes de Gestión de Datos (OpenAIRE, 2020a).
“ARGOS es un servicio abierto extensible que simplifica la gestión, validación, seguimiento y mantenimiento de Planes de Gestión de Datos (DMP). Permite a los actores (investigadores, administradores, supervisores, etc.) crear DMP procesables que pueden intercambiarse libremente entre infraestructuras para llevar a cabo aspectos específicos del proceso de gestión de datos de acuerdo con las intenciones y el compromiso de los propietarios de los datos”.
A través de la plataforma ARGOS; (de acceso abierto y en línea), se pueden realizar PGDI de manera colaborativa de forma simultánea con todos los investigadores asociados a los proyectos de investigación, así mismo permite enlazar las identidades digitales de los mismos mediante ORCID. Adicionalmente los Planes de Gestión de Datos son tratados como resultados de investigación a los que se les puede asignar identificadores como el DOI y licencias Creative Commons (OpenAIRE, 2020a).
Dentro de las áreas temáticas que trabaja está herramienta para la elaboración del plan se encuentran (OpenAIRE, 2020b):
Información principal. en esta sección se pide al investigador dar información del proyecto cómo el título del Plan de Gestión de Datos - PGDI, una descripción breve sobre el Plan (objetivos, alcance), idioma en que se redacta el plan, el tipo de visibilidad que se le dará a plan (puede ser pública o privada), información sobre los investigadores que han producido, procesado y analizado los datos descritos en el plan, las organizaciones que apoyar en creación y revisión del plan y los datos de contacto del investigador o autor del plan.
Información de financiación. En esta sección se deben diligenciar los datos de la financiación del proyecto tales como financiador o subsidios recibidos. Aunque la herramienta contiene un menú desplegable donde los investigadores pueden seleccionar tanto el financiador como el subsidio asociado, también es posible agregar manualmente esta información.
Información de licencia. Ofrece una lista desplegable con las licencias que el investigador considere pertinente asignar al Plan.
Información del conjunto de datos. Aquí se debe describir los datos con base en las plantillas disponibles en la plataforma, estas incluyen las diseñadas de acuerdo a los requerimientos de los financiadores, así por ejemplo, hay plantillas del programa para apoyo a la investigación Horizonte2020, el Grupo italiano de apoyo a la ciencia abierta IOSSG, entre otros. Es posible que el usuario escoja más de una plantilla para describir diferentes conjuntos de datos.
Los ejemplos descritos anteriormente muestran la diversidad de formas que puede tomar un Plan de Gestión de Datos de Investigación PGDI dependiendo el área de conocimiento, los criterios solicitados por un contrato o un financiador y sin embargo, estos planes contienen muchas áreas comunes que pueden servir de referencia para la elaboración de este tipo de documentos en Colombia, además de servir como un esfuerzo por sensibilizar a los investigadores en la importancia de pensar en la gestión de sus datos al largo plazo.
¶Estructura de un Plan de Gestión de Datos de Investigación - PGDI
Existen diversidad de plantillas para el PGDI, cada una delimitada por los objetivos, principios y requisitos de las entidades apoyan o financian proyectos de investigación, en su mayoría del norte global, así como plantillas específicas por área de conocimiento dada la especificidad con que se requieren los datos para algunas áreas. En el siguiente enlace podrá ver algunos ejemplos en inglés de PGD de diferentes instituciones y áreas de conocimiento: https://www.dcc.ac.uk/resources/data-management-plans/guidance-examples. Así mismo se recomienda ver las distintas guías asociadas a las listas de requerimientos (cheklist) provistas por las distintas redes como Digital Curation Centre (DCC, 2013) (https://www.dcc.ac.uk/sites/default/files/documents/resource/DMP/DMP_Checklist_2013.pdf) figura 3.
Tomando las mejores prácticas planteadas por Digital Curation Centre, DCC (2013) , el Consorcio de Universidades de la Comunidad de Madrid y de la UNED para la Cooperación Bibliotecaria, Madroño (2020) y la Universidad de Stanford (2011). A partir de los modelos existentes, se ha elaborado un modelo que sirva como referente para la elaboración de los Planes de gestión de Datos de Investigación - PGDI que está compuesto por siete áreas temáticas y veinticuatro campos específicos que sirven como referentes para la creación de un documento plantilla ó para la configuración de un sistema de información especializado en la generación de los PGDI. Las áreas temáticas y sus campos se listan a continuación:
¶Área Temática 1. Información administrativa y financiera.
Esta sección se concentra en identificar los datos asociados al investigador, el proyecto bajo el cual son creados o recopilados los datos, los datos de financiación del proyecto y las versiones del documento. Aquí se recoge información sobre el contexto de creación de los datos permitiendo que sean encontrados y puedan ser citados de manera precisa. Los datos de esta área, buscan estar alineados con los Principios FAIR (Datos Encontrables y Reutilizables) e incluyen campos como: identificador del centro, financiador, número de identificación de la financiación, nombre del proyecto, descripción, Investigador Principal, identificador ORCID, fecha de la primera versión, etc.
Campo 1.1. ID del proyecto: Incluya el identificador asociado al proyecto de investigación provisto por la institución de investigación responsable o por el ente financiador del mismo.
Campo 1.2. Institución responsable del proyecto: Indique de manera clara y completa en nombre de la institución u organización que avala y es responsable del proyecto.
Campo 1.2.1. ID de la Institución responsable del Proyecto: Especifique el identificador normalizado asociado de la institución u organización (ISNI, ROR ID, GRID, etc). Por ejemplo: ROR ID https://ror.org/059yx9a68
Campo 1.3. Institución Financiadora: Indique de manera clara y completa en nombre de la institución u organización que financia y patrocina el proyecto de investigación. Incluya en lo posible el programa específico de financiación (cuando aplique)
Campo 1.3.1. ID de la Institución Financiadora: Especifique el identificador normalizado asociado de la institución u organización financiadora (CROSSREF FUNDER ID, ISNI, ROR ID, etc). Por ejemplo: Crossref Funder ID 501100002753
Campo 1.3.2. Número de identificación de la financiación: Una identificación determinada por el financiador y/o la institución que financia el proyecto. Por ejemplo, en Colombia se asigna un código a los proyectos aprobados por el Banco de Programas y Proyectos de Inversión Nacional, para este caso el código es numérico, pero podría ser un código alfanumérico según parámetros de la institución que financia el proyecto.
Campo 1.4. Nombre (Título) del Proyecto: Nombre exacto del proyecto tal y como fue aprobado por la instancia respectiva.
Campo 1.4.1. Descripción del proyecto: Realice una descripción o resumen breve del objetivo y naturaleza del proyecto, la metodología, alcance, las preguntas que orientan la investigación y el objetivo por el cual los datos van a ser recopilados o creados.
Preguntas a considerar:
¿Cuál es la naturaleza de su proyecto de investigación?
¿Qué preguntas de investigación está abordando?
¿Con qué finalidad se recopilan o crean los datos?
Notas:
Resuma brevemente el tipo de estudio (o estudios) para ayudar a otros a comprender los propósitos para los que se recopilan o crean los datos.
Campo 1.5. Investigador Principal: Registre los nombres y apellidos del/los investigadores principales y responsables del proyecto de investigación.
Campo 1.5.1. Identificador del Investigador principal: Especifique el identificador persistente de los investigadores principales (ORCID, VIAF, SCOPUS ID, RESEARCH ID, etc..). Se recomienda que, cómo mínimo se incluya el ORCID. Ejemplo : https://orcid.org/0000-0003-3580-8766
Campo 1.6. Datos de contacto del proyecto: Nombre de la persona de contacto (si es diferente al investigador principal), teléfono y correo electrónico.
Campo 1.7. Fecha de la primera versión: Fecha en la que el Plan de Gestión de Datos de Investigación - PGDI fue completado. Incluir año, mes y día (AAAA-MM-DD).
Campo 1.8. Fecha de la última actualización: Registre y versione cada una de las fechas en las que PGDI sea actualizado. Incluir año, mes y día. Se recomienda agregar en éste campo detalles descriptivos de los cambios principales del documento asociados a la versión (releases).
Campo 1.9. Marco normativo relacionado: Liste las distintas políticas, directrices, normas o estándares que se van a aplicar en la gestión de datos de investigación durante el proyecto. Estos incluyen las políticas de datos que utilicen o requieran las instituciones responsables y financiadoras del proyecto de investigación. Así mismo se debe incluir la normatividad nacional e internacional que aplique al proyecto respecto a la gestión de datos de investigación (Por ejemplo: Resolución Minciencias 0361 de 2020 artículo tercero.).
Preguntas a considerar:
¿Hay algún procedimiento/directriz/política existente que será la base de su modelo de gestión de datos?
¿Tiene su departamento/grupo directrices para la gestión de datos?
¿Tiene su institución una política de seguridad o protección de datos que utilizará en su proyecto?
¿Tiene su institución una política de gestión de datos de investigación?
¿Tiene su financiador una política de gestión de datos de investigación?
¿Existen normas/estándares nacionales o internacionales que adoptará en su proyecto de investigación para la gestión de datos?
Notas:
Enumere cualquier otra normativa relevante del ente financiador, institución responsable, área, departamento o grupo de investigación sobre datos de gestión, intercambio de datos y seguridad de datos. Se debe tener en cuenta que la información reflejada en este campo determinará el contenido de las siguientes áreas temáticas que deben estar alineadas con la información aquí suministrada.
De ser posible, indique y enlace en qué área temática y campo asociado, aplicará cada una de las normativas listadas.
¶Área Temática 2. Adquisición (Creación/Recolección/Reutilización) de los datos.
En esta sección se solicita al investigador describir algunos aspecto básicos de la adquisición de datos de investigación entre los que se incluye: el tipo de datos a crear y/o recopilar en el transcurso de la investigación, el tipo de datos, su contenido (código de software, imágenes, video, objetos de aprendizaje, datos cartográficos, etc..), entre otros. Adicionalmente se incluye una metodología de creación o recolección de los datos. Los datos de esta área, buscan estar alineados con los Principios FAIR (Datos Reutilizables)
Campo 2.1. Tipo de datos a crear, recolectar y reutilizar: Incluya una breve descripción de los datos que se van a crear, recolectar y reutilizar durante el proyecto de investigación, incluya las fuentes que se van a utilizar para adquirir dichos datos, caracterice el tipo de datos y la cobertura de la fuente donde se encuentran los datos existentes. Resuma y justifique su elección del formato y considere las implicaciones del formato de datos y los volúmenes de datos en términos de almacenamiento, copia de seguridad y acceso.
Preguntas a considerar:
¿Qué tipos (por ejemplo, datos de observación, datos experimentales, datos estadísticos, etc...), tipologías (por ejemplo: encuestas, entrevistas, observaciones, máquinas o instrumentos recopilados, muestras físicas, modelos, etc.) y naturaleza de contenidos (Por ejemplo: texto, imagen video, multimedia, etc..) de datos se crearán/recolectarán?.
¿Hay datos existentes que pueda reutilizar para el proyecto?. Describa la fuente de dónde provienen.
¿Qué formatos/extensión de archivo, versiones de formatos y soporte de almacenamiento se utilizarán?. Se recomienda ver formatos recomendados por Data Archiving and Networked Services (https://dans.knaw.nl/en/file-formats/).
¿Cuál es el volumen de datos (cantidades, espacio de almacenamiento) que se crearán/recolectarán y a qué tasa de crecimiento?.
¿Los datos creados son reproducibles (por ejemplo, un experimento) o irreproducibles (por ejemplo, observaciones)?.
Notas:
Este campo puede ser continuamente actualizado debido a los cambio que se hagan durante el proyecto de investigación.
Campo 2.2. Metodología de creación, recolección y reutilización de los datos: Explique la metodología en que los datos van a ser adquiridos (por creación, recolección, reutilización). Considere cómo se organizarán los datos durante el proyecto, mencionando por ejemplo, convenciones de nomenclatura de nombres de archivo, control de versiones y estructuras de directorios. Incluya los criterios para garantizar la calidad y consistencia de los datos.
Preguntas a considerar:
¿Cómo recopilará los datos (fuentes, instrumentos, etc.) y con qué frecuencia cambiarán o se actualizarán los mismos?.
¿Qué estándares o metodologías utilizará para la creación o recolección de datos?.
¿Los formatos/extensiones, sus versiones y el software elegidos permitirán acceder, reproducir y compartir a largo plazo a los datos?.
¿Cómo organizará y nombrará la estructura de directorios y archivos (convenciones de nombres de archivos de datos)?.
¿Cómo manejará el control de versiones?.
¿Cómo administrará la estructura jerárquica de los archivos primarios, complementarios, anexos y relacionados?
Notas:
Describa los procesos de aseguramiento de la calidad, coherencia y consistencia de datos (por ejemplo: captura de datos estandarizada, validación de datos, nombres de archivos, formatos de uso, de publicación y de preservación, armonización/calibración de datos, métodos para repetir muestras o mediciones, revisión por pares, uso de vocabularios controlados, entre otros) basados en estándares y buenas prácticas se utilizará durante el proyecto de investigación?.
¶Área Temática 3. Documentación y descripción normalizada de los datos (Metadatos)
Esta sección busca documentar y describir de manera detallada el proceso de gestión de los Metadatos asociados a todos los datos del proyecto de investigación con el fin que otros investigadores puedan acceder, leer, interpretar y entender los datos en el futuro. Se entienden los metadatos como “datos que contienen algún nivel de estructura, los cuales describen, explican, localizan, administran y amplían la información acerca de un recurso de forma que tenga algún sentido para las máquinas y los humanos”
Campo 3.1 Documentación y metadatos que acompañan los datos: Mientra que en el área temática anterior se listan de manera técnica los datos y datasets creados, recolectados y utilizados; en este apartado se documenta (describe y explica) el contenido de los mismos entre los que se incluye: objetivos, alcance y propósito, sus elementos constitutivos (campos, columnas, filas, estructuras, patrones, formas, etc), se explica la muestra, su forma de organización interna y su manera de leer e interpretar dichos datos y productos relacionados (gráficos, tablas, transformaciones, entre otros).
Preguntas a considerar:
¿Qué información se necesita para que los datos sean accesibles, legibles, interpretables, verificables y entendibles en el futuro?
¿Cómo capturará / creará esta documentación y metadatos?
¿Qué estándares de metadatos utilizará y por qué?
Notas
Los documentos generados deben incluir detalles que ayuden con la identificación de los datos, como quién creó o contribuyó con la recolección de los datos, título, fecha de creación y las condiciones bajo las cuales pueden ser accedidos.
Se recomienda que se incluyan detalles sobre la metodología utilizada, el análisis y procedimientos usados, la definición de variables, vocabularios, unidades de medida y cualquier otra característica que contribuya con la descripción y entendimiento de los datos.
Debe tener en cuenta que los metadatos generados y que se encuentran asociados a los datos de investigación del proyecto, se utilizarán durante la ingesta de los recursos en los distintos sistemas de información especializados entre los que se encuentran los repositorios de datos de investigación.
A menos que los datos requieran tratamientos especializados e descripción y explicación debido a su naturaleza y contenido, se recomienda utilizar modelos de metadatos estandarizados y de propósito general como DataCite Metadata Schema 4.1+ ó las directrices de OpenAire (Directrices de OpenAIRE para administradores de repositorios de Literatura 4.0+, OpenAIRE Guidelines for Data Archives 2.0+)
¶Área Temática 4. Ética y cumplimiento de requisitos legales
Esta sección está relacionada con el consentimiento de las personas implicadas, protección de la identidad, tratamiento de los datos sensibles y gestión de derechos de propiedad intelectual. Se deben documentar los elementos que podría restringir el acceso, almacenamiento, uso y tiempo de preservación de los datos, por lo que se pide describir por cada dataset generado. Adicionalmente se deben establecer las consideraciones pertinentes asociados a la propiedad intelectual que deben asumir los datos para ser encontrables, accesibles y reutilizables según los principios FAIR.
Campo 4.1. Consideraciones éticas (datos sensibles): Describa en éste campo, Las consideraciones éticas que afectan la forma en que almacena los datos, quién puede verlos/usarlos/compartirlos y cuánto tiempo se conservan.
Preguntas a considerar:
¿Cómo se manejarán los datos sensibles (confidenciales) para garantizar que se almacenen y transfieran de forma segura?
Si es necesario. ¿Qué procesos y transformaciones se realizarán sobre los datos para proteger datos sensibles durante su acceso y uso?. ¿Cómo protegerá la identidad de los participantes si es necesario?.
Si aplica, ¿Cómo se gestionarán los permisos para conservar e intercambiar datos, especialmente datos sensibles?.
Notas
Dado que las consideraciones éticas pueden afectar el almacenamiento, acceso, uso y tiempo de preservación de los datos, es importante describir las acciones que permitirán cumplir con los requisitos legales asociados a datos sensibles. Dentro de estas actividades se encuentra la anonimización/recodificación de los datos, uso de comités de ética, acuerdos de consentimiento informado, entre otros.
Es imperativo mostrar que el PGDI está al tanto de las consideraciones éticas derivadas de la recolección/creación de datos a través de la planeación y gestión de las actividades pertinentes.
Cuando se utilicen datos sensibles o confidenciales de humanos, empresas o productos/servicios (restricciones comerciales, éticas o de confidencialidad), debe asegurarse que se solicite el consentimiento para permitir ser compartidos y reutilizados junto con los acuerdos de restricciones asociadas.
Campo 4.2. Gestión de propiedad intelectual: Este campo describe cómo gestionarán los derechos de autor y los derechos de propiedad intelectual (DPI). Se incluyen aspectos legales, licencias de acceso y restricciones asociadas.
Preguntas a considerar:
¿Quién es el propietario de los datos?
¿Cómo se licenciarán los datos para su reutilización?
¿Se tiene considerado agregar restricciones de acceso y reutilización de datos por parte de terceros mediante roles/niveles de usuario o restricciones de embargo por un tiempo determinado de los datos y datasets?
¿Se tendrán políticas/licencias unificadas o diferenciadas para los distintos grupos de datos y dataset y respecto a las acciones posteriores de intercambio, publicación, búsqueda y acceso sobre dichos grupos?.
Notas
Debe declarar quién tendrá la propiedad intelectual de los datos creados/recopilados del proyecto (derechos morales, derechos patrimoniales y derechos conexos), junto con las licencias para su uso y reutilización. Es importante que la propiedad y licencia estén alineados con los términos de referencia del proyecto, las cláusulas dispuestas por los financiadores en esta materia, así como de los datos recolectados de otras fuentes.
Para proyectos que involucren distintas organizaciones responsables/financiadoras que gestionen diferentes políticas de gestión de propiedad intelectual, se recomienda establecer un acuerdo consorciado para el proyecto.
La licencia debe especificar claramente los términos de acceso, uso, divulgación o construcción de obras derivadas a partir de los datos.
¶Área Temática 5. Almacenamiento y copias de seguridad (Backup)
Se enfoca en determinar el almacenamiento y periodicidad de las copias de seguridad para asegurar que el proyecto disminuya el riesgo de pérdida de información por cualquier circunstancia, por lo que debe informar adicionalmente las medidas de seguridad que aplicarán para que los datos no se pierdan. Adicionalmente se debe describir el manejo especial que tendrán los datos sensibles o confidenciales debido a sus limitaciones y restricciones subyacentes.
Campo 5.1. Copias de seguridad: Indique la periodicidad con la que se realizarán copias de seguridad de sus datos, así como el lugar de almacenamiento de las mismas. Especifique los mecanismos de control de acceso a los sistemas de almacenamiento de los colaboradores y las políticas asociadas de gestión de las copias de seguridad
Preguntas a considerar:
¿Tiene suficiente espacio de almacenamiento o tendrá que incluir cargos por servicios adicionales?
¿Cómo se respaldarán los datos, cada cuánto tiempo, en qué ubicaciones(locales,remotas)?
¿Quién será responsable de la copia de seguridad y la recuperación?
¿Cómo se recuperarán los datos en caso de incidencia, daño, corrupción, desastre de datos, ataques de ransomware, virus, daño de la infraestructura, entre otros?
¿Se tiene contemplado un mapa de riesgos/amenazas de almacenamiento y gestión de copias de seguridad?
¿Qué modelo de copia se ajusta al volumen y formato de los datos (copias completas, incrementales, diferenciales, etc..)?.
¿Se realizarán procesos de encriptación de los datos para restringir su acceso por parte de terceros?
Notas
Dado que el almacenamiento en computadores, discos duros y otras unidades propias puede ser riesgoso, se recomienda gestionar el almacenamiento en repositorios robustos proveídos por su institución; también es recomendable gestionar las copias de seguridad de forma automática y periódica.
Cuando se utilicen servicios de almacenamiento y copias de seguridad de terceros, se debe asegurar que no entre en conflicto con las políticas de la institución, el financiador ó la región/país. Por ejemplo, en términos del país o de la jurisdicción legal en la que se guardan los datos o la protección de datos confidenciales.
Campo 5.2. Seguridad y acceso de los datos: Con el fin de garantizar la integridad y no repudio de los datos durante la ejecución del proyecto de investigación, se debe indicar las medidas de seguridad que se aplicarán respecto al acceso, modificación, actualización y transmisión de los datos de investigación.
Preguntas a considerar:
¿Cuáles son los riesgos para la seguridad de los datos y cómo se gestionarán?
¿Cómo se controlará el acceso para mantener los datos seguros?
¿Cómo se asegurará de que los colaboradores puedan acceder a sus datos de forma segura?
Si crea o recopila datos en el campo, ¿cómo garantizará su transferencia segura a sus principales sistemas seguros?
Notas
Adicionalmente, se debe indicar si los datos creados/recolectados son confidenciales o contienen información sensible (ejemplo: datos de personas, patentes, etc), se debe describir el modelo de seguridad y medidas asociadas (ISO 27001).
Debido a que algunos proyectos generan datos que con el tiempo pierden valor histórico debido a que cumplieron con la actividad para la que fueron creados, es importante indicar qué datos de los producidos por el proyecto deberán conservarse y cuáles serán descartados en el proceso de selección, también debe indicar el plan de preservación a largo plazo del proyecto para garantizar la disponibilidad y acceso de los datos.
Campo 6.1. Selección:Indique qué datos deben conservarse de acuerdo a su valor como validadores de los resultados del proyecto, soporte para una nueva investigación, etc.
Preguntas a considerar:
¿Qué datos deben conservarse/destruirse con fines contractuales, legales o reglamentarios?
¿Cómo decidirá qué otros datos conservar?
¿Cuáles son los usos de investigación previsibles para los datos?
¿Qué preparación (transformación) de los datos se requiere antes de archivarlos?
Notas
Este proceso también puede basarse en los términos de referencia u obligaciones vinculadas a los datos, viabilidad económica de su preservación, soporte tecnológico de los formatos de archivo usados para los datos, etc.
Exponga claramente las consideraciones que se deben tener en cuenta para conservar/destruir los datos generados y durante cuánto tiempo se deben retener antes de su eliminación.
Para establecer la importancia de la preservación, considere cómo se pueden reutilizar los datos y el valor potencial de reutilización y los costos del proceso de preservación (Por ejemplo: chequeo de la integridad, revisiones y ajustes periódicos, cambios de formatos de archivo)
Campo 6.2. Preservación a largo plazo: Considere y explique cuál será el plan de preservación y curaduría a largo plazo de los DataSets, esto incluye la preparación y la documentación de los datos para compartirlos y archivarlos.
Preguntas a considerar:
¿En qué repositorio o archivo se guardarán los datos?
¿Qué costos, si corresponde, cobrará el depósito o archivo de datos seleccionado?
¿Ha invertido tiempo y esfuerzo en preparar los datos para compartir/preservar?
¿Cuánto tiempo se conservarán los datos, cuál será el procedimiento de destrucción de los mismos una vez finalizado su ciclo de vida.
Notas
Se recomienda el uso de repositorios de datos estables para este propósito o demostrar los recursos y sistemas que dispondrán los datos para ser preservados y curados después de la finalización del proyecto.
En este apartado el investigador debe indicar cómo, cuándo y a través de qué mecanismos pondrá a disposición de los otros investigadores y otros actores interesados los datos creados y/o recolectados por el proyecto. En esta etapa es fundamental que se considere el sistema de información de publicación y acceso (repositorio de datos) donde se depositarán los datos teniendo en cuenta el tipo, complejidad, restricciones y área de conocimiento de los datos.
Campo 7.1. Compartir y divulgar los datos: bajo qué condiciones se compartirán, cómo encontrarán los usuarios los datos, cuándo estarán disponibles, obtendrán un identificador persistente, etc
Preguntas a considerar:
¿Cómo se enterarán los usuarios potenciales de la existencia de los datos creados?
¿Con quién compartirá los datos y bajo qué condiciones?
¿Compartirá datos a través de un repositorio, manejará las solicitudes directamente o utilizará otro mecanismo?
¿Cuándo se pondrán a disposición los datos?
¿Tendrán los datos identificadores persistentes?
¿Existen requisitos de los financiadores para que los datos estén disponibles abiertamente?
Notas
Se recomienda poner a disposición los datos de investigación en sistemas de información especializados (repositorios de datos) que permitan una adecuada gestión de los datos de investigación como Datasets y que vayan más allá de la simple publicación en páginas simples para su descarga.
Los métodos utilizados para compartir datos dependen de una serie de factores, como el tipo, el tamaño, la complejidad y la sensibilidad de los datos de investigación.
Debido a la complejidad que supone seleccionar el repositorio donde se almacenarán, preservarán y darán acceso a los datos de investigación, la heterogeneidad de los datos producidos en las diferentes áreas de conocimiento, así como los requisitos exigidos por las financiadores, existen servicios como los de Re3data, “un registro global de repositorios de datos de investigación que cubre repositorios de datos de investigación de diferentes áreas de conocimiento” (Registry of Research Data Repositories, 2022) El investigador podrá consultar los repositorios por tema, país, tipo de contenido, tipos de licencia, tipo de institución, entre otros: https://www.re3data.org/search.
Campo 7.2. Restricciones: Describa las potenciales restricciones al compartir sus datos con las causas y posibles soluciones. Las restricciones pueden derivarse de acuerdos de confidencialidad del proyecto, falta de acuerdos de consentimiento, derechos de propiedad intelectual, entre otros.
Preguntas a considerar:
¿Qué medidas tomará para superar o minimizar las restricciones?
¿Durante cuánto tiempo necesita el uso exclusivo de los datos y por qué?
¿Se requerirá un acuerdo de intercambio de datos (o equivalente)?
Notas
Las restricciones pueden deberse a la confidencialidad, la falta de acuerdos de consentimiento o los derechos de propiedad intelectual y se documentan en un acuerdo o licencia de acceso y uso de los datos de investigación.
Algunas restricciones son temporales de acuerdo con las políticas del ente financiador o del nivel de sensibilidad de los datos de investigación (períodos de embargo). En este caso se recomienda especificar las fechas de inicio y finalización de la restricción.
¶Área Temática 8. Responsabilidades y recursos necesarios
A partir de las necesidades identificadas en las secciones anteriores se le pide al investigador determinar los elementos que se requieren para que el plan pueda cumplirse tales como los roles y responsabilidades que asumirán los integrantes del proyecto, así como los recursos necesarios para efectuar el plan.
Campo 8.1. Gestión de datos: Describa los roles y responsabilidades asignados a los individuos y/o organizaciones vinculadas al proyecto relacionados con la captura de datos, la producción de metadatos, la calidad de los datos, almacenamiento y copias de seguridad.
Preguntas a considerar:
¿Quién es responsable de implementar el PGDI y garantizar que se evalúe y ajuste?
¿Quién será el responsable de cada actividad de gestión de datos?
¿Cómo se dividirán las responsabilidades entre los sitios asociados en los proyectos de investigación en colaboración?
¿La propiedad de los datos y las responsabilidades de la gestión de los datos de investigación serán parte de algún acuerdo de consorcio o contrato acordado entre los socios?
Notas
Indique con nombres y apellidos quién será el responsable de asegurar que se cumplan todas las políticas que deban aplicarse a los datos según su naturaleza.
Campo 8.2. Recursos necesarios: Realice una descripción detallada de los recursos necesarios tales como software, hardware, experiencia técnica, entre otros que se requieran para llevar a cabo el plan de gestión de datos.
Preguntas a considerar:
¿Se requiere experiencia especializada adicional (o capacitación para el personal existente)?
¿Requiere hardware o software adicional o excepcional a la provisión institucional existente?
¿Se aplicarán cargos por repositorios de datos?
Notas
Cada recurso que se incluya debe estar debidamente justificado.
Algunos recursos corresponden a gastos recurrentes que deben estar explícitamente indicados.
¶Modelo de Plantilla Plan de Gestión de Datos de Investigación - PGDI (propuesta)
A continuación se presenta un modelo de plantilla para el desarrollo de un Plan de Gestión de Datos de Investigación PGDI. Esta plantilla incluye ejemplos generales para su ingreso.:
1. Información administrativa y financiera
1.1. ID del proyecto
1.2. Institución responsable del proyecto
Nombre (Institución, Área, Departamento, etc..)
Identificador Normalizado
1.3. Institución Financiadora
Nombre (Institución, Área, Departamento, etc..)
Identificador Normalizado
Número de identificación de la financiación
Notas:
Indique el nombre del financiador y el programa específico (cuando aplique)
Desarrollo productivo y comercial de la panela en Cundinamarca
Trayectoria y reconocimiento de los filósofos Colombianos en el siglo XIX
1.5. Investigador Principal
Nombres y Apellidos
Identificador Normalizado
Rol
Ejemplo: Laureano Gómez (000-0003-3580-8766). Investigador principal
1.6. Datos de contacto del proyecto
Ejemplo:
Móvil: +5730056255556
Correo: lgomez@metabiblioteca.com
1.7. Fecha de la primera versión
Ejemplo:
Versión 1.0: 2022-01-01
1.8. Fecha de la última actualización
Ejemplo:
Versión 1. 2020-12-01
Versión 1.1 2021-01-30
Cambio Realizado 1
Cambio Realizado 2
Versión 3.
1.9. Marco normativo relacionado
Ejemplo:
Decreto 1377 de 2013. Reglamenta parcialmente la Ley 1581 de 2012 por la cual se dictan disposiciones generales para la protección de datos personales. Señala lo relacionado con el tratamiento de datos en el ámbito personal o doméstico, definiciones, autorización, políticas de tratamiento, ejercicio de los derechos de los titulares, transferencias internacionales de datos personales y responsabilidad demostrada frente al tratamiento de datos personales (https://www.funcionpublica.gov.co/eva/gestornormativo/norma.php?i=53646 ).
NTC 5654:2016. Especifica los requisitos generales de las bases de datos antropométricos, y de los informes asociados a ellas, formadas por mediciones efectuadas de acuerdo con lo indicado en la NTC 5649.
2. Adquisición (Creación/Recolección/Reutilización) de los datos
2.1. Tipo de datos a crear, recolectar y reutilizar
Ejemplo:
Se recopilará información de 50 municipios colombianos asociada a su fundación y crecimiento poblacional en el casco urbano y rural. También se realizarán entrevistas para explorar la relación entre el crecimiento poblacional y la percepción ciudadana en seguridad en los municipios seleccionados. El investigador asignará un seudónimo a los participantes para que no puedan ser identificados en las transcripciones para proteger los datos personales. Una lista que vincule a los participantes con sus seudónimos se almacenará electrónicamente como un archivo protegido con contraseña. Los datos cuantitativos se derivarán de los censos nacionales o municipales más actualizados para cada municipio, los cuales serán registrados electrónicamente en una hoja de cálculo (.xsls). Los archivos de Excel serán cargados en el programa estadístico SPSS para su análisis. Los archivos SPSS (.sav) se descargarán y guardarán junto con otros datos de investigación en la aplicación Dropbox para su ejecución conjunta con todos los participantes de la investigación. Los participantes serán entrevistados una vez con un máximo de 10 grabaciones de aproximadamente 60 minutos cada una, un total de 1200 minutos en total aproximadamente 1,2 GB de datos de la entrevista. Una vez transcrito y anonimizados, las grabaciones se eliminarán. Se utilizará la estructura de metadatos del estándar DC - Dublin Core para la descripción de los datos.
2.2. Metodología de creación, recolección y reutilización de los datos
Ejemplo:
Los datos serán recolectados a partir de los censos publicados desde 1965 para cada municipio hasta 2018 y serán analizados con métodos cualitativos como cuantitativos. Los datos de las entrevistas son requeridos puesto que no existe una fuente que genere datos sobre la percepción de seguridad en los municipios seleccionados. Los resultados de las entrevistas serán tabulados y registrados en el programa estadístico SPSS para su análisis.
Los datos se organizarán en carpetas y archivos separados para las diferentes etapas de la investigación. Se creará una carpeta principal denominada “Datos”. Dentro de esta carpeta se crearán carpetas separadas para cada tipo de datos: Población municipio1, Población municipio2, datos de transcripción así:
Fase_1-Diagnóstico
Fase_2-Recolección
Datos
Envigado_1965-2018
Medellin_1965-2018
Los datos bibliográficos de la producción académica se organizarán por carpetas con el nombre y apellido del profesor, los datos y metadatos se gestionará a través de un gestor de referencias y se generará en formato RIS para su reutilización en otros programas.
3. Documentación y descripción normalizada de los datos (Metadatos)
3.1 Documentación y metadatos que acompañan los datos
Ejemplo:
Los archivos se titularán con una descripción del dato que contienen, número de versión y fecha: Censos_Envigado-V2-2022. El investigador principal documentará los procedimientos y describirá los significados de las variables y códigos utilizados en la base de datos de los censos y las entrevistas. Esto asegurará que los datos de la investigación puedan ser utilizados por otros fuera del equipo del proyecto. Esta información se guardará en un archivo dentro de la carpeta de datos principal.
La geodatabase irá acompañada con un informe dedicado donde se explicará la estructura de archivos, la descripción del contenido de las carpetas y el sistema de indicadores para cada temática. La presentación y almacenamiento de los metadatos para cada una de las fuentes almacenadas se estructuró bajo los parámetros de la norma ISO 19115 de 2003
4. Ética y cumplimiento de requisitos legales
4.1. Consideraciones éticas (datos sensibles)
Ejemplo.
Esta investigación recopilará información personal (edad, género, identificación y datos de contacto), por lo que el proyecto ha considerado los criterios éticos y legales del almacenamiento de estos datos, así como la apropiada seguridad de los mismos de acuerdo a lo exigido por el marco normativo en esta materia (Decreto 1377 de 2013, Ley 1581 de 2012 y la NTC 5654:2016). Por esta razón todos los participantes deben estar de acuerdo con la recolección y preservación de sus datos, así como la posibilidad de compartirlos con los debidos procedimientos de anonimización a través de la firma de un consentimiento informado que se enviará a los participantes previo a la realización de las entrevistas. La investigación aplicará los criterios éticos de la Facultad de Historia de la Universidad. Esto también incluye el almacenamiento y tratamiento apropiado de los datos personales de los participantes.
4.2. Gestión de propiedad intelectual
Ejemplo.
La propiedad y titularidad del proyecto y los resultados del mismo pertenecen de forma exclusiva a la Universidad General sin que esto afecte los derechos morales de los autores de la investigación. La licencia autorizada por la Universidad es Reconocimiento-NoComercial-CompartirIgual CC BY-NC-SA https://creativecommons.org/licenses/by-nc-sa/4.0/
Según la cláusula décimo tercera del contrato de financiación aprobado por el Ministerio de Ciencia Tecnología e Innovación “…la titularidad sobre los resultados de investigación se regirá por lo establecido en el artículo 169 de la Ley 1955 de 2019 - Plan Nacional de Desarrollo: “Derechos de propiedad intelectual sobre resultados de programas y proyectos de Ciencia, Tecnología e innovación y de tecnologías de la información y las comunicaciones financiados con recursos públicos. En los casos de proyectos de investigación y desarrollo de ciencia, tecnología e innovación y de tecnologías de la información y las comunicaciones, adelantados con recursos públicos, el Estado como titular de los derechos de propiedad intelectual derivados de estos proyectos podrá ceder dichos derechos a través de la entidad financiadora, y autorizará su transferencia, comercialización y explotación a quien adelante y ejecute el proyecto, sin que ello le constituye daño patrimonial. ”(Departamento Administrativo de Ciencia, Tecnología e Innovación, Colciencias, 2019, p. 23)
5. Almacenamiento y copias de seguridad (Backup)
5.1. Copias de seguridad
Ejemplo.
El proyecto usará como principal unidad de almacenamiento el servidor dispuesto por la universidad para garantizar la seguridad de los datos, las copias de seguridad se realizarán quincenalmente y se subirán como adjunto a los informes de avance en el sistema de información para la investigación Hermes de la universidad. El Servidor cuenta con soporte para copias de seguridad automáticas cada mes.
El proyecto usará como unidad central de almacenamiento la carpeta dispuesta en la aplicación Dropbox, donde el investigador designado se encargará de llevar las copias de los productos de cada fase del proyecto. El investigador principal y el investigador designado serán los únicos con acceso a esta carpeta y serán los encargados de garantizar las copias de seguridad con una periodicidad quincenal o mensual según se requiera. Los productos del proyecto se depositarán en el repositorio institucional de acuerdo a las entregas de informes acordadas en el proyecto.
5.2. Seguridad y acceso de los datos
Ejemplo.
Todos los datos de investigación anónimos creados por el proyecto se depositarán en el repositorio de la Universidad. El repositorio preservará los datos de investigación en concordancia con los requisitos del financiador del proyecto. Los datos personales serán destruidos tres meses después de la finalización del estudio. Los datos del cuestionario se almacenarán electrónicamente en SPSS en archivos protegidos con contraseña.
6. Preservación de los datos
6.1. Selección
Ejemplo.
Teniendo en cuenta el valor histórico de los datos procesados y su contribución para la ejecución de nuevas investigaciones sobre la demografía urbana se conservarán los datos asociados a los municipios tales como fecha de fundación, número de habitantes por municipio en cada uno de los censos. Por otro lado, los datos personales serán destruidos tres meses después de la finalización del estudio
6.2. Preservación a largo plazo
Ejemplo.
Los datos estarán disponibles de forma indefinida en el repositorio de la universidad o en el repositorio designado por la institución que financia el proyecto.
7. Acceder y compartir datos
7.1. Compartir y divulgar los datos
Ejemplo.
En la etapa final del proyecto los datos serán almacenados en el repositorio de datos dispuesto por la universidad denominado Intellectum (https://intellectum.unisabana.edu.co/page/intellectum) el cual cuenta con servicios de conservación de datos, curaduría, migración a nuevos formatos y asignación de identificador único.
En la etapa final del proyecto se seleccionará el repositorio donde se alojarán los datos producto de esta investigación para garantizar el acceso a largo plazo a los resultados. Se seleccionarán repositorios que asignen un identificador específico (doi), que permitan el almacenamiento de datos espaciales según los límites de tamaño de archivo y que coincida con la licencia requerida para los datos.
Los datos producto de este proyecto de investigación contemplan las restricciones asociadas a la cláusula décimo cuarta del contrato de financiación donde especifica que los datos sensibles que se generen como resultado de esta investigación deben ser protegidos de acuerdo a la normatividad vigente para este caso
8. Responsabilidades y recursos necesarios
8.1. Gestión de datos
Ejemplo.
El proyecto contará con la participación de cuatro investigadores y dos asistentes de investigación. El investigador principal se encargará de coordinar las actividades del proyecto de acuerdo al objetivo y alcance del mismo. Tres investigadores estarán a cargo de realizar el levantamiento de información en las alcaldías de los municipios con el acompañamiento de los dos asistentes de investigación quienes serán los encargados de registrar los datos, realizar las relatorías y grabar las entrevistas. En la fase dos del proyecto los investigadores serán los encargados de analizar las variables definidas en el proyecto.
8.2. Recursos necesarios
Ejemplo.
Para la ejecución de este proyecto se requiere de una plataforma en línea para el almacenamiento de información como Dropbox, OneDrive, entre otros con el objetivo de almacenar las copias de seguridad en cada fase del proyecto. Dada la necesidades de almacenamiento es posible que se requiera el pago adicional de este servicio para acceder a una mayor capacidad de almacenamiento. También se necesitará una licencia del software Atlas.Ti para realizar el análisis hermenéutico de las variables que se identifiquen en las entrevistas.
Consorcio de Universidades de la Comunidad de Madrid y de la UNED para la Cooperación Bibliotecaria, Madroño. (2020). European Commission (H2020): Horizon 2020 DMP - Initial DMP. https://pgd.consorciomadrono.es/public_templates
Departamento Administrativo de Ciencia, Tecnología e Innovación, Colciencias. (2019). Convocatoria conectando conocimiento 2019 N852. Términos de referencia. https://minciencias.gov.co/convocatorias/investigacion-mentalidad-y-cultura/convocatoria-conectando-conocimiento-2019
Digital Curation Centre, DCC. (2013). Checklist for a Data Management Plan. V.4.0. Digital Curation Centre. http://www.dcc.ac.uk/resources/data-management-plans
Donnelly, M., Jones, S., & Pattenden-Fail, J. W. (2010). DMP Online: The Digital Curation Centre’s Web-based Tool for Creating, Maintaining and Exporting Data Management Plans. International Journal of Digital Curation, 5(1), 187–193. https://doi.org/10.2218/ijdc.v5i1.152
Gajbe, S. B., Tiwari, A., Gopalji, & Singh, R. K. (2021). Evaluation and analysis of Data Management Plan tools: A parametric approach. Information Processing & Management, 58(3), 102480. https://doi.org/10.1016/j.ipm.2020.102480
Parthenos. (s/f). DMP Researcher Template for Archaeological Datasets. Recuperado el 4 de marzo de 2022, de http://www.parthenos-project.eu/wp-content/uploads/2019/10/DMP-Researcher-Template-for-Archaeological-Datasets.pdf
Registry of Research Data Repositories. (2022). About re3data. https://www.re3data.org/aboutStanford University. Libraries. (2011).
Data Management Plan Self-Assessment Questionnaire . https://stanford.box.com/shared/static/v4rmjm0jimkwvziqlxmv.pdf