Sobre DACyTAr

Compartir en
redes sociales

DACyTAr es el portal de que te permite, de forma centralizada, buscar y acceder a todos los conjuntos de datos primarios de investigación disponibles en acceso abierto a través de los repositorios digitales institucionales que integran el Sistema Nacional de Repositorios Digitales (SNRD).

DACyTAr se encuadra en la Ley No. 26.899 y su reglamentación que exigen, a los organismos e instituciones públicas que componen el Sistema Nacional de Ciencia, Tecnología e Innovación (SNCTI) y que reciben financiamiento del Estado nacional, a hacer disponible en Acceso Abierto a través de repositorios digitales interoperables, la producción científico-tecnológica resultante del trabajo, formación y/o proyectos, financiados total o parcialmente con fondos públicos, de sus investigadoras/res, tecnólogas/os, docentes, becarias/os de posdoctorado y estudiantes de maestría y doctorado. Esa producción científico-tecnológica abarca tanto al conjunto de documentos (artículos de revistas, trabajos técnico-científicos, tesis académicas, entre otros) como también a los datos primarios de investigación que son el resultado de actividades de investigación. A su vez, la normativa requiere a las instituciones que definan sus "Políticas Institucionales de Acceso Abierto" según los requisitos establecidos en la reglamentación y el modelo del plan de gestión de datos que debe usar su comunidad científica.

Este portal es producto del cumplimiento de los estándares y protocolos de interoperabilidad establecidos por el SNRD siguiendo pautas y acuerdos internacionales. Estos estándares, permiten que los repositorios institucionales se comuniquen entre sí y se integren a redes de repositorios y/o portales como DACyTAr o SNRD. Asimismo, se promueven los Principios FAIR como una forma de producir, gestionar y compartir datos científicos.

¿Qué es el Acceso Abierto?

El modelo de Acceso Abierto a la producción científico-tecnológica implica que los usuarios de este tipo de material pueden, en forma gratuita y accesible, leer, descargar, copiar, distribuir, imprimir, buscar o enlazar los textos completos de los artículos científicos, y usarlos con propósitos legítimos ligados a la investigación científica, a la educación, a la gestión de políticas públicas, al desarrollo tecnológico y a la innovación sin otras barreras económicas, legales o técnicas que las que suponga Internet en sí misma.

La única condición que plantea este modelo para la reproducción y distribución de las obras que se pongan a disposición es la obligación de otorgar a los autores el control sobre la integridad de su trabajo y el derecho a ser adecuadamente reconocidos y citados.

¿Qué son los repositorios digitales?

Son colecciones digitales de la producción científico-tecnológica de una institución o temática, en la que se permite la búsqueda y la recuperación para su posterior uso nacional e internacional. Están desarrollados con softwares específicos y contienen mecanismos para importar, identificar, almacenar, preservar, recuperar y exportar esta colección digital, normalmente desde un portal web. Sus contenidos (objetos digitales) son descriptos mediantes etiquetas que facilitan su recuperación. A su vez, los repositorios digitales, son abiertos e interactivos, ya que cumplen con protocolos internacionales que permiten la interoperabilidad entre ellos. Los repositorios pueden clasificarse, entre otras opciones, de acuerdo a la situación institucional, en propios o compartidos y, según sus contenidos, en repositorios de datos, de publicaciones, mixtos y/o temáticos. Los repositorios no exigen a sus usuarios un registro o su pertenencia a la institución.

¿Qué son los datos primarios de investigación?

En este contexto, se entiende por dato primario de investigación a todos aquellos datos en bruto sobre los que se basa cualquier investigación y que pueden ser o no ser publicados cuando se comunica un avance científico, pero que son los que fundamentan un nuevo conocimiento. Los conjuntos de datos primarios de investigación, son colecciones de datos codificados en una estructura definida, como ser listas, tablas, bases de datos, etc., que generalmente puede ser leída por sistemas automatizados.

Se pueden clasificar en observacionales, experimentales o computacionales. Por ejemplo: registros numéricos, registros textuales, imágenes y/o sonidos, modelados computacionales, que la comunidad científica genera en el marco de sus proyectos de investigación, y que son comúnmente aceptados para validar los resultados de la investigación.

Se excluyen: anotaciones de laboratorio, análisis preliminares, objetos físicos (cartas, inventarios, muestras, cepas de bacterias, animales de ensayo, vasijas, especímenes, etc.).

¿Cómo hago para que mis conjuntos de datos estén disponibles en DACyTAr?

Simplemente tenés que depositarlos en el repositorio de tu institución. A medida que las instituciones se vayan adecuando a la normativa, los repositorios van a ir apareciendo aquí para que puedas contactarte y compartir tus datos.

¿Por qué es importante subir mis datos?

Porque la disponibilidad pública de los datos primarios de investigación, entre otras cuestiones, permite validar los resultados publicados de las investigaciones, fomenta la colaboración, evita la duplicación de esfuerzos al permitir la reutilización de los datos disponibles, acelera la innovación, mejora la transparencia del proceso científico y, además, es una obligación que establece la normativa vigente a nivel nacional.

¿Cuáles son los plazos que establece la Ley No. 26.899? ¿Hay excepciones?

De acuerdo a la Ley 26.899 y su reglamentación, los datos primarios de investigación deberían estar disponibles en acceso abierto a través de los repositorios digitales institucionales en un plazo no mayor a los 5 años a partir del momento de su recolección. No obstante, se prevén excepciones para aquellos casos en que los datos:

deban protegerse y mantenerse en confidencialidad por cuestiones de propiedad industrial;
hayan sido generados en el marco de acuerdos previos con terceros que hubieran cofinanciado la investigación y se hubiesen acordado plazos diferentes para su disponibilidad pública;
sean de carácter sensible, pudieran afectar la privacidad de las personas, atentar contra especies protegidas o contra cuestiones de seguridad nacional;
poniéndose en acceso abierto pudieran afectar los ingresos de las autoras y autores y/o sus instituciones.

Además, será importante que anonimices aquellas variables que no deban difundirse como los datos personales o la ubicación de especies protegidas.

Estas excepciones, para ser utilizadas, deben ser contempladas en las políticas institucionales de cada uno de los organismos alcanzados por la ley.

¿Cómo se protegen los derechos de autor?

Los conjuntos de datos en los repositorios son acompañados por una serie de etiquetas (“metadatos”) que los describen. Hay metadatos específicos que mencionan a las autoras y autores y a sus instituciones de filiación otorgando así el reconocimiento correspondiente.

Además, mediante el uso de licencias del tipo copyleft, por ejemplo las Creative Commons https://creativecommons.org/choose/?lang=es_AR, se indican cuáles so n los permisos que los autores brindan sobre sus obras. De este modo, podés indicar si querés que se hagan obras derivadas (por ejemplo, una traducción de la información), si permitís que otros hagan un uso comercial de tus datos, entre otros ejemplos. Eso sí, siempre que usen tus datos de acuerdo a la licencia que elijas, deberán citarte y darte el debido reconocimiento. Contactate con tu repositorio para asesorarte al respecto.

¿Qué es un Plan de Gestión de Datos (PGD)?

Es un documento elaborado por el/la investigador/a o grupo(s) de investigación, que se desarrolla al inicio de un proyecto de investigación pero que evoluciona durante la vida útil del proyecto. Describe el tratamiento que recibirán los datos durante y después de un proyecto de investigación. La Ley 26.899 y su reglamentación, exigen a las instituciones que proporcionen herramientas que permitan a sus investigadores/as elaborar sus PGD.

Un PGD debe considerar el registro de los siguientes elementos, como mínimo, para una buena descripción, difusión y accesibilidad de los datos:

Autoría;
Identificación del proyecto de investigación;
Identificación de la agencia u organismo de financiamiento que financia la investigación;
Tipología de los datos que se van a generar y recopilar durante el proyecto;
Referencia, nombre del conjunto de datos e identificador único;
Estándares que se van a usar;
Descripción general del conjunto de: origen; naturaleza; escalas y métricas utilizadas; volumen de los datos; usuarias y usuarios potenciales; palabras clave; idioma/s; fechas o períodos relevantes; cobertura geográfica; metodología de colecta o generación; procesamiento; datos asociados; extensiones de archivo y formato; estructura/organización de los datos; lista de variables; glosarios de códigos y abreviaturas utilizados; enlace a las publicaciones científicas (preferentemente el enlace al o a los repositorios que estos datos respaldan; información sobre si existen o no datos similares, y las posibilidades de su integración y reutilización; volumen; datos de versiones;
Cómo van a ser compartidos/accesibles los datos para que la comunidad científica y académica pueda verificarlos, reutilizarlos, redistribuirlos, etc. En qué repositorio(s) se alojarán los conjuntos de datos generados y recopilados, períodos de embargo, software necesario y otras herramientas que permitan reutilizarlos;
Condiciones de acceso (licencias de uso);
Excepciones si aplican;
Medidas de conservación y preservación que se tomarán durante el proyecto y previamente a su depósito en el repositorio;
Costos asociados.

Las/los investigadoras/es deben utilizar los PGD que les proporcionen sus instituciones de filiación.

¿Qué son los Principios FAIR?

Conocidos así por la sigla en inglés de FINDABLE, ACCESIBLE, INTEROPERABLE y REUSABLE, se trata de una guía para aquellos que deseen mejorar la reutilización de los datos de investigación. Los Principios FAIR ponen énfasis en mejorar la capacidad de las máquinas para encontrar y utilizar automáticamente los datos, además de apoyar su reutilización por parte de las personas.

Estos principios dicen que los datos deben ser:

Encontrables (findable): los datos y metadatos pueden ser encontrados por la comunidad después de su publicación, mediante herramientas de búsqueda. Bajo este principio se recomienda:

F1. Asignar un identificador único y persistente a los datos y los metadatos.
F2. Describir los datos con metadatos de manera prolija.
F3. Registrar/Indexar los datos y los metadatos en un recurso de búsqueda.
F4. Especificar en los metadatos el identificador de los datos que se describen.

Accesibles (accesible): los datos y metadatos están accesibles y por ello pueden ser descargados por colegas utilizando sus identificadores. Bajo este principio se recomienda que:

A1. Los datos y los metadatos puedan ser recuperados por sus identificadores mediante protocolos estandarizados de comunicación.
A1.1. Los protocolos sean abiertos, gratuitos e implementados universalmente.
A1.2. El protocolo permita procedimientos para la autentificación y la autorización (si fuera necesario).
A2. Los metadatos estén accesibles, incluso cuando los datos aún no estuviesen disponibles.

Interoperables (interoperables): tanto los datos como los metadatos deben ser descriptos siguiendo las reglas de la comunidad, utilizando estándares abiertos, para permitir su intercambio y reutilización. Bajo este principio se recomienda que:

I1. Los datos y los metadatos usen un lenguaje formal, accesible, compartible y ampliamente aplicable para representar el conocimiento.
I2. Los datos y los metadatos usen vocabularios que sigan los principios FAIR.
I3. Los datos y los metadatos incluyan referencias cualificadas a otros datos o metadatos.

Reutilizables (reusable) los datos y los metadatos pueden ser reutilizados por colegas, al quedar clara su procedencia y las condiciones de reutilización. Bajo este principio se recomienda que:

R1. Los datos y los metadatos contengan una multitud de atributos precisos y relevantes.
R1.1. Los datos y los metadatos se publiquen con una licencia clara y accesible sobre su uso y reutilización.
R1.2. Los datos y los metadatos se asocien con información sobre su procedencia.
R1.3. Los datos y los metadatos sigan los estándares relevantes que usa la comunidad del dominio concreto.

DACyTAr