Actividades formativas de Doctorado de la Universidad de Cádiz
 
8211B02_004

Gestión (eficaz), análisis y visualización de datos científicos en R

Organiza: Programa de doctorado Recursos Marinos

Inscripción en: https://posgrado.uca.es/doctor
(en este momento no hay plazo abierto para inscripción en este curso)

Coordinación:
Dra. Dª. REMEDIOS CABRERA CASTRO
Plazas ofertadas por grupo: 15
Duración: 32 horas (10 h. presenciales)
Modalidad: Mixta (Presencial + virtual)    Idioma: Español

Lugar de impartición: Aulas de informática 1 y 2 Facultad de Ciencias
Campus de Puerto Real
Precio de matrícula de este curso: 13.68 euros


Destinatarios
Alumnos programas de doctorado de EIDEMAR


Descripción general

El curso se articula en base al ciclo de vida de los datos científicos, desde la planificación de gestión de datos hasta su difusión y almacenamiento. El curso se basa además en los principios de eficiencia, organización, reproducibilidad y open-access. Durante su desarrollo se introducirán y desarrollarán técnicas multivariantes de uso más habitual en las áreas temáticas en el que se enmarca el curso.



Objetivos

Proporcionar conocimientos y herramientas para una mayor eficiencia en la adquisición, gestión, análisis y visualización de datos usando el lenguaje de programación R, script y R-Studio.

 



Contenidos

1. Introducción al ciclo de vida de datos científicos y a la ciencia reproducible.
2. Planificación de gestión y adquisición de datos. Bases de datos.
3. Organización y descripción de datos. Estructuras de datos en R.
4. Gestión y procesado de datos con R.
5. Introducción a R y R-Studio.
6. Importación y estructura de datos.
7. Re-configuración de datos.
8. Visualización de datos en R con ggplot. Paquete vegan.
9. Análisis exploratorio de datos.
10. Análisis estadístico básico.
11. Técnicas multivariantes.
12. Comunicación de resultados con R-Markdown.
13. Almacenamiento y preservación de datos y scripts.
14. Difundir, compartir y reutilizar datos.
15. Proyecto de evaluación.



Competencias básicas y capacidades

1. Aumentar los conocimientos y herramientas necesarias para una mayor calidad y reproducibilidad de los datos científicos.
2. Planificar la adquisición y gestión eficiente de datos científicos.
3. Conocer las herramientas básicas del lenguaje de programación en R para la gestión, procesado y representación de datos (para poder continuar el aprendizaje de forma autodidacta).
4. Elaborar informes de análisis de datos usando R-Markdown.
5. Conocer herramientas que permiten dar mayor visibilidad a los datos científicos.
6. Adquirir buenas prácticas en el almacenamiento y al compartir datos científicos.
7. Conocer y manejar las técnicas multivariantes más apropiadas en los campos de las ciencias marinas.



Metodología

- Presentación de conceptos teóricos y recursos de gestión y análisis.
- Presentación de los problemas y errores más comunes en cada punto del programa y cómo evitarlos o resolverlos.
- Exposición de ejemplos prácticos a resolver en el aula.
- Aplicación práctica de los conceptos aprendidos en el proyecto para la evaluación (preferiblemente con datos reales).
- Presentación de procedimientos multivariantes que permitan cubrir distintos objetivos sobre un conjunto de datos.



Sistema de evaluación

Realización de un proyecto de organización y análisis de datos científicos, a realizar parcialmente durante las clases presenciales y durante sesiones de trabajo individual (estimadas en 7 h). Sugerencia: trabajar con datos científicos reales (en el caso de investigadores en activo) para darle una mayor aplicabilidad al curso.



Bibliografía

- Griffin, P. C., Khadake, J., LeMay, K. S., Lewis, S. E., Orchard, S., Pask, A., ... & Treloar, A. (2017). Best practice data life cycle approaches for the life sciences. F1000Research, 6.
- Peña, D. (2002) Análisis de datos multivariantes, McGrawHill.
- R-Markdown site. http://rmarkdown.rstudio.com/
- Teetor, P. (2011). R Cookbook: Proven recipes for data analysis, statistics, and graphics. O'Reilly Media, Inc.
- Wickham, H. (2016). ggplot2: elegant graphics for data analysis. Springer.



Programación - Edición 1 (14-05-2018 a 25-05-2018)
14-05-2018 a 14-05-2018 16.00-18.30 Aula de Informática 1
15-05-2018 a 15-05-2018 16.00-18.30 Aula de Informática 1
16-05-2018 a 16-05-2018 10.00-12.30 Aula de Informática 2
16-05-2018 a 16-05-2018 16.00-18.30 Aula de informática 1
17-05-2018 a 17-05-2018 11.30-14.00 Aula de Informática 1
21-05-2018 a 21-05-2018 16.00-18.30 Aula de informática 1
22-05-2018 a 22-05-2018 16.00-18.30 Aula de Informática 1
23-05-2018 a 23-05-2018 9.30-12.00 Aula de Informática 2
24-05-2018 a 24-05-2018 11.30-14.00 Aula de Informática 1
25-05-2018 a 25-05-2018 10.00-12.30 Aula de Informática 1


Información adicional

Para hacer el curso realmente de interés y aplicabilidad, el contenido será ajustado en la mayor medida posible a los  intereses y conocimientos previos de los asistentes. Para tal efecto, se enviará una encuesta online a los inscritos para  sondear aspectos como área de investigación, conocimientos previos de R, tipo de datos que usan (series temporales, datos  de experimentos factoriales, datos procedentes de instrumentos de medidas, etc), qué tipo de gráficos usan, etc.

Antes del inicio del curso se enviarán unas instrucciones para la instalación de R y R-Studio (para que las versiones sean las mismas en todos los asistentes).

Aunque se reservará un aula de informática adecuada es aconsejable llevar ordenador  (Mac o PC) propio a las clases,  con batería (y cargador), y con conexión a la red wi-fi de la Universidad de Cádiz.