Investiga I+D+i

Noticias:

Puedes conocer mejor el Programa en www.programainvestiga.org

¡Preguntas al Experto!

¡Preguntas al Experto!
« en: 24 Noviembre , 2021, 12:43:26 pm »
¡Hola a tod@s!

En los próximos días se cerrará el plazo de inscripción de participantes y empezaremos a ver más preguntas y participación el foro.

Recordad que:
- La participación se valora y es clave para absorber conocimiento
- La fecha de entrega de las introducciones es el día 21 de enero.

En este hilo podéis realizar preguntas al experto de vuestra línea de investigación, que responderán vuestras preguntas técnicas de la investigación.

Un saludo,
Josep Maria Salvia

Re:¡Preguntas al Experto!
« Respuesta #1 en: 20 Diciembre , 2021, 11:39:29 am »
holaa!!
soy Jimena y a la hora de investigar quise buscar fuentes de open data, como las que se encuentran y describen en la guía, pero resulta difícil encontrarlas. Me fijo en los parámetros y características que dice el punto 1, pero es cierto que muchos no llegan a cumplir todas esas características, como también se menciona. Mi pregunta es si actualmente existe un lugar web o página en la que encontrar fuentes de open data exclusivamente, o la única manera de acceso es buscando a través de buscadores básicos como Google o Mozilla, y fijándose en si es o no open data.
Graciaasss!!

Re:¡Preguntas al Experto!
« Respuesta #2 en: 21 Diciembre , 2021, 11:39:17 am »
¡Hola Jimena! Soy Iván, experto de esta línea, encantado de saludarte. ¡Muchas gracias por el interés y por romper el hielo en la línea del experto con tu primer mensaje!

Efectivamente, actualmente la mayoría de fuentes de "datos abiertos" (y entrecomillo exactamente por lo que comentas) chocan siempre con alguno de los principios del Open Data que se muestran en el primer punto de la Guía Introductoria. En particular, suele suceder que los puntos 4., Accesibilidad, y 6., Libre Descarga, no están asegurados por trabas al descargar los datos (regístrate en tal sitio, acepta estos términos, etc.). Además, muchas veces también se les termina limitando el uso a esos datos mediante diferentes licencias; una palabra que ya de base rompe con la idea de "abiertos".

Todo esto lo contamos para que no os agobiéis si veis que la gran parte de fuentes de datos que buscáis no congenian con todos y cada uno de los principios del Open Data, ¡es normal, de hecho! (muy a nuestro pesar...). Así que no os ofusquéis en ellos: podéis conformaros perfectamente con datos que permitan su uso para actividades, a lo menos, académicas, y en los que quizá os pidan un registro gratuito; aunque cuanto más abiertos sean los datos (es decir, menos trabas os pongan para utilizarlos), mejor.

Respondiendo a la pregunta particular, Jimena, existen sitios web en los que la totalidad, o gran mayoría de sus datos, son Datos Abiertos que cumplen con los 8 principios. Algunos de los ejemplos que listamos en el punto 8. de la Guía, como la Iniciativa de Datos Abiertos del Gobierno de España (https://datos.gob.es/) son de esos. El objetivo del trabajo de investigación, al final, es encontrar más sitios web de ese estilo, y averiguar si los datos que contienen son Datos Abiertos. Para ello, como bien has dicho, lo mejor es investigar a través de vuestro navegador web favorito, Google Chrome, Mozilla, etc., y hacer búsquedas en Google (¡o mejor!, incluso "Google Data set search", como os mostramos en la Guía, https://datasetsearch.research.google.com/).

Una vez tengáis un pequeño catálogo de estas fuentes de datos abiertos, la siguiente fase será decidir cuáles utilizamos para la investigación. Pero quizá esté ya adelantando acontecimientos, así que espero haber respondido tu duda con esta respuesta.

¡Saludos, y mucho ánimo!

Re:¡Preguntas al Experto!
« Respuesta #3 en: 04 Enero , 2022, 11:14:29 am »
¡Buenos días!
Buscando información a cerca de la parte práctica del trabajo, me han surgido dos dudas.
La primera pregunta es sobre importar y exportar datos (en Pyhton) de una base abierta.
Por lo que he leído, una opción para exportar datos estructurados con lenguaje de Python es importarlos a Jupyter Notebook y desde ahí llevar a cabo el análisis. Sin embargo, también hay veces que los exportan primero a Excel y después a Jupyter Notebook. Por lo que mi pregunta es: ¿En que casos se tienen que exportar directamente Jupyter Notebook y en cuáles se deben exportar primero a Excel y luego ya a Jupyter?
La segunda pregunta es sobre qué herramienta usar para realizar un análisis de datos abiertos. He leído que a parte de Jupyter Notebook también existe la librería Pandas de Python que resulta ser muy útil para este tipo de análisis, no obstante, no me queda claro cuál de las dos es mejor y por lo tanto, con cuál se debe trabajar para llevar a cabo el proyecto de análisis.
Muchas gracias,
María

Re:¡Preguntas al Experto!
« Respuesta #4 en: 18 Enero , 2022, 17:47:53 pm »
¡Buenas tardes! Soy Elisa, experta en en esta línea. Encantada de saludarte

Los notebooks de Jupyter son un entorno de trabajo, muy útiles para ir ejecutando el código por partes e ir viendo los outputs de manera ordenada, ya sea imprimiendo cosas o dibujando gráficos.

Te respondo primero a la segunda pregunta. Pandas es una librería de python que te permite utilizar ciertas funciones. Se usa mucho para el análisis de datos porque permite crear unos objetos llamados Dataframes que son como tablas y que permiten analizar los datos fácilmente. Una vez tengas un Dataframe con tus datos, Pandas te permitirá usar funciones para calcular medias y otros estadísticos, así como hacer sumas y otros cálculos. Como Jupyter Notebooks es un entorno de ejecución de código, tendrías que cargar la librería de Pandas en tu notebook con import pandas as pd y a partir de ahí podrías utilizar las funciones de pandas en tu notebook.

Respecto a lo segundo, desde el notebook de Jupyter tendrías que cargar el fichero con el que quieras trabajar. Lo que se suele hacer es añadir el fichero de datos en formato Excel o .csv a la misma carpeta en la que está tu notebook (el notebook es un fichero de tipo .ipynb) y luego cargarlo mediante código con una función de Pandas. Si haces df = pd.read_excel('fichero1.xlsx'), tendrás los datos del fichero Excel fichero1.xlsx en un Dataframe de Pandas y podrás empezar a analizarlos.
Espero que te sea útil , disculpa el retraso que la vuelta de vacaciones hemos tenido muchas cosas pendientes
Un abrazo Elisa

Re:¡Preguntas al Experto!
« Respuesta #5 en: 18 Enero , 2022, 18:48:21 pm »
¡Buenas tardes!

Por lo que he leido aquí, la principal idea del trabajo es encontrar páginas de las que se puedan sacar datos abiertos que cumplan las características mencionadas en la introducción al tema. Ese es uno de los puntos que tengo intencion de realizar en mi trabajo, pero tras leer sobre el tema, los datos abiertos se suelen utilizar (en el caso de la medicina) para almacenar datos de pacientes anónimos con fines de realizar estudios.

La introducción proporcionada para el trabajo habla de inteligencias artificiales y como estas pueden aplicarse al tema, por lo que me he planteado la opción de desarrollar un programa que lea y saque conclusiones sobre datos abiertos de medicina como otro de los puntos de mi trabajo. Esto ha hecho que me surja la duda de si eso se valoraría positivamente al entregar el trabajo, ya que aunque adoro todo lo relacionado con programación, es un proyecto entretenido de hacer y no se si se valorará tanto como para que merezca la pena desarrollarlo y dedicarle tanto tiempo. Asi que, ¿usted qué opina?

Re:¡Preguntas al Experto!
« Respuesta #6 en: 18 Enero , 2022, 22:41:55 pm »
¡Buenas noches Javier!
Si la primera parte del trabajo es exactamente lo indicas. Buscar fuentes de datos abiertas que tenga que ver con temas de medicina y entre ellos pueden ser datos de pacientes asociados a enfermedades concretas.

La idea es que esto os sirva de base para luego desarrollar un análisis sobre esos datos y aplicar tecnicas de ML si es adecuado pero esto último lo estabamos pensando más para los que al final tengais la oportunidad de pasar una semana con nosotros.

Mi recomendación es que hagas la investigación de los datos y que acometas un  análisis de los mismos y que plantees un escenario teórico de predicción que puedas abordar si al final pasa las dos semanas con nosotros.




Re:¡Preguntas al Experto!
« Respuesta #7 en: 19 Enero , 2022, 09:48:39 am »
Hola,
Soy alumna del Colegio Altozano quiero enfocar mi trabajo en saber cómo y qué protocolo existen en los hospitales para clasificar los datos de los pacientes. Me gustaría empezar por el Hospital General de Alicante, sin embargo no se a quién debo preguntar. Usted me podría orientar?
Un saludo
María

Re:¡Preguntas al Experto!
« Respuesta #8 en: 20 Febrero , 2022, 17:23:27 pm »
¡Buenas tardes!
Estoy intentando realizar un análisis de datos mediante un notebook de Jupyterlab y al cargar los datos al programa no tengo ningún problema, sin embargo, cuando creo un encabezado con dichos datos y comienzo a analizarlos, la mayoría de datos no se muestran, si no que aparece la palabra NaN. He intentado solucionarlo de diversas maneras, pero no consigo que me aparezcan los datos. Agradecería si conocéis alguna solución para arreglarlo.
Muchas gracias y un saludo.
María


Re:¡Preguntas al Experto!
« Respuesta #9 en: 21 Febrero , 2022, 13:40:42 pm »
¡Buenas tardes!
Estoy intentando realizar un análisis de datos mediante un notebook de Jupyterlab y al cargar los datos al programa no tengo ningún problema, sin embargo, cuando creo un encabezado con dichos datos y comienzo a analizarlos, la mayoría de datos no se muestran, si no que aparece la palabra NaN. He intentado solucionarlo de diversas maneras, pero no consigo que me aparezcan los datos. Agradecería si conocéis alguna solución para arreglarlo.
Muchas gracias y un saludo.
María
¡Hola María! Para analizar tu problema necesitaría saber qué fichero de datos estás cargando al Notebook y qué código ejecutas dentro de él. Es posible que existan de verdad datos faltantes (que es lo que viene a decir "NaN") o que hayas hecho alguna transformación que provoque que se borren. ¡Saludos!

Re:¡Preguntas al Experto!
« Respuesta #10 en: 27 Febrero , 2022, 10:14:28 am »
Hola, soy Ane.

Desde que empecé a escribir en el foro y a leer mensajes, me he encontrado con algunos que hablan sobre analizar datos de los servicios de salud, pero yo no me estoy enfocando en eso. Mi duda es, ¿debería enfocarme en analizar datos? Porque es verdad que sale en la guía introductoria y que es una de las finalidades del proyecto.

Gracias.

Re:¡Preguntas al Experto!
« Respuesta #11 en: 28 Febrero , 2022, 12:08:31 pm »
Hola, soy Ane.

Desde que empecé a escribir en el foro y a leer mensajes, me he encontrado con algunos que hablan sobre analizar datos de los servicios de salud, pero yo no me estoy enfocando en eso. Mi duda es, ¿debería enfocarme en analizar datos? Porque es verdad que sale en la guía introductoria y que es una de las finalidades del proyecto.

Gracias.
¡Hola Ane!

Ciertamente el objeto principal del trabajo es el análisis de datos abiertos que estén relacionados con salud. Sobre todo buscamos que trabajéis con los ficheros CSV y de demás formatos que hemos introducido en la guía, con el lenguaje de programación Python. El objetivo final del trabajo es que, por un lado, os introduzcáis a la programación con este lenguaje y, por el otro, realicéis un trabajo de investigación relacionado con la salud o sus servicios, basado en un análisis de unos datos abiertos para estos fines.

Dentro de que utilicéis Python (o incluso otro lenguaje, si lo manejarais y sirviera al propósito) para realizar vuestro análisis y un set de datos abiertos que tengan que ver en algo con la salud o sus instalaciones, podéis orientar la investigación como gustéis. Pero el requisito es ese: programación y datos abiertos de salud, que es lo que buscamos que aprendáis a manejar.

¡Saludos!