¿CÓMO SE REALIZA UN PROYECTO DE INVESTIGACIÓN EN ECONOMÍA? (III) - Canal Hablamos

NUEVO

27 junio 2017

¿CÓMO SE REALIZA UN PROYECTO DE INVESTIGACIÓN EN ECONOMÍA? (III)


Este es el tercer capítulo de la serie ¿Cómo se realiza un proyecto de investigación en Economía?. Para leer los capítulos anteriores, pincha en los enlaces siguientes:
3er PASO: ESCOGE LOS DATOS QUE NECESITAS
Buscar los datos que vas a emplear en tu trabajo puede ser una tarea gratificante y excitante, aunque también frustrante algunas veces. Después de haber planteado la pregunta en torno a la que gira tu proyecto y revisar la literatura relacionada, sabrás qué tipo de información necesitas y qué variables te interesan. Pero aparte del contenido de los datos, debes tener en cuenta la forma en la que estos aparecen presentados. En este sentido, los tipos de datos más comunes son:
  • Datos de corte transversal o sección cruzada: conjunto de observaciones correspondientes a un mismo periodo de tiempo. Una muestra de países de la OCDE con su PIB, gasto en educación y nota obtenida en los exámenes PISA en 2016 conformaría una sección cruzada.
  • Series temporales: lista de los valores tomados a lo largo del tiempo por una variable correspondiente a un sujeto. La lista de las notas de España en los exámenes PISA entre 2000 y 2016 sería una serie temporal.
  • Cortes transversales combinados: combinación de secciones cruzadas correspondientes a momentos distintos. Combinaríamos dos cortes transversales si, por ejemplo, reunimos las notas obtenidas en los exámenes PISA por los alumnos españoles en 2000 con las notas de 2016. Se trata de cortes transversales distintos, ya que los alumnos que hicieron los exámenes en 2000 no son los mismos que los de 2016.
  • Datos de panel: resultado de combinar series temporales correspondientes a los miembros de una sección cruzada. Si tuviéramos el PIB, el gasto en educación y la nota obtenida en los exámenes PISA de los países de la OCDE entre 2000 y 2016, estaríamos frente a un panel. La diferencia con una combinación de cortes transversales reside en que en un panel sí observamos a los mismos individuos en todos los periodos de tiempo.
Necesitarás un tipo de datos u otro dependiendo de la dirección que quieras tomar en tu análisis. Por ejemplo, para responder preguntas a nivel individual o familiar, a menudo basta con datos de corte transversal. De hecho, este tipo de datos son muy frecuentes en campos relacionados con la microeconomía aplicada, como economía del trabajo, organización industrial o economía de la salud. En cambio, a la hora de estudiar agregados macroeconómicos como el PIB u otras variables donde los hechos que ocurrieron en el pasado pueden influir sobre el futuro, se suelen emplear series temporales.

Otro de los aspectos más importantes que debes tener en cuenta a la hora de escoger tus datos es que estos te permitan hacer un análisis ceteris paribus convincente. Dicho de otro modo, se trata de que cuentes con datos sobre un número suficiente de variables relevantes como para que puedas aislar correctamente la influencia de las que te preocupan. Si por ejemplo vas a estudiar el efecto del consumo de alcohol sobre la nota media de los estudiantes universitarios, aparte de estas dos variables tendrías que disponer de otras que puedan influir en la nota media de cada estudiante, como el número de horas diarias dedicadas al estudio o la asistencia a clase. A veces el hecho de no contar con suficiente información en una sección cruzada nos lleva a recurrir a datos de panel, con los que también podemos controlar el impacto de ciertos fenómenos propios de cada periodo de tiempo o de cada observación.

En cuanto a las fuentes, sabemos que existen multitud de ellas, pero no todas son fiables. Por ello, lo más sensato es no alejarnos demasiado de la información proporcionada por organismos oficiales (INE, Banco de España, FMI, Eurostat, fuentes gubernamentales...) o autores relevantes en la materia que estudiamos (aparte de la información que puedas encontrar en libros o papers, algunos investigadores publican sus bases de datos en sus páginas web o se muestran dispuestos a compartirlos si te pones en contacto con ellos).

Una vez hayas localizado los datos que vas a usar, debes asegurarte de que se encuentran en un formato compatible con el software econométrico con el que vayas a trabajar. Uno de los formatos más flexibles es el documento de texto (ASCII), que todos los paquetes econométricos y estadísticos pueden leer. La única "pega" de este formato es que exige ser muy cuidadoso con la estructura de los datos almacenados: se exige que cada fila tenga el mismo número de entradas, que los valores estén separados por al menos un espacio o una coma, asignar a las observaciones sin datos un identificador adecuado (normalmente un punto), introducir los datos no numéricos entre comillas... Para evitar problemas con estas cuestiones, una buena alternativa al documento de texto puede ser una hoja de cálculo, como las de Excel o las de Google, donde la información se almacena en celdas y puedes manipularla fácilmente. O también puedes introducir directamente los datos en tu paquete econométrico, aunque dependiendo de cuál sea este se trata de una opción más o menos recomendable.

Pero independientemente del formato que utilices para almacenar tus datos, ten en cuenta que los datos de sección cruzada deben estar organizados en forma de tabla, con una observación por fila y una variable por columna (puede ser al revés, aunque seguramente después lo tendrás que cambiar con la ayuda de tu paquete econométrico). Las datos de series temporales sulen estar ordenados cronológicamente, asignando la primera observación al periodo más antiguo de la serie y la última el periodo más reciente. En cortes transversales combinados se suele reservar el primer bloque de observaciones para la sección cruzada del periodo más antiguo, y continuar con las secciones de los periodos siguientes. Algo parecido ocurre con los datos de panel, donde lo más apropiado es poner en orden cronológico las observaciones de cada sujeto variable por variable, como en el siguiente ejemplo:


Puedes seguir a Manuel Vicente Montesinos en

No hay comentarios:

Publicar un comentario

-->