¿Qué son los datos del panel?

Los datos de panel, también conocidos como datos longitudinales o datos de series de tiempo de sección transversal en algunos casos especiales, son datos que se derivan de un número (generalmente pequeño) de observaciones a lo largo del tiempo en un número (generalmente grande) de unidades de sección transversal como individuos , hogares, empresas o gobiernos.

En las disciplinas de econometría y estadística, los datos del panel se refieren a datos multidimensionales que generalmente implican mediciones durante un período de tiempo. Como tal, los datos del panel consisten en observaciones del investigador de numerosos fenómenos que se recopilaron durante varios períodos de tiempo para el mismo grupo de unidades o entidades. Por ejemplo, un conjunto de datos de panel puede ser uno que sigue una muestra dada de individuos a lo largo del tiempo y registra observaciones o información sobre cada individuo en la muestra.

Ejemplos básicos de conjuntos de datos de panel

Los siguientes son ejemplos muy básicos de dos conjuntos de datos de panel para dos o tres personas en el transcurso de varios años en los que los datos recopilados u observados incluyen ingresos, edad y sexo:

Conjunto de datos del panel A

Persona

Año Ingresos Años Sexo
1 2013 20,000 23 F
1 2014 25,000 24 F
1 2015 27,500 25 F
2 2013 35,000 27 METRO
2 2014 42,500 28 METRO
2 2015 50,000 29 METRO

Conjunto de datos del panel B

Persona

Año Ingresos Años Sexo
1 2013 20,000 23 F
1 2014 25,000 24 F
2 2013 35,000 27 METRO
2 2014 42,500 28 METRO
2 2015 50,000 29 METRO
3 2014 46,000 25 F

Tanto el Conjunto de datos del panel A como el Conjunto de datos del panel B anteriores muestran los datos recopilados (las características de ingresos, edad y sexo) en el transcurso de varios años para diferentes personas. El conjunto de datos del panel A muestra los datos recopilados para dos personas (persona 1 y persona 2) en el transcurso de tres años (2013, 2014 y 2015). Este conjunto de datos de ejemplo se consideraría un panel equilibrado porque cada persona es observada por las características definidas de ingresos, edad y sexo cada año del estudio. El conjunto de datos del panel B, por otro lado, se consideraría un panel desequilibrado ya que no existen datos para cada persona cada año. Las características de la persona 1 y la persona 2 se recopilaron en 2013 y 2014, pero la persona 3 solo se observa en 2014, no en 2013 y 2014. 

Análisis de datos de panel en investigación económica

Hay dos conjuntos distintos de información que se pueden derivar de los datos de series temporales transversales. El componente transversal del conjunto de datos refleja las diferencias observadas entre los sujetos o entidades individuales, mientras que el componente de serie temporal que refleja las diferencias observadas para un sujeto a lo largo del tiempo. Por ejemplo, los investigadores podrían centrarse en las diferencias de datos entre cada persona en un estudio de panel y / o los cambios en los fenómenos observados para una persona en el transcurso del estudio (por ejemplo, los cambios en los ingresos a lo largo del tiempo de la persona 1 en los Datos del panel Establecer A arriba).

Son los métodos de regresión de datos del panel los que permiten a los economistas utilizar estos diversos conjuntos de información proporcionados por los datos del panel. Como tal, el análisis de los datos del panel puede volverse extremadamente complejo. Pero esta flexibilidad es precisamente la ventaja de los conjuntos de datos de panel para la investigación económica en comparación con los datos convencionales de series transversales o de series de tiempo. Los datos del panel brindan a los investigadores una gran cantidad de puntos de datos únicos, lo que aumenta el grado de libertad del investigador para explorar variables explicativas y relaciones.