Variables dependientes e independientes

Compartir Imprimir Citar

Las variables dependientes e independientes son variables en modelos matemáticos, modelos estadísticos y ciencias experimentales. Las variables dependientes reciben este nombre porque, en un experimento, sus valores se estudian bajo la suposición o exigencia de que dependen, por alguna ley o regla (por ejemplo, por una función matemática), de los valores de otras variables. Las variables independientes, a su vez, no se consideran dependientes de ninguna otra variable en el ámbito del experimento en cuestión. En este sentido, algunas variables independientes comunes son el tiempo, el espacio, la densidad, la masa, la tasa de flujo del fluido y los valores previos de algún valor observado de interés (por ejemplo, el tamaño de la población humana) para predecir valores futuros (la variable dependiente).

De las dos, siempre es la variable dependiente cuya variación se estudia, alterando los insumos, también conocidos como regresores en un contexto estadístico. En un experimento, cualquier variable a la que se le pueda atribuir un valor sin atribuir un valor a ninguna otra variable se denomina variable independiente. Los modelos y experimentos prueban los efectos que las variables independientes tienen sobre las variables dependientes. A veces, incluso si su influencia no es de interés directo, las variables independientes pueden incluirse por otras razones, como para dar cuenta de su posible efecto de confusión.

Matemáticas

En matemáticas, una función es una regla para tomar una entrada (en el caso más simple, un número o conjunto de números) y proporcionar una salida (que también puede ser un número). Un símbolo que representa una entrada arbitraria se denomina variable independiente , mientras que un símbolo que representa una salida arbitraria se denomina variable dependiente . El símbolo más común para la entrada es x , y el símbolo más común para la salida es y ; la función en sí se escribe comúnmente y = f ( x ) .

Es posible tener múltiples variables independientes o múltiples variables dependientes. Por ejemplo, en cálculo multivariable, a menudo se encuentran funciones de la forma z = f ( x , y ) , donde z es una variable dependiente y x e y son variables independientes. Las funciones con múltiples salidas a menudo se denominan funciones con valores vectoriales.

Modelado

En el modelado matemático, la variable dependiente se estudia para ver si varía y cuánto varía a medida que varían las variables independientes. En el modelo lineal estocástico simple i = a + b i + i el término i es el i -ésimo valor de la variable dependiente y i es el i -ésimo valor de la variable independiente. El término i se conoce como el "error" y contiene la variabilidad de la variable dependiente no explicada por la variable independiente.

Con múltiples variables independientes, el modelo es i = a + b i ,1 + b i ,2 + ... + b i,n + i , donde n es el número de variables independientes.

Ahora se analiza el modelo de regresión lineal. Para utilizar la regresión lineal, se genera un gráfico de dispersión de datos con X como variable independiente e Y como variable dependiente. Esto también se denomina conjunto de datos bivariados, ( 1 , 1 )( 2 , 2 ) ...( i , i ) . El modelo de regresión lineal simple toma la forma de i = a + B i + i , para i = 1, 2, ... , n . En este caso,i , ... , n son variables aleatorias independientes. Esto ocurre cuando las medidas no se influyen entre sí. A través de la propagación de la independencia, la independencia de U i implica la independencia de Y i , aunque cada Y i tiene un valor esperado diferente. Cada U i tiene un valor esperado de 0 y una varianza de σ .

Expectativa de i Prueba:{\displaystyle E[Y_{i}]=E[\alpha +\beta x_{i}+U_{i}]=\alpha +\beta x_{i}+E[U_{i}]=\alpha + \betax_{i}.}

La línea de mejor ajuste para el conjunto de datos bivariado toma la forma y = α + βx y se llama línea de regresión. α y β corresponden al intercepto y la pendiente, respectivamente.

Simulación

En simulación, la variable dependiente cambia en respuesta a cambios en las variables independientes.

Estadísticas

En un experimento, la variable manipulada por un experimentador es algo que se ha comprobado que funciona, llamado variable independiente. La variable dependiente es el evento que se espera que cambie cuando se manipula la variable independiente.

En las herramientas de minería de datos (para estadísticas multivariadas y aprendizaje automático), a la variable dependiente se le asigna un rol comovariable de destino (o en algunas herramientas comoatributo de etiqueta), mientras que a una variable independiente se le puede asignar un rol comovariable regular. Se proporcionan valores conocidos para la variable de destino para el conjunto de datos de entrenamiento y el conjunto de datos de prueba, pero deben predecirse para otros datos. La variable objetivo se usa en algoritmos de aprendizaje supervisado pero no en aprendizaje no supervisado.

Sinónimos de estadística

Según el contexto, una variable independiente a veces se denomina "variable predictora", regresor , covariable , "variable manipulada", "variable explicativa", variable de exposición (ver teoría de la confiabilidad), "factor de riesgo" (ver estadísticas médicas), " característica" (en aprendizaje automático y reconocimiento de patrones) o "variable de entrada". En econometría, se suele utilizar el término "variable de control" en lugar de "covariable".

"Variable explicativa"Algunos autores la prefieren a la "variable independiente" cuando las cantidades tratadas como variables independientes pueden no ser estadísticamente independientes o manipulables de forma independiente por el investigador. Si la variable independiente se denomina "variable explicativa", entonces el término "variable de respuesta" es la preferida por algunos autores para la variable dependiente.

Desde la comunidad económica, las variables independientes también se denominan exógenas.

Según el contexto, una variable dependiente a veces se denomina "variable de respuesta", "regresada", "criterio", "variable predicha", "variable medida", "variable explicada", "variable experimental", "variable de respuesta", "variable de resultado", "variable de salida", "objetivo" o "etiqueta". En economía, las variables endógenas suelen hacer referencia al objetivo.

"Variable explicada"Algunos autores la prefieren a la "variable dependiente" cuando las cantidades tratadas como "variables dependientes" pueden no ser estadísticamente dependientes. Si la variable dependiente se denomina "variable explicada", entonces el término "variable predictora" es la preferida por algunos autores para la variable independiente.

Las variables también pueden ser referidas por su forma: continuas o categóricas, que a su vez pueden ser binarias/dicotómicas, nominales categóricas y ordinales categóricas, entre otras.

Un ejemplo lo proporciona el análisis de la tendencia del nivel del mar realizado por Woodworth (1987). En este caso, la variable dependiente (y la variable de mayor interés) era el nivel medio anual del mar en un lugar determinado para el que se disponía de una serie de valores anuales. La principal variable independiente fue el tiempo. Se hizo uso de una covariable consistente en valores anuales de la presión atmosférica media anual al nivel del mar. Los resultados mostraron que la inclusión de la covariable permitió obtener estimaciones mejoradas de la tendencia frente al tiempo, en comparación con los análisis que omitieron la covariable.

Otras variables

Se puede pensar que una variable altera las variables dependientes o independientes, pero puede que en realidad no sea el foco del experimento. De manera que la variable se mantendrá constante o monitoreada para intentar minimizar su efecto en el experimento. Dichas variables pueden designarse como "variable controlada", "variable de control" o "variable fija".

Las variables extrañas, si se incluyen en un análisis de regresión como variables independientes, pueden ayudar a un investigador con una estimación, predicción y bondad de ajuste precisas de los parámetros de respuesta, pero no tienen un interés sustantivo para la hipótesis que se examina. Por ejemplo, en un estudio que examina el efecto de la educación postsecundaria en los ingresos a lo largo de la vida, algunas variables extrañas pueden ser el género, el origen étnico, la clase social, la genética, la inteligencia, la edad, etc. Una variable es extraña solo cuando se puede suponer (o mostrar) que influye en la variable dependiente. Si se incluye en una regresión, puede mejorar el ajuste del modelo. Si se excluye de la regresión y tiene una covarianza distinta de cero con una o más de las variables independientes de interés, su omisión sesgará la regresión. s resultado por el efecto de esa variable independiente de interés. Este efecto se denomina sesgo de variable omitida o de confusión; en estas situaciones, es necesario cambiar el diseño y/o controlar por un control estadístico variable.

Las variables extrañas a menudo se clasifican en tres tipos:

  1. Variables del sujeto, que son las características de los individuos en estudio que pueden afectar sus acciones. Estas variables incluyen edad, género, estado de salud, estado de ánimo, antecedentes, etc.
  2. Las variables de bloqueo o variables experimentales son características de las personas que realizan el experimento que pueden influir en el comportamiento de una persona. El género, la presencia de discriminación racial, el idioma u otros factores pueden calificar como tales variables.
  3. Las variables situacionales son características del entorno en el que se realizó el estudio o la investigación, que influyen negativamente en el resultado del experimento. Se incluyen la temperatura del aire, el nivel de actividad, la iluminación y la hora del día.

En el modelado, la variabilidad que no está cubierta por la variable independiente se designa por{\displaystyle e_{yo}}{\displaystyle e_{yo}}y se conoce como "residual", "efecto secundario", "error", "participación inexplicable", "variable residual", "perturbación" o "tolerancia".

Ejemplos

En un estudio que mida la influencia de diferentes cantidades de fertilizante en el crecimiento de las plantas, la variable independiente sería la cantidad de fertilizante utilizada. La variable dependiente sería el crecimiento en altura o masa de la planta. Las variables controladas serían el tipo de planta, el tipo de fertilizante, la cantidad de luz solar que recibe la planta, el tamaño de las macetas, etc.

En un estudio de cómo las diferentes dosis de un fármaco afectan la gravedad de los síntomas, un investigador podría comparar la frecuencia y la intensidad de los síntomas cuando se administran diferentes dosis. Aquí la variable independiente es la dosis y la variable dependiente es la frecuencia/intensidad de los síntomas.

Al medir la cantidad de color eliminado de las muestras de remolacha a diferentes temperaturas, la temperatura es la variable independiente y la cantidad de pigmento eliminado es la variable dependiente.

El sabor varía con la cantidad de azúcar añadida al café. Aquí, el azúcar es la variable independiente, mientras que el sabor es la variable dependiente.