El análisis de regresión es un proceso estadístico para estimar las relaciones entre variables. Incluye muchas técnicas para el modelado y análisis de diversas variables. Se centra en la relación entre una variable dependiente y una o más variables independientes (o predictoras).
Es importante entender cómo el valor de la variable dependiente va a variar al cambiar el valor de una de las variables independientes, manteniendo fijas las variables independientes. Además, se estima el valor promedio de la variable dependiente al mantenerse fijas las variables independientes.
En todos los casos, el objetivo de la estimación es una función de las variables independientes llamada la función de regresión. También es de interés caracterizar la variación de la variable dependiente en torno a la función de regresión, la cual puede ser descrita por una distribución de probabilidad.
El análisis de regresión utiliza la predicción y previsión, donde su uso tiene superposición sustancial en el campo de aprendizaje automático. Además, se utiliza también para comprender cuales de las variables independientes están relacionadas con la variable dependiente, y explorar las formas de estas relaciones.
Técnicas para el análisis de regresión
Muchas técnicas han sido desarrolladas para llevar a cabo el análisis de regresión. Existen diferentes métodos como la regresión lineal y la regresión de mínimos cuadrados ordinarios. La función de regresión se define en términos de un número finito de parámetros desconocidos. La regresión no paramétrica se refiere a las técnicas que permiten que la función de regresión consista en un conjunto específico de funciones, que puede ser de dimensión infinita.
El desempeño de los métodos de análisis de regresión en la práctica depende de la forma del proceso de generación de datos, y cómo se relaciona con el método de regresión que se utiliza. Dado que la forma verdadera del proceso de generación de datos generalmente no se conoce, se suelen hacer suposiciones. Estos supuestos son a veces comprobables si una cantidad suficiente de datos está disponible. Sin embargo, en muchas aplicaciones, sobre todo con pequeños efectos o las cuestiones de causalidad sobre la base de datos observacionales, los métodos de regresión resultan ser engañosos.
muy buena info, muchas gracias
Es un gusto, no olvide seguir viendo más de nuestro contenido