REGRESION
LINEAL
Definiciones:
El
análisis de regresión es una técnica estadística para investigar la relación
funcional entre dos o más variables, ajustando algún modelo matemático.
La
regresión lineal simple utiliza una sola variable de regresión y el caso más
sencillo es el modelo de línea recta. Supóngase que se tiene un conjunto de n
pares de observaciones (xi,yi), se busca encontrar una
recta que describa de la mejor manera cada uno de esos pares observados.
Ejemplo.
El objeto de un análisis de regresión es investigar
la relación estadística que existe entre una variable dependiente (Y)
y una o más variables independientes (X1,X2,X3
,...). Para poder realizar esta investigación, se debe
postular una relación funcional entre las variables. Debido a su simplicidad
analítica, la forma funcional que más se utiliza en la práctica es la relación lineal.
Cuando solo existe una variable independiente, esto se reduce a una línea
recta: Y=b0+b1X
El parámetro b0, conocido como la
"ordenada en el origen," nos indica cuánto es Y cuando X =
0. El parámetro b1, conocido como la "pendiente,"
nos indica cuánto aumenta Y por cada aumento de una unidad
en X. Nuestro problema consiste en obtener estimaciones de
estos coeficientes a partir de una muestra de observaciones sobre las
variables Y y X. En el análisis de regresión,
estas estimaciones se obtienen por medio del método de mínimos cuadrados.
Como
ejemplo, consideremos las cifras del Cuadro 1, que muestra datos mensuales de
producción y costos de operación para una empresa británica de transporte de
pasajeros por carretera durante los años 1949-52 (la producción se mide en
términos de miles de millas-vehículo recorridas por mes, y los costos se miden
en términos de miles de libras por mes). Para poder visualizar el grado de
relación que existe entre las variables, como primer paso en el análisis es
conveniente elaborar un diagrama de dispersión, que es una representación en un
sistema de coordenadas cartesianas de los datos numéricos observados. En el
diagrama resultante, en el eje X se miden las millas-vehículo recorridas, y en
el eje Y se mide el costo de operación mensual. Cada punto en el diagrama
muestra la pareja de datos (millas-vehículo y costos de operación) que
corresponde a un mes determinado. Como era de esperarse, existe una relación
positiva entre estas variables: una mayor cantidad de millas-vehículo
recorridas corresponde un mayor nivel de costos de operación.
Por
otro lado, también se aprecia por qué este gráfico se denomina un diagrama de
"dispersión": no existe una relación matemáticamente exacta entre las
variables, ya que no toda la variación en el costo de operación puede ser
explicada por la variación en las millas-vehículo. Si entre estas variables
existiera una relación lineal perfecta, entonces todos los puntos caerían a lo
largo de la recta de regresión, que también ha sido trazada y que muestra la
relación "promedio" que existe entre las dos variables. En la
práctica, se observa que la mayoría de los puntos no caen directamente sobre la
recta, sino que están "dispersos" en torno a ella. Esta dispersión
representa la variación en Y que no puede atribuirse a la variación en X.
¿Cuándo
utilizar un pronóstico de regresión lineal?
El
pronóstico de regresión lineal simple es un modelo óptimo para patrones de
demanda con tendencia (creciente o decreciente), es decir, patrones que
presenten una relación de linealidad entre la demanda y el tiempo.
CONCLUSIÓN
La
regresión lineal es otro método de pronóstico de una variable, solo que más
matemático y complejo en el cual a base una gráfica de tiempo y demanda podemos
observar cómo se comportan cada uno de los valores entre sí, es decir cuánto
están más alejados a cerca de la “línea” que forma la regresión lineal en la
cual vemos la relación de una variable independiente de otra u otras
independientes. Es útil para cualquier estudio el cual involucre el tiempo.
BIBLIOGRAFIA
No hay comentarios:
Publicar un comentario