Eficiencia Energética
El objetivo de esta práctica es hallar los coeficientes para lograr predecir a través de regresión lineal la eficiencia energética de un edificio a partir de algunos valores de su estructura tales como el Área de superficie, muros, techo, orientación, vidrios, entre otros. Archivo
En primer lugar corroboramos si existen faltantes de datos.
Posteriormente indicamos cual será el campo que queremos predecir.
Agregamos el bloque Cross Validation, el cual dividirá el set de datos en traning donde nos brindará un modelo y testing que posteriormente vamos a calcular su performance.
En la sección de Training agregamos el bloque Linear Regression y conectamos la entrada de datos y la salida del modelo.
En la sección de Testing agregamos un bloque Apply Model y conectamos la entrada del modelo y el set de Test. Agregamos un bloque de Performance(Regression) donde le conectamos la salida del Apply model como entrada e indicaremos que nos devuelva la metrica root mean squared error (raix del error cuadrático medio) que nos indica la diferencia entre el valor real y el predicho, y marcamos también la métrica squared correlation (correlación cuadrática) que es la correlación entre el valor real y el valor pronosticado elevado al cuadrado.
Resultados
Coeficientes de la regresión
Raiz del error cuadrático medio
Correlacion Cuadrática
Conclusión
Mientras más cerca del 0 se encuentra el valor de la raíz cuadrada del error cuadrático medio más perfecta es la predicción, en este caso tenemos un valor bastante bueno. De la misma forma mientras más se acerque al valor 1 la correlación cuadrática mejor fue nuestra predicción con el modelo conseguido, en este caso nos encontramos en un 0.91, un valor que demuestra que nuestro modelo se acerca realmente mucho a los valores reales.
Referencia
https://www.kaggle.com/elikplim/eergy-efficiency-dataset