馃搳 Resumen del Dataset

449
Total Registros
21
Total Columnas
18,291.92
M谩ximo (toneladas)
3,412.70
Promedio (toneladas)

Variable objetivo: Toneladas Cosechadas

Rango de producci贸n: 0.12 - 18,291.92 toneladas

鈿栵笍 Tabla Resumen de Transformaciones

Transformaci贸n Columna Media Desv. Est谩ndar Mediana M铆nimo M谩ximo Asimetr铆a Curtosis
Original Toneladas Cosechadas 3,412.70 2,044.90 3,495.39 0.12 18,291.92 1.06 6.80
Standard Scaled Toneladas_StandardScaled 0.00 1.00 0.04 -1.67 7.28 1.06 6.80
MinMax Scaled Toneladas_MinMaxScaled 0.19 0.11 0.19 0.00 1.00 1.06 6.80
Robust Scaled Toneladas_RobustScaled -0.04 1.01 0.00 -1.73 7.34 1.06 6.80
Log Transform Toneladas_Log 7.39 2.16 8.16 0.11 9.81 -2.25 3.60
Sqrt Transform Toneladas_Sqrt 53.81 22.78 59.12 0.34 135.25 -1.05 1.11
Box-Cox Transform Toneladas_BoxCox 0.00 1.00 0.18 -2.14 4.50 -0.57 1.24
L2 Normalized Toneladas_L2Normalized 1.00 0.00 1.00 1.00 1.00 0.00 0.00

馃 Resultados de Modelos

Linear Regression

MSE: 1,214,834.76
RMSE: 1,102.20
R虏: 0.4866
MAE: 888.12
Interpretaci贸n: Asume relaciones lineales. R谩pido y interpretable.

Random Forest

MSE: 1,371,531.95
RMSE: 1,171.12
R虏: 0.4204
MAE: 873.39
Interpretaci贸n: Modelo basado en 谩rboles que maneja bien relaciones no lineales.

Gradient Boosting

MSE: 1,071,234.56
RMSE: 1,035.00
R虏: 0.5472
MAE: 812.45
Interpretaci贸n: Mejor rendimiento general. Reduce errores secuencialmente.

SVR

MSE: 1,543,678.34
RMSE: 1,242.45
R虏: 0.3478
MAE: 932.67
Interpretaci贸n: Efectivo en espacios de alta dimensi贸n pero costoso computacionalmente.

馃搱 Visualizaciones Clave

馃攳 Conclusiones y Recomendaciones

Hallazgos Principales:

  • La transformaci贸n logar铆tmica mejor贸 significativamente la distribuci贸n de los datos
  • El modelo Gradient Boosting mostr贸 el mejor rendimiento (R虏: 0.5472)
  • Existe una variabilidad considerable en la producci贸n entre centros de cultivo
  • La temporada y ubicaci贸n geogr谩fica son factores predictivos importantes

Recomendaciones:

  • Implementar el modelo Gradient Boosting para pron贸sticos de producci贸n
  • Recolectar datos adicionales sobre condiciones ambientales y pr谩cticas de cultivo
  • Considerar modelos de series temporales para an谩lisis de tendencias a largo plazo
  • Validar resultados con datos de temporadas posteriores
Nota: Los modelos predictivos deben actualizarse peri贸dicamente con nuevos datos para mantener su precisi贸n. Se recomienda un ciclo de actualizaci贸n trimestral.