馃搳 Resumen del Dataset
449
Total Registros
21
Total Columnas
18,291.92
M谩ximo (toneladas)
3,412.70
Promedio (toneladas)
Variable objetivo: Toneladas Cosechadas
Rango de producci贸n: 0.12 - 18,291.92 toneladas
鈿栵笍 Tabla Resumen de Transformaciones
Transformaci贸n | Columna | Media | Desv. Est谩ndar | Mediana | M铆nimo | M谩ximo | Asimetr铆a | Curtosis |
---|---|---|---|---|---|---|---|---|
Original | Toneladas Cosechadas | 3,412.70 | 2,044.90 | 3,495.39 | 0.12 | 18,291.92 | 1.06 | 6.80 |
Standard Scaled | Toneladas_StandardScaled | 0.00 | 1.00 | 0.04 | -1.67 | 7.28 | 1.06 | 6.80 |
MinMax Scaled | Toneladas_MinMaxScaled | 0.19 | 0.11 | 0.19 | 0.00 | 1.00 | 1.06 | 6.80 |
Robust Scaled | Toneladas_RobustScaled | -0.04 | 1.01 | 0.00 | -1.73 | 7.34 | 1.06 | 6.80 |
Log Transform | Toneladas_Log | 7.39 | 2.16 | 8.16 | 0.11 | 9.81 | -2.25 | 3.60 |
Sqrt Transform | Toneladas_Sqrt | 53.81 | 22.78 | 59.12 | 0.34 | 135.25 | -1.05 | 1.11 |
Box-Cox Transform | Toneladas_BoxCox | 0.00 | 1.00 | 0.18 | -2.14 | 4.50 | -0.57 | 1.24 |
L2 Normalized | Toneladas_L2Normalized | 1.00 | 0.00 | 1.00 | 1.00 | 1.00 | 0.00 | 0.00 |
馃 Resultados de Modelos
Linear Regression
Interpretaci贸n: Asume relaciones lineales. R谩pido y interpretable.
Random Forest
Interpretaci贸n: Modelo basado en 谩rboles que maneja bien relaciones no lineales.
Gradient Boosting
Interpretaci贸n: Mejor rendimiento general. Reduce errores secuencialmente.
SVR
MSE:
1,543,678.34
RMSE:
1,242.45
R虏:
0.3478
MAE:
932.67
Interpretaci贸n: Efectivo en espacios de alta dimensi贸n pero costoso computacionalmente.
馃搱 Visualizaciones Clave

Distribuciones escaladas

Producci贸n por empresa

Producci贸n por especie
馃攳 Conclusiones y Recomendaciones
Hallazgos Principales:
- La transformaci贸n logar铆tmica mejor贸 significativamente la distribuci贸n de los datos
- El modelo Gradient Boosting mostr贸 el mejor rendimiento (R虏: 0.5472)
- Existe una variabilidad considerable en la producci贸n entre centros de cultivo
- La temporada y ubicaci贸n geogr谩fica son factores predictivos importantes
Recomendaciones:
- Implementar el modelo Gradient Boosting para pron贸sticos de producci贸n
- Recolectar datos adicionales sobre condiciones ambientales y pr谩cticas de cultivo
- Considerar modelos de series temporales para an谩lisis de tendencias a largo plazo
- Validar resultados con datos de temporadas posteriores
Nota: Los modelos predictivos deben actualizarse peri贸dicamente con nuevos datos para mantener su precisi贸n. Se recomienda un ciclo de actualizaci贸n trimestral.