Yield Processing Analytics
Esta herramienta transforma el procesamiento de los mapas de rendimiento en una experiencia eficiente y automatizada para nuestros usuarios, combinando ciencia estadística con integración de datos automáticos desde las telemetrías de diferentes maquinarias agrícolas.
Los mapas de rendimiento son uno de los pilares de la agricultura de precisión, pero frecuentemente contienen errores sistemáticos y aleatorios que afectan la calidad de los datos. Estos errores pueden provenir de muchos factores, como la dinámica de cosecha, errores en la medición y problemas con la precisión de los sistemas de posicionamiento. De hecho, se estima que entre el 10% y el 50% de los puntos de datos pueden contener errores. Es aquí donde generamos el Yield Analytics.
¿Qué hace Yield Analytics?
Nuestro protocolo de análisis y depuración automatizado se encarga de limpiar los datos para garantizar la calidad de los mapas de rendimiento. Esto incluye:
-
Detección de Datos Atípicos (Outliers): Aplicamos un enfoque basado en la desviación estándar para identificar y eliminar valores fuera de lo esperado. Un outlier es un valor que difiere significativamente del resto de los datos y puede distorsionar el análisis si no se elimina correctamente. Por otro lado, un inlier es un valor que, aunque esté dentro del rango general de los datos, difiere significativamente de los valores vecinos y también puede ser problemático en el análisis espacial.
-
Métodos para identificar Outliers espaciales: Yield Analytics incluye dos métodos para identificar outliers espaciales: LM (Local Moran’s Index) y MP (Moran’s Plot). El índice de autocorrelación espacial de Moran (LM) ayuda a detectar agrupaciones de valores anómalos en el espacio, mientras que el Moran’s Plot (MP) permite visualizar y evaluar la relación entre los valores de rendimiento y sus vecinos inmediatos, identificando patrones de variabilidad no coherentes.
-
Límites de Rendimiento: establecemos límites mínimos y máximos que permiten excluir datos no representativos.
-
Distancia de Borde (Edge Distance): excluimos los datos cercanos a los bordes del lote, donde los rendimientos pueden verse afectados por la transición entre lotes.
-
Análisis de Distancia: permite configurar distancias mínimas y máximas para la consideración de datos y gestionar la dispersión espacial de los puntos de datos y su relevancia para el análisis.
- Reportes: Yield analytics brinda un reporte al usuario de la depuración de los datos, que incluyen todos los estadísticos, mapas (antes y despues) y gráficos para su correcta interpretación.
Un gran desafío
Al desarrollar esta funcionalidad, uno de los mayores retos fue optimizar el proceso para el manejo de grandes cantidades de datos, ya que el código esta totalmente desarrollado en R (lenguaje principalmente estadístico). Inicialmente, intentamos realizar los análisis en tiempo real, pero nos dimos cuenta de que para lotes mayores a 50 hectáreas, los tiempos de espera se volvían inaceptables para nuestros usuarios. La solución fue implementar un sistema de cola de tareas, donde las solicitudes de análisis se procesan de forma secuencial y el usuario es notificado cuando el análisis está listo. Esto no solo mejora la eficiencia, sino que también hace posible manejar grandes volúmenes de datos.
Además, logramos integrar R, un software altamente especializado en matemáticas y estadística, con la infraestructura de la plataforma. Esto significa que cualquier algoritmo desarrollado en R puede integrarse fácilmente a Yield Analytics, lo que abre un abanico de posibilidades para futuros desarrollos sin necesidad de saber de infraestructura.
¿Por qué es importante?
La limpieza automática de los datos de rendimiento permite a los productores tomar decisiones basadas en información confiable y precisa. Yield Analytics convierte el análisis complejo y estadístico en una herramienta accesible para todos, haciendo posible la gestión eficiente de la variabilidad espacial en el campo. Este es solo el comienzo de un camino hacia la agricultura de precisión realmente automatizada y al alcance de todos.