LA CIENCIA DE DATOS AL SERVICIO DEL AGRO.

Tras ser parte de la Conferencia Global de Mujeres en Ciencia de Datos -Women in Data Science 2019-, la investigadora Yanina Bellini Saibene, de la EEA Anguil del INTA, refresca en esta columna el uso de esta disciplina en el sector agropecuario. Reflexiona sobre aprendizajes y su uso actual y potencial.

Agropecuarias11/04/2019InfoTec 4.0InfoTec 4.0
20190411_153535
Yanina Bellini SaibeneEstación experimental agropecuaria INTA ANGUIL

Vivimos en una revolución de los datos, generamos datos de forma voluntaria, como cuando usamos las redes sociales y de forma automática como cuando usamos nuestro GPS o nuestra tarjeta de crédito. Se generan datos por medio de sensores como los monitores de rendimiento y los satélites y la ciencia misma es una gran generadora de volúmenes importantes de datos, como resultados de sus propias actividades de investigación y desarrollo. Este aumento en la cantidad y disponibilidad de datos llevó a la necesidad de nuevas formas de gestionarlos y aprovecharlos, acuñando el término Ciencia de Datos: “Disciplina emergente que se basa en el conocimiento en metodología estadística y ciencias de la computación para crear predicciones e ideas impactantes para una amplia gama de campos académicos tradicionales”.

La definición anterior es una de las tantas que existen, y aunque no existe un consenso, la mayoría menciona como partes importantes en la disciplina a la estadística, la ciencia de la computación y el conocimiento del negocio específico, en este caso el agro.

Aportes de INTA en Ciencia de Datos para el sector agropecuario

Existen usos de la ciencia de datos en INTA en cantidad, calidad y variedad de temas. En estos trabajos se utiliza desde la estadística y la ciencia de la computación más tradicional hasta herramientas de aprendizaje automático (machine learning), minería de datos (data mining) e inteligencia artificial.

Estas herramientas permiten entrenar modelos por medio de una serie de métodos, los dos más tradicionales son el aprendizaje supervisado y aprendizaje no supervisado. 

En el aprendizaje supervisado se cuenta con un conjunto de datos previamente etiquetado con la clase o variables que se busca predecir o clasificar, de esta manera el algoritmo seleccionado para entrenar (aprender) es alimentado con una porción de los casos de ese dataset. Luego se lo valida presentándole los casos que no se usaron en el entrenamiento (y que no vio nunca) para ver cuánto y cómo acierta y se equivoca en la predicción o clasificación de la variable objetivo. 

En el caso del aprendizaje no supervisado, el conjunto de datos no cuenta con una etiqueta, por ende las clases,  grupos o patrones buscados no se conocen a priori.

Enmarcados en la investigación y desarrollo en AgTech o AgroTICs, desde la Estación Experimental Agropecuaria (EEA) Anguil del INTA, se llevan adelante una serie de líneas de investigación de Ciencia de Datos.

Sensores remotos, agrometeorología y data mining

Los sensores remotos como los satélites y los radares meteorológicos generan información sobre variables de interés agroclimático. Utilizando datos de campo de la red de estaciones meteorológicas de INTA y Servicio Meteorológico Nacional (SMN), se comparan series de 5, 10 o más años de estos datos, con los datos satelitales para conocer el desempeño de productos de lluvias y evapotranspiración. Si los productos son adecuados, se cuenta con mayor cobertura espacial y temporal y la información se puede usar en sectores donde resulta difícil conseguir datos, permitiendo utilizar o generar modelos como, por ejemplo, de rendimiento.

También se generan productos nuevos. Utilizando los datos del radar meteorológico que de la EEA Anguil, a partir de un método de minería de datos llamado Gene Expression Programing y datos de lotes con daño de granizo, se generaron modelos para estimar la caída de granizo en terreno después de una tormenta.

20190411_153608

Finalmente, se utilizan métodos de aprendizaje supervisados y geotecnologías en la nube para entrenar y aplicar modelos para el seguimiento de emergencias agropecuarias como las inundaciones. Estos métodos permiten contar con una serie histórica de imágenes de diversos satélites, obtener el área de estudio, realizar índices y generar modelos para clasificar cobertura del suelo, agua, incendios, entre otras aplicaciones, sin más costo y necesidad que una conexión a internet.

Deep Learning y girasol

En los ensayos continuos de Girasol de la EEA Anguil, se registran diversas variables del cultivo en diferentes estados fenológicos. El objetivo de este trabajo es analizar si se pueden generar nuevos métodos de medición, más sencillos a campo, pero que mantengan la calidad del dato registrado utilizando la ciencia de datos. 

Utilizamos técnicas de deep learning (aprendizaje profundo) que necesitan como insumo miles de imágenes previamente clasificadas por un experto. Las imágenes clasificadas se utilizan para que el modelo "aprenda" y posteriormente pueda clasificar de forma correcta imágenes nuevas, distintas a las que se utilizaron para entrenar.

Se está trabajando en la estimación del índice de área foliar, a partir de fotografías de cada hoja y de la planta completa y de la estimación del rendimiento pre cosecha a partir de una serie de fotografías del capítulo del girasol.

Economía y cambio climático

El objetivo de esta línea de trabajo es identificar y describir sistemas de producción reales y preponderantes de La Pampa utilizando técnicas de agrupamento (clustering). El propósito de contar con estos grupos es elaborar indicadores económicos a nivel del sistema en su conjunto, indicadores técnicos productivos de las actividades que componen estos sistemas y realizar estimación de emisiones de Gases de Efecto Invernadero. 

20190411_153652

Análisis de redes de colaboración

Utilizamos técnicas de análisis de redes sociales para analizar la red de colaboración de los 10 años del Congreso Argentino de Agro informática por medio de las co-autorias de los trabajos, como también un análisis de los temas tratados en el mismo. El trabajo permitió detectar las instituciones más importantes para el congreso, los autores más representativos, quienes tienen mayor cantidad de colaboraciones, de que países y regiones provienen los trabajos y sobre qué temas se investiga.

Toda esta información permite tomar medidas de organización del congreso como alentar la incorporación de regiones e instituciones con menor participación, promover la colaboración entre grupos de trabajos con temas similares, aumentar la cantidad de autoras y participantes mujeres, internacionalizar el evento y potenciar nuevos tipos de contribuciones.

20190411_153736
 

Consideraciones finales

El potencial de aplicación de la Ciencia de Datos en el sector agropecuario se ve favorecido por la masificación del acceso a los datos y el abaratamiento del poder de cómputo y almacenamiento.  El camino por recorrer está lleno de oportunidades de aplicación si logramos, además, involucrar al sector emprendedor y productivo en estos procesos de investigación y desarrollo.

Algo que queda claro también en el uso de la Ciencia de Datos es la necesidad de ejercer una verdadera interdisciplina, en trabajos donde participan: agrónomas, geógrafas, recursólogas, informáticas y matemáticas. La colaboración entre instituciones también es fundamental. Estos ejemplos de aplicaciones fueron realizados por el INTA Anguil en conjunto con la Universidad Nacional de Córdoba, el área de Estadísticas y Censos de la provincia de La Pampa, la Universidad Nacional de La Pampa, la Universidad Nacional de Misiones, el CONICET y la Universidade Federal do Pampa (Brasil).

Fuente: Revista de investigaciones agropecuarias 

Te puede interesar
TRIGO VERDE

La producción de trigo y cebada alcanzaría 1,3 millones de toneladas en La Pampa

InfoTec 4.0
Agropecuarias13/11/2025

La campaña fina 2025 avanza en La Pampa con perspectivas altamente favorables. Según la primera estimación elaborada a partir de los reportes de técnicos zonales, la producción total de cultivos invernales —principalmente trigo y cebada— se proyecta en torno a 1,3 millones de toneladas, lo que representa una de las cifras más elevadas de los últimos años.

Lo más visto
epet trabajos 2025 2 FILE

Gran convocatoria en la muestra anual de trabajos de la EPET N° 6 de Realicó

InfoTec 4.0
Locales20/11/2025

La EPET N° 6 de Realicó abrió sus puertas este jueves 20 de noviembre para recibir a la comunidad en su tradicional muestra anual de trabajos, una actividad profundamente arraigada en la vida institucional y que cada año convoca a cientos de visitantes. Desde las 19, familias, exalumnos, autoridades y vecinos recorrieron los pasillos del establecimiento para conocer de cerca los proyectos desarrollados por los estudiantes durante el ciclo lectivo 2025. MIRÁ TODOS LOS VIDEOS DE NUESTRA RECORRIDA POR EL COLEGIO.-

MOTO MUERTO RUTA 7 6(1)

Veterano de Malvinas murió tras perder el control de su moto en la Ruta 7

InfoTec 4.0
Policiales20/11/2025

Un veterano de la Guerra de Malvinas falleció este jueves por la tarde en la Ruta Nacional 7, a la altura del kilómetro 494, en cercanías de Laboulaye, luego de perder el control de la motocicleta en la que viajaba rumbo a Mendoza para participar de un encuentro de excombatientes. El hecho ocurrió sin la intervención de otro vehículo y fue descubierto por sus propios compañeros de ruta.

Fatal accidente 2

Una reconocida médica de Catriel, su hija y sus dos nietos fueron las víctimas del fatal accidente de Rio Negro

InfoTec 4.0
Nacionales21/11/2025

Un trágico accidente ocurrido pasadas las 7 de la mañana sobre la Ruta Nacional 22, en el tramo que une Allen con Fernández Oro, se cobró la vida de cuatro integrantes de una familia de Catriel y dejó a dos personas heridas. El siniestro involucró a una camioneta Volkswagen Amarok V6, conducida por un joven de Allen identificado como Axel Araneda —conocido como “el Chinito”— y a una Ford EcoSport en la que viajaban cinco ocupantes rumbo a Las Grutas para aprovechar el fin de semana largo.

Araneda

Condenado por narcotráfico, sin patente y alcoholizado: así manejaba antes del choque fatal

InfoTec 4.0
Nacionales21/11/2025

Cuatro personas —dos mujeres y dos menores— murieron este viernes en la autovía de la Ruta 22, a la altura de Fernández Oro, tras un choque frontal que terminó en un incendio inmediato. El siniestro ocurrió cuando una camioneta Volkswagen Amarok negra sin patente impactó violentamente contra una Ford EcoSport en la que viajaba una familia que se dirigía hacia Las Grutas. La intensidad del impacto fue tal que el vehículo familiar se prendió fuego en cuestión de segundos, impidiendo cualquier intento de escape.

CFK BALCON

La Justicia evalúa incautar el departamento donde vive Cristina Kirchner

InfoTec 4.0
Nacionales22/11/2025

La Justicia federal avanza en una nueva etapa dentro del proceso de decomiso de bienes de la expresidenta Cristina Fernández de Kirchner, en el marco de la Causa Vialidad. Tras la confirmación de la condena y el decomiso inicial de propiedades, los fiscales Diego Luciani y Sergio Mola preparan un nuevo listado que incluye un inmueble clave: el departamento de San José 1111, en el barrio porteño de Constitución, donde la exmandataria cumple prisión domiciliaria.