Optimization of sample design sizes and shapes for regionalized variables using simulated annealing
Author
Guedes, Luciana P.C.
Uribe-Opazo, Miguel A.
Ribeiro Junior, Paulo J.
Abstract
The spatial variability of structures in regionalized variables are defined with the aid of geostatistical techniques, which facilitate the estimation of values for these variables in unsampled localizations and generate thematic maps to be used in decision making for localized treatments in the area under study. The quality of these maps depends on the trustworthiness of these estimates that can be modified with the choice for the sample design. The objective of this work was to establish an optimal size and shape of the sample designs in order to enhance the efficiency of sampling plans for the prediction of space dependent variables. These designs were obtained with the use of a stochastic search method called Simulated Annealing. This method is based on a sampling grid with a large number of points. Here, it is initially used to consider simulated data sets with distinct spatial dependence structures and is then used to consider real data on soy productivity. The simulated results are used as reference for the achievement of the best sample design with the lowest number of sample points that can efficiently represent the spatial dependence structure of soy productivity in a commercial area harvested by the harvester monitor. The results reported for the simulations and soy productivity data show that the optimization process was efficient in determining sample designs with reduced size, especially when using the Global Accuracy as the measurement to be maximized. La definición de la estructura de la variabilidad espacial de las variables regionalizadas por medio de técnicas geoestadísticas, permite estimar los valores de estas variables en lugares no incluidos en el muestreo, generando mapas temáticos que serán utilizados en la construcción de sectores agrícolas para aplicación diferenciada de tratamientos del suelo. La calidad de estos mapas depende de las estimativas confiables, que pueden cambiar por la selección la configuración del muestreo. El objetivo de este estudio fue determinar el tamaño de la muestra y la configuración de muestreo óptima, con el fin de maximizar la eficiencia del plano de muestreo, en la predicción de las variables con dependencia espacial. Las configuraciones muestrales optimizadas fueron obtenidas utilizando un método de búsqueda estocástica llamado Recocido simulado, a partir de una cuadrícula de muestreo con un gran número de puntos, inicialmente teniendo en cuenta un conjunto de datos simulados, con diferentes estructuras de dependencias espaciales y posteriormente un conjunto de datos reales de la productividad de la soya. Los resultados obtenidos de la simulación y del conjunto de datos reales de la productividad de la soya mostraron que el proceso de optimización fue eficiente en la determinación de configuración de muestreo óptima con tamaño de muestrea reducido, principalmente usando el índice de Exactitud Global como medida para maximizarla.