Use of VIS-NIRS for land management classification with a support vector machine and prediction of soil organic carbon and other soil properties
Author
Debaene, Guillaume
Pikuła, Dorota
Niedźwiecki, Jacek
Abstract
The objective of this research was to investigate the effects of a long-term experiment on soil spectral properties and to develop prediction models of these properties (soil organic carbon (SOC), N, pH, Hh, P2O5, K2O, Ca, Mg, K, and Na content) from texturally homogeneous samples (loamy sand). To this aim, chemometric techniques, such as partial least square (PLS) regression and support vector machine (SVM) classification, were used. Our results show that visible and near infrared spectroscopy (VIS-NIRS) is suitable for the prediction of properties of texturally homogeneous samples. The effects of fertilizer applications were sufficient to modify the soil chemical composition to a range suitable for using VIS-NIRS for calibration and modeling purposes. The best results were obtained for SOC and N content prediction using the full dataset with cross-validation (r2 = 0.76, RMSECV = 0.04, RPD = 2.02 and r2 = 0.81, RMSECV = 0.01, RPD = 2.20, respectively) and with an independent validation dataset (r2 = 0.70, RMSEP = 0.04, RPD = 1.80 and r2 = 0.73, RMSEP = 0.03, RPD = 1.22, for SOC and N content, respectively). The use of fertilizers and the type of crop rotation appear to have a significant impact on soil spectral properties; the SVM methodology with a linear kernel function was able to classify soil samples as functions of the applied doses of organic and inorganic fertilizers with 75% accuracy with cross-validation and the type of crop rotation with more than 90% accuracy with full validation of separate datasets. El objetivo del presente estudio fue analizar los resultados de un experimento a largo plazo, concerniente a las propiedades espectrales del suelo y desarrollar un modelo de pronóstico de estas propiedades (el contenido del carbón orgánico del suelo, N, pH, pH, Hh, P2O5, K2O, Ca, Mg, K, y Na) a base de muestras homogéneas en términos de textura (arena arcillosa). Para este propósito se han aplicado métodos quimiométricos, tales como la regresión de mínimos cuadrados parciales y la clasificación de las máquinas de soporte vectorial. Los resultados demuestran que la espectroscopia visible y del infrarrojo cercano e espectroscopia (VIS-NIRS) constituye un método adecuado para el pronóstico de propiedades de las muestras homogéneas en términos de textura. Los efectos de la aplicación del fertilizante eran suficientes para la modificación de la composición química del suelo hasta alcanzar el rango que permitió el uso de VIS-NIRS para la calibración y modelización. Los mejores resultados para el pronóstico del contenido del carbón orgánico del suelo y N se obtuvieron utilizando el conjunto completo de datos con la validación cruzada (r2 = 0,76, error cuadrático medio con validación cruzada (RMSECV) = 0,04, diferencia porcentual relativa (RPD) = 2,02 y r2 = 0,81, RMSECV = 0,01, RPD = 2,20, respectivamente) y el conjunto de datos con validación independiente (r2 = 0,70, error cuadrático medio de predicción (RMSEP) = 0,04, RPD = 1,80 y r2 = 0,73, RMSEP = 0,03, RPD = 1,22, respectivamente). El uso de fertilizantes y el tipo de rotación de cultivos parecen tener impacto significativo sobre las propiedades espectrales den suelo, ya que con el uso de la metodología de máquinas de soporte vectorial con función lineal nuclea se logró la identificación de muestras del suelo como funciones de dosis administradas de fertilizantes orgánicos e inorgánicos con el 75% de exactitud con validación cruzada y el tipo de rotación de cultivos con la exactitud superior al 90% con validación completa de conjuntos de datos separados.