Please use this identifier to cite or link to this item: http://dx.doi.org/10.18419/opus-332
Authors: Li, Jing
Title: Application of copulas as a new geostatistical tool
Other Titles: Anwendung von Copulas als eine neue geostatistische Methode
Issue Date: 2010
metadata.ubs.publikation.typ: Dissertation
Series/Report no.: Mitteilungen / Institut für Wasser- und Umweltsystemmodellierung, Universität Stuttgart;187
URI: http://nbn-resolving.de/urn:nbn:de:bsz:93-opus-51339
http://elib.uni-stuttgart.de/handle/11682/349
http://dx.doi.org/10.18419/opus-332
ISBN: 978-3-933761-91-0
Abstract: In most geostatistical analysis, the spatial variability is solely described with a variogram or a covariance function. These measures have three major problems. First of all, they imply a Gaussianity assumption for the spatial dependence structure. This is, however, often violated in reality as manifested by the dataset investigations in this study. Second, they are sensitive to outliers and thus can be easily polluted by measurement anomalies. Third, they describe the spatial dependence as an integral over the whole marginal distribution of the parameter values. The change of the dependence strength with different quantiles of the parameter is not reflected by these measures, hence not considered in the subsequent interpolation or simulation procedures. But this aspect can be of vital importance for some prediction and design purposes. For example, to predict the flow or transport behavior in a heterogeneous subsurface, where cracks or connected paths, whose spatial continuity deviates largely from the mean trend, exist. Or to extend a monitoring network for noncompliance with environmental standards, where analysis of estimation uncertainty plays a central role and the difference in the uncertainties for different parameter values cannot be overlooked. To overcome the above addressed problems, the concept of copulas is borrowed in this study as an alternative to the traditional geostatistical tools for spatial description and modeling. As a counterpart of the shortcomings of variogram/covariance function, the main advantages of using copula are also threefold. First of all, it captures the {\it pure} dependence among the random variables separately from their univariate distributions and thus the influence of measurement outliers or very skewed distributions vanishes. Second, since it describes the dependence as a full distribution instead of the mean behavior, the variation of dependence strength for different quantiles is revealed, which considerably improves the estimation and prediction quality. Last but not the least, non-Gaussian theoretical copulas which are suitable for spatial modeling can be developed so that the Gaussianity assumption is no more a must and the real dependence structure can be mimicked better. In this study, methodology of using copulas for spatial modeling is established, including making the basic hypothesis, defining empirical copulas as a substitute for variogram/covariance, adopting and devising scale invariant measures for quantification of spatial dependence. Theoretical non-Gaussian copulas which are suitable for spatial modeling are derived and the model inference approach which is a combination of maximum likelihood and multiple-point statistics is proposed as well. The application of the methodology breaks down into three parts. The first part focuses on spatial interoplation, where the procedure of interpolation based on conditional copula is developed. An example of spatial interpolation of groundwater parameters in Baden-Württemberg (Germany) shows that the copula based approach gives better cross validation results than the ordinary and indicator kriging methods. Validation of the confidence intervals estimated from conditional copulas indicates that they are more realistic than the estimation variances obtained from ordinary and indicator kriging. The second part deals with the topic of spatial simulations. In this part, simulation algorithms of generating realizations of multivariate non-Gaussian dependence are developed for both unconditional and conditional cases. Spatial analysis of the hydraulic conductivity measurements of Las Cruces Trench Site shows that the spatial dependence of this dataset exhibit clear anisotropic and non-Gaussian behavior. Statistical tests of the realizations from three copula models parameterized on this dataset, i.e., the Gaussian copula, the v-transformed normal copula and the maximum normal copula, also indicate that the Gaussian copula is most likely to be rejected, while the maximum normal copula is proved to be the most suitable one. The significance of multivariate dependence structure described by copulas to the flow and transport behavior is studied indrectly by investigating the topological/connectivity characteristics of the realizations from different copula models. In the third part, the approach of spatial modeling based on copulas is applied to facilitate observation network design where the estimated conditional copulas describing the probabilistic structure of the values at the unsampled locations are embedded into the utility function which acts as the objective function to be maximized in order to select the optimal location for new measurement. The application to expand the observation network of groundwater quality parameters in a sub-region of Baden-Wüttemberg demonstrates the potentialities of the methodology.
In den meisten geostatistischen Analysen wird die räumliche Variabilität allein mit Hilfe eines Variograms oder einer Kovarianzfunktion beschrieben. Diese Werte haben drei große Probleme: Erstens, sie nehmen implizit an, daß die räumliche Abhängigkeitsstruktur normalverteilt sei. Diese Annahme ist oft nicht gerechtfertigt, wie in den Analysen von Datensätzen in dieser Studie gezeigt wird. Zweitens sind diese Werte sensitiv gegenüber Ausreißern, weswegen sie leicht von Anomalien in den Messwerten beeinflusst werden. Drittens beschreiben diese Werte die räumliche Abhängigkeit als ein Integral über die gesamte Randverteilung der Parameterwerte. Eine Veränderung des Grades der Abhängigkeit für verschiedene Quantile des Parameters wird von diesen Werten nicht berücksichtigt, und auch nicht in darauf folgenden Interpolationen oder Simulationen. Dieser Aspekt kann jedoch wichtig für einige Vorhersagen oder für Design werden. Zum Beispiel um die Strömung oder das Transportverhalten in einem porösen Medium in dem zum Beispiel bevorzugte Fliesswege existieren können, deren räumliche Verbundenheit signifikant von der mittleren Tendenz abweichen. Oder um ein Messnetz für die Überwachung von Umweltstandards zu erweitern, wo die Analyse von Schätzunsicherheit eine zentrale Rolle spielt und die Unterschiede in Unsicherheiten für verschiedene Parameterwerte nicht vernachlässigt werden können. Um die oben angesprochenen Probleme zu adressieren, wurde das Konzept von Copulas in dieser Studie angewendet als Alternative zu traditionellen geostatistischen Werkzeugen für räumliche Beschreibung und Modellierung. Als Gegenpart zu den Mängeln der Variogram/Kovarianz- funktion gibt es hauptsächlich drei Vorteile bei der Benutzung von Copulas: Erstens erfassen Copulas die pure Abhängigkeit der Zufallsvariablen unabhängig von deren univariaten Verteilungen. Deshalb entschwindet der Einfluss von Ausreißern oder sehr schiefen Verteilungen. Zweitens, da die Copula die Abhängigkeit als eine komplette Verteilung beschreibt, anstatt einem mittleren Verhalten, wird der veränderliche Grad der Abhängigkeit für verschiedene Quantile offengelegt, was die Schätzung und Vorhersagequalität erheblich verbessert. Nicht zuletzt können theoretische nicht-Gauss Copuals entwickelt werden, die für räumliche Modellierung passend sind. Dadurch werden Gauss-Annahmen nicht mehr zwingend, und die wirkliche Zusammenhangstruktur besser abgebildet. In dieser Studie wird die Methodik eingeführt, wie man Copulas für räumliches Modellieren benutzt, als Ersatz für Variogramm/Kovariogram. Dabei werden skalenunabhängige Maße zur Quantifizierung der räumlichen Abhängigkeit eingesetzt und eingeführt. Theoretische nicht-Gauss Copulas die für räumliche Modellierung adäquat sind werden abgeleitet und ein Ansatz zur Model-Inferenz der eine Kombination aus Maximum Likelihood und multiple-point Statistik ist, wird vorgeschlagen. Die Anwendung der Methodik gliedert sich in drei Teile: Der erste Teil behandelt räumliche Interploation, wobei eine Prozedur der Interpolation, basierend auf bedingten Copulas entwickelt wird. Ein Beispiel der räumlichen Interpolation von Grundwasserparametern in Baden-Württemberg (Deutschland) zeigt, dass der Copula-basierte Ansatz bessere Kreuzvalidierungs-Ergebnisse liefert als herkömmliche- und Indikator-Kriging-Methoden. Die Validierung der Konfidenzintervalle die basierend auf konditioniellen Copulas geschätzt wurden zeigt, dass sie realistischer sind als die Schätzvarianz basierend auf Oridnary Kriging und auf Indikator Kriging. Der zweite Teil beinhaltet das Thema räumlicher Simulationen. In diesem Teil werden Simulations-Algorithmen entwickelt mit dem Ziel, Realisationen multivariater nicht-Gauss-Abhängigkeit zu generieren, sowohl für nicht-bedingte als auch für bedingte Simulation. Räumliche Analyse von Messungen hydraulischer Leitfähigkeit der Las Cruces Trench Site zeigt, dass die räumliche Abhängigkeitsstruktur deutlich anisotrop und nicht-gauss ist. Statistische Tests der Realizationen aus den drei Copula-Modellen die basierend auf diesem Datensatz parameterisiert wurden -- der Gauss-Copula, der v-transformierten Copula und der "maximalen normalen Copula" -- zeigen ebenfalls, dass die Gauss-Copula am wahrscheinlichsten abgelehnt wird, während bewießen wird, dass die maximale normale Copula die passendste ist. Die Bedeutung der multivariaten Abhängigkeitsstruktur für Strömungs- und Transportverhalten, wie sie von Copulas beschrieben wird, wird beispielhaft indirekt dargelegt durch die Analyse der Topologie und Verbundenheit der Realisationen von verschiedenen Copulamodellen. Im dritten Abschnitt wird der Ansatz der räumlichen Modellierung basierend auf Copulas angewant auf Messnetzplanung wobei die geschätzten bedingten Copulas die Wahrscheinlichkeitsstruktur der Werte an nicht-beprobten Orten in die zu maximierende Nutzenfunnktion eingebettet wird um den optimalen Ort für eine Messung zu wählen. Die Anwendung auf eine Vergrößerung des Grundwasserqualität-Messnetzes in einer Teilregion Baden-Württembergs verdeutlicht das Potential dieser Methode.
Appears in Collections:02 Fakultät Bau- und Umweltingenieurwissenschaften

Files in This Item:
File Description SizeFormat 
Binder_Diss_JingLi.pdf31,97 MBAdobe PDFView/Open


Items in OPUS are protected by copyright, with all rights reserved, unless otherwise indicated.