Erweiterung eines Convolutional Neural Network auf 3D zur Modellierung von Grundwasserwärmepumpen
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
In dieser Arbeit untersuchen wir die Skalierung von Datenbedarf und Leistung zwischen 2D und 3D Convolutional Neural Networks (CNNs). Dazu erweitern wir ein U-Net-basiertes 2D CNN zur Modellierung von stationären Grundwasserwärmefahnen [PS24] um eine räumliche Dimension. Unser optimiertes Netzwerk trainieren wir auf PFLOTRAN-simulierten 3D Daten mit 100 und 1000 Datenpunkten (dp). Die verwendeten 2D Modelle basieren auf der Arbeit von Pelzer und Schulte [PS24]. Alle Netzwerke werden von Grund auf trainiert. Für den Vergleich berücksichtigen wir Trainingszeit, Inferenzzeit und Speicherbedarf sowie die Metriken Root Mean Squared Error (RMSE), Mean Absolute Error (MAE), zellbasierter Averaged Absolute Error (AAE) und Percentage Above Threshold (PAT), den prozentualen Anteil an Fehlerzellen über 0.1 ° C. Zusätzlich geben wir Varianz und Standardabweichung des Vorhersagefehlers an. Unser bestes 3D Modell zeigt einen vierfachen RMSE, doppelten MAE und neunfachen PAT bei zehnfach höherer Trainingszeit als das beste 2D Modell. Die Inferenzzeit ist im Vergleich zum 2D Modell um das 26-fache erhöht. Unser Modell zeigt Schwierigkeiten bei der Vorhersage von länglichen Wärmefahnen entlang der Strömungsrichtung und weist hohe Fehlerwerte im Bereich des Injektionspunktes auf. Die Ergebnisse zeigen, dass im 3D Fall eine Datenmenge von 1000 dp für effizientes Lernen und Konvergenz notwendig ist. Unsere Daten sind auf DaRUS verfügbar (https://doi.org/10.18419/darus-4533, https://doi.org/10.18419/darus-4534), unseren Code haben wir auf Github veröffentlicht (https://github.com/ja-tk/1HP_NN).
In this work, we investigate the scaling of data requirements and performance between 2D and 3D Convolutional Neural Networks (CNNs). To this end, we extend a U-Net-based 2D CNN for modelling stationary groundwater heat plumes [PS24] by one spatial dimension. We train our optimised network on PFLOTRAN-simulated 3D data with 100 and 1000 data points (dp). The 2D models used are based on the work of Pelzer and Schulte [PS24]. All networks are trained from scratch. For the comparison, we consider training time, inference time and memory requirements as well as the metrics Root Mean Squared Error (RMSE), Mean Absolute Error (MAE), cellwise Averaged Absolute Error (AAE) and Percentage Above Threshold (PAT), the percentage of error cells above 0.1°C. We also provide the variance and standard deviation of the prediction error. Our best 3D model shows a fourfold RMSE, double MAE and ninefold PAT with a tenfold higher training time than the best 2D model. The inference time is 26 times longer compared to the 2D model. Our model shows difficulties in predicting elongated heat plumes along the flow direction and exhibits high error values in the region of the injection point. The results show that in the 3D case a data set of 1000 dp is necessary for efficient learning and convergence. Our data is available on DaRUS (https://doi.org/10.18419/darus-4533, https://doi.org/10.18419/darus-4534), we have published our code on Github (https://github.com/ja-tk/1HP_NN).