Please use this identifier to cite or link to this item:
http://dx.doi.org/10.18419/opus-12529
Authors: | Müller, Franz Sebastian |
Title: | An analysis of four server power models |
Issue Date: | 2022 |
metadata.ubs.publikation.typ: | Abschlussarbeit (Bachelor) |
metadata.ubs.publikation.seiten: | 71 |
URI: | http://nbn-resolving.de/urn:nbn:de:bsz:93-opus-ds-125483 http://elib.uni-stuttgart.de/handle/11682/12548 http://dx.doi.org/10.18419/opus-12529 |
Abstract: | In cloud computing research, many models are used to predict server power. However, a lot of these models are not sufficiently tested on industry hardware due to lack of access to this type of hardware in academia. In this work, we address this need for model evaluation and lack of data from real data centers. We obtain a large dataset from a data center of the company AEB SE, located in their headquarters in Stuttgart. The dataset contains hardware utilisation data on the averages of CPU-frequency, CPU utilisation, server power consumption, and ambient temperature as well as peak power consumption. These metrics are measured at five-minute intervals over the span of a year, for all 73 servers. We use the information on average CPU utilisation and average server power to train four server power models that use CPU utilisation to predict the power consumption of a given server. Two of these power models are from literature, and the other two are our own work. We form server groups, based on a combination of hardware characteristics the servers have, such as CPU models, server types and storage sizes. We then train the models on them and compare the accuracy the models have. This answers the question which hardware characteristics should be considered when grouping servers as a basis for training the power models and which distinctions are unnecessary. We also compare the models to each other, based on their accuracy, generalisability and speed of training. We find that one of our models was in all but a few cases the most accurate one. It also generalises better than the other three models and is one of the two fastest models in training. However, it does have the issue of predicting inaccurate and sometimes even semantically incorrect results in higher CPU utilisation areas. In plotting the server power samples at specific CPU utilisations, we observe that the general shape of these plots resembles a horizontal asymptote. Therefore we propose a model that tries to imitate this general shape. Unfortunately, the dataset we obtain is heavily biased towards lower CPU utilisation areas, which may introduce an error in our evaluation of the two least accurate models, one of ours and one from literature, both of which are dependent on using power measurements obtained at full utilisation. The dataset we obtain is freely available for research and can be used to evaluate other power models, or in other research that requires hardware utilisation data from a data center. In der Cloud-Computing-Forschung werden viele Modelle verwendet, um den Energieverbrauch eines Servers vorherzusagen. Viele dieser Modelle werden jedoch aufgrund des fehlenden Zugangs zu dieser Art von Hardware in der Wissenschaft nicht ausreichend auf Industriehardware getestet. In dieser Arbeit gehen wir auf diesen Bedarf an Modellbewertung und den Mangel an Daten aus realen Rechenzentren ein. Wir beziehen einen großen Datensatz aus einem Rechenzentrum der Firma AEB SE das sich in deren Hauptsitz in Stuttgart befindet. Der Datensatz enthällt Daten zur Hardwareauslastung von durchschnittlicher: CPU-Frequenz, CPUAuslastung, Serverstromverbrauch und Umgebungstemperatur sowie Spitzenstromverbrauch. Diese Metriken werden f¨ur alle 73 Server über einen Zeitraum von einem Jahr in Fünf-Minuten-Intervallen gemessen. Wir verwenden die Informationen über die durchschnittliche CPU-Auslastung und den durchschnittlichen Server Energieverbrauch, um vier Modelle zu trainieren, die die CPUAuslastung verwenden, um den Stromverbrauch eines Servers vorherzusagen. Zwei dieser Modelle stammen aus der Literatur, die anderen beiden sind unsere eigene Arbeit. Wir bilden Servergruppen basierend auf einer Kombination von Hardwaremerkmalen der Server, wie z. B. CPU-Modelle, Servertypen und Speichergrößen. Anschließend trainieren wir die Modelle darauf und vergleichen die Genauigkeit der Modelle. Damit ist die Frage beantwortet, welche Hardware-Eigenschaften bei der Gruppierung von Servern als Grundlage für das Training der Power-Modelle berücksichtigt werden sollten und welche Unterscheidungen unnötig sind. Wir vergleichen die Modelle auch untereinander, basierend auf ihrer Genauigkeit, Verallgemeinerbarkeit und Trainingsgeschwindigkeit. Wir stellen fest, dass eines unserer Modelle bis auf wenige Fälle das Genaueste war. Es verallgemeinert auch besser als die anderen drei Modelle und ist eines der beiden schnellsten Modelle im Training. Es besteht jedoch das Problem, dass in Bereichen mit höherer CPU-Auslastung ungenaue und manchmal sogar semantisch falsche Ergebnisse vorhergesagt werden. Beim Plotten der Server-Power-Samples bei bestimmten CPU-Auslastungen beobachten wir, dass die allgemeine Form dieser Plots einer horizontalen Asymptote ähnelt. Daher schlagen wir ein Modell vor, das versucht, diese allgemeine Form nachzuahmen. Leider ist der von uns erhaltene Datensatz stark auf Bereiche mit geringerer CPU-Auslastung ausgerichtet, was zu einem Fehler in unserer Bewertung der beiden am wenigsten genauen Modelle führen kann, eines von uns und eines aus der Literatur, die beide davon abhängig sind, dass Daten über den Energieverbrauch bei voller Auslastung vorhanden sind. Der von uns erhaltene Datensatz ist für Forschungszwecke frei verfügbar und kann zur Bewertung anderer Modelle oder für andere Forschungszwecke verwendet werden, die Hardwarenutzungsdaten aus einem Rechenzentrum erfordern. |
Appears in Collections: | 05 Fakultät Informatik, Elektrotechnik und Informationstechnik |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
BachelorThesisFSebastianMueller.pdf | 1,5 MB | Adobe PDF | View/Open |
Items in OPUS are protected by copyright, with all rights reserved, unless otherwise indicated.