Deep learning for coherent nonlinear optical communications
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Communication, in general, is the transport or exchange of information between two geographically distant points. The higher this distance the more sophisticated methods and materials have to be applied to overcome the same. Current state of the art for long-haul communication are optical fibers, that form the crucial backbone of our global, interlinked and digital society, connecting data-centers, factories and homes. Nevertheless, like all other physical media also the optical fiber induces the ever-present attenuation to the information carrying electromagnetic wave what, finally, limits the achievable throughput. This results in the need for higher input powers provided by (laser) diodes. Over the past decades physical and computational limitations led to an operation of the optical fiber in the linear regime, where attenuation as well as dispersion, and, thus, their compensation, constituted the major challenges. As this has changed recently, the investigation of nonlinearity gained more attraction.
This work focuses on the pre-distortion and post-equalization of such nonlinear effects that limit the overall efficiency. Thereby, methods from deep-learning are applied and compared to conventional methods. As those, in general, lack of interpretability, here, the concept of so-called architectural templates is proposed that combines well-known, and, from theory derived, concepts with the ones provided by native deep-learning. This way, the results can be analyzed with proven methods from the field of signal processing. While learning of the receiver is a straight-forward, but still complex, task, even more challenging is learning the transmitter as the optimization, i.e., gradient flow, has to be conducted (backwards) through the optical fiber channel. Here, all learnings and evaluations are performed on an accurate simulation of the optical fiber, what enables an isolation of the investigated nonlinear effects.
It results that learning over such accurate nonlinear models is possible as the gradient is preserved and the error can be back-propagated. Further, conventional linear filters for dispersion compensation can be outperformed, when being trained in the nonlinear regime. The extension to a nonlinear architectural template revealed the need for a more sophisticated training procedure proposed in this work. When considering a multi-carrier system the trainable nonlinear template for the transmitter was able to exploit additional information from the neighboring channels.
Kommunikation ist im Allgemeinen der Transport oder Austausch von Informationen zwischen zwei geografisch entfernten Punkten. Je größer dieser Abstand, desto ausgefeiltere Methoden und Materialien müssen eingesetzt werden, um diesen zu überwinden. Aktueller Stand der Technik für Langstrecken sind Glasfasern, die das entscheidende Rückgrat unserer globalen, vernetzten und digitalen Gesellschaft bilden indem sie Rechenzentren, Fabriken und Privathäuser miteinander verbinden. Dennoch bewirkt auch die optische Faser, wie alle anderen physikalischen Medien, eine stets vorhandene Dämpfung der informationstragenden elektromagnetischen Welle, was letztendlich den erreichbaren Datendurchsatz begrenzt. Genau dies macht höhere Eingangsleistungen von (Laser-)Dioden erforderlich. Physikalische und rechenleistungsbezogene Einschränkungen führten in den vergangenen Jahrzehnten dazu, dass optische Fasern in nahezu ausschließlich linearen Arbeitspunkten betrieben wurden, wobei sowohl Dämpfung als auch Dispersion und deren Kompensationen die größten Herausforderungen darstellten. Aufgrund der voranschreitenden Technik und der Realisierbarkeit höherer Leistungen, hat die Untersuchung nichtlinearer Phänomene signifikant an Bedeutung gewonnen.
Der Fokus der vorliegenden Arbeit liegt auf der Vorverzerrung und Nachentzerrung solcher nichtlinearer Effekte, welche heute die Gesamteffizienz einschränken. Dabei werden Methoden aus dem maschinellen Lernen angewendet und mit herkömmlichen Verfahren verglichen. Da erstere im Allgemeinen nicht interpretierbar sind, wird hier das Konzept sogenannter Architekturvorlagen vorgeschlagen, die bekannte und aus der Theorie abgeleitete Konzepte mit jenen kombinieren, die durch natives, maschinelles Lernen bereitgestellt werden. So können die Ergebnisse unter Anderem mit bewährten Methoden aus der Signalverarbeitung analysiert werden. Während das Erlernen des Empfängers noch vergleichsweise einfach ist, stellt das Erlernen des Senders eine wesentlich anspruchsvollere Aufgabe dar. Hierbei muss die Optimierung (rückwärts) über den Glasfaserkanal durchgeführt werden. In dieser Arbeit werden alle Lernvorgänge und Auswertungen auf Basis einer genauen Simulation der optischen Faser durchgeführt, was eine Isolierung der untersuchten nichtlinearen Effekte ermöglicht.
Es konnte gezeigt werden, dass das Lernen über solch genaue nichtlineare Modelle möglich ist, und, darüber hinaus, die Entzerrleistung herkömmlicher linearer Filter zur Kompensation von Dispersionseffekten übertroffen wird, wenn sie im nichtlinearen Bereich betrieben und trainiert werden. Die Erweiterung auf eine nichtlineare Architekturvorlage zeigte die Notwendigkeit eines komplexeren Trainingsverfahrens, das in dieser Arbeit vorgeschlagen wird. Bei Betrachtung eines Mehrträgersystems konnte die trainierbare nichtlineare Vorlage des Senders zusätzliche Informationen aus den Nachbarkanälen nutzen.