Please use this identifier to cite or link to this item: http://dx.doi.org/10.18419/opus-1471
Authors: Fademrecht, Silvia
Title: Systematische Analyse von familienspezifischen Proteindatenbanken für die biotechnologische Anwendung
Other Titles: Systematic analysis of family-specific protein databases for biotechnological application
Issue Date: 2015
metadata.ubs.publikation.typ: Dissertation
URI: http://nbn-resolving.de/urn:nbn:de:bsz:93-opus-105052
http://elib.uni-stuttgart.de/handle/11682/1488
http://dx.doi.org/10.18419/opus-1471
Abstract: Enzyme sind hochspezialisierte Proteine, deren vielfältige Funktionen einen immer häufigeren Einsatz in industriellen Anwendungen erlauben. Enzymbasierte Prozesse sind wegen den milden Reaktionsbedingungen, unter denen sie stattfinden, meistens deutlich umweltschonender als vergleichbare chemische Methoden. Das Potential von Enzymen für biotechnologische Anwendungen ist demnach groß. Trotzdem werden sie bislang verhältnismäßig selten industriell eingesetzt. Gründe hierfür sind die häufig geringe katalytische Aktivität, ungenügende Substratspezifität für nicht-natürliche Substrate sowie Stereoselektivität oder eine unzureichende Stabilität unter den benötigten Prozessbedingungen. Zwei Strategie werden weitläufig benutzt, um diese Limitationen zu umgehen: i) die Suche nach neuen Enzymen mit besseren Eigenschaften oder ii) die Verbesserung bekannter Biokatalysatoren durch protein engineering. Für beide Ansätze ist ein umfassendes Verständnis der Sequenz-Struktur-Funktions-Beziehung nötig, welches mit Hilfe von familienspezifischen Proteindatenbanken generiert werden kann. Ziel dieser Doktorarbeit war es, den Nutzen solcher Datenbanken für biotechnologische Anwendungen zu demonstrieren. Hierfür wurden exemplarisch die drei biotechnologisch interessanten Proteinfamilien der Triterpen-Zyklasen (TTC), der Imin-Reduktasen (IRED) und der Multikupfer-Oxidasen (MCO) gewählt. Die TTCs katalysieren die Polyzyklisierung linearer Terpene, wodurch sie großes Potential für die Herstellung von Duft- und Geschmacksstoffen, Bakteriziden, Fungiziden sowie Pharmazeutika aufweisen. IREDs hingegen zeichnen sich durch die hohe Stereoselektivität und katalytische Aktivität bei der Reduktion von Iminen zu chiralen Aminen aus, was sie besonders interessant für die Produktion verschiedener pharmazeutischer Stoffe, Agrochemikalien und weiterer Spezialchemikalien macht. Ebenfalls biotechnologisch interessant sind MCOs, welche die Oxidation vielfältiger Substrate bei gleichzeitiger Reduktion von molekularem Sauerstoff katalysieren. Im Rahmen dieser Arbeit wurden familienspezifische Proteindatenbanken für diese Familien entwickelt, welche als Basis für die Auswahl neuer Enzyme und für die Identifikation von strukturell und funktionell wichtigen Positionen, mit dem Ziel Biokatalysatoren zu optimieren, dienen. Die in der Triterpene Cyclase Engineering Database (www.TTCED.BioCatNet.de) enthaltenen Sequenzen wurden auf konservierte Positionen hin untersucht. Die Ergebnisse dieser Analyse wurden mit Informationen aus allen bislang untersuchten TTC-Mutanten kombiniert, wodurch schematische Modelle der Squalen-Hopen- und der Oxidosqualen-Zyklase Bindetaschen entworfen werden können. Diese können als Werkzeug zur Vorhersage der Produktspezifität von TTC-Varianten genutzt werden und unterstützen somit weiteres protein engineering. Des Weiteren konnten die Ergebnisse der Konservierungsanalyse genutzt werden, um die Grundlage der in der β-Domäne der TTCs beobachteten Symmetrie zu erklären. Die Imine Reductase Engineering Database (www.IRED.BioCatNet.de) wurde entwickelt um als Werkzeug zur Vorhersage der Stereoselektivität von IREDs und zur Navigation innerhalb der Proteinfamilie zu dienen. Die Vorhersage wurde durch die Auswahl von drei neuen IREDs überprüft, wodurch die Anzahl der bis zu dem Zeitpunkt biochemisch charakterisierten IREDs verdoppelt werden konnte. Um die molekulare Grundlage der Stereoselektivität in diesen Enzymen besser zu verstehen, wurden superfamilienspezifische Konservierungen untersucht. Dadurch konnten zwei Positionen identifiziert wurden, welche sich in allen bislang bekannten R- und S-selektiven IREDs unterscheiden. Durch den Vergleich mit den verwandten β-Hydroxysäure-Dehydrogenasen konnten zudem die Unterschiede in der Substratspezifität erklärt und IRED-spezifische Sequenzmotive, für die cofaktorbindende und katalytische Region, entworfen werden. Diese Sequenzmotive können genutzt werden, um putative IREDs zu identifizieren, wodurch über 1.400 Sequenzen in die Imine Reductase Engineering Database aufgenommen werden konnten. Die bereits zuvor entstandene Laccase and Multicopper Oxidase Engineering Database (www.LccED.BioCatNet.de) wurde im Rahmen dieser Arbeit um MCOs mit zwei und sechs Domänen erweitert. Um trotz großer Vielfalt und der sich unterscheidenden Anzahl an Domänen eine systematische Analyse dieser Proteinfamilie zu ermöglichen, wurde eine domänenbasierte Standardnummerierung für MCOs entwickelt. Dadurch konnten die verschiedenen Domänen eindeutig innerhalb der Sequenzen identifiziert und verglichen werden. Um den modularen Aufbau der MCOs besser zu verstehen, wurden schematische Modelle der Domänenanordnung entworfen. Des Weiteren wurden die substratbindenden loops untersucht, was die Grundlage für weitere Untersuchungen der Substratspezifität dieser interessanten Enzymfamilie bildet.
Enzymes are highly specialized proteins with versatile functions, allowing for an increased use in industrial applications. Their high substrate specificity and selectivity make them efficient catalysts and enable the production of commodities, fine chemicals and pharmaceuticals. Enzyme-based processes cause less impact on the environment than classical chemical methods due to lower reaction temperatures, pressures and solvent concentrations. However, despite their great potential for biotechnology, enzymes are still relatively rare in industrial applications. A low catalytic activity, a wrong selectivity or low specificity for non-natural substrates as well as an insufficient stability under process conditions are the most dominant reasons therefore. Two strategies are widely used to overcome these limitations: i) the search for other enzymes with improved properties and ii) the optimization of previously identified enzymes by protein engineering. For both strategies, comprehensive knowledge of the sequence-structure-function relationships is required, which can be gained by using family specific protein databases. The aim of this thesis was to demonstrate the value of these databases for biotechnological applications. Therefore, three biotechnologically interesting protein families were selected to serve as models: the triterpene cyclases, the imine reductases and the multicopper oxidases. The triterpene cyclases catalyze a complicated polycyclization reaction and show great potential for the production of flavors, fragrances, bactericides and pharmaceuticals. For imine reductases the production of chiral amines with high catalytic activity and stereoselectivity has been reported, making this recently identified protein family interesting for the production of pharmaceuticals, agrochemicals and further specialty chemicals. Also biotechnologically interesting are multicopper oxidases, which oxidize a wide range of substrates by simultaneous reduction of molecular oxygen to water. They are already found in the textile, the paper and pulp and the food industry and show high potential for synthetic chemistry. In the presented work, family specific protein databases were developed for these families, which should serve as base to identify further enzymes and functionally as well as structurally important positions which can be used for the optimization of biocatalysts. Members of the Triterpene Cyclase Engineering Database (www.TTCED.BioCatNet.de) were investigated for conserved positions, especially within the substrate binding pocket, to identify substrate interacting positions. Results from this analysis were combined with literature data on triterpene cyclase mutants, to design schematic models for squalene hopene cyclases and oxidosqualene cyclases. These models serve as tool for prediction of the product specificity of triterpene cyclase variants and thus assist in future protein engineering. Further, the conservation analysis was used to explain the molecular basis of the high symmetry of the β-domain of squalene hopene cyclases. The Imine Reductase Engineering Database (www.IRED.BioCatNet.de) was established to serve as tool for the prediction of stereoselectivity and navigation inside the imine reductase protein family. The prediction was verified by the selection of three novel imine reductases, whereby the number of biochemically characterized imine reductases was doubled. Stereoselectivity was investigated by superfamily-specific conservation analysis that identified two positions, which differ in all R- and S-selective imine reductases known to-date. Comparison with the homologous β-hydroxyacid dehydrogenases further explained the molecular basis for the different substrate specificity of imine reductases. The conservation analysis was further used to design imine reductase-specific sequence motifs for the cofactor binding region and the active site region, which can be used to identify putative imine reductases. With the help of these motifs, over 1.400 putative imine reductases were included into the Imine Reductase Engineering Database. The already existing Laccase and Multicopper Oxidase Engineering Database (www.LccED.BioCatNet.de) was regenerated and updated to include the missing two and six domain multicopper oxidases. To allow a systematic analysis of this diverse protein family, a domain based standard numbering scheme was developed, which allowed the unambiguous identification of the domains in all types of multicopper oxidases. This allowed the comparison of those enzymes independent of their domain arrangement. Schematic models were created to gain more insight into the modular structure of multicopper oxidases. Further, the substrate binding loops were investigated to serve as basis for future examinations on the substrate specificity of multicopper oxidases.
Appears in Collections:03 Fakultät Chemie

Files in This Item:
File Description SizeFormat 
Dissertation_Silvia_Fademrecht.pdf177,16 MBAdobe PDFView/Open


Items in OPUS are protected by copyright, with all rights reserved, unless otherwise indicated.