Buffl

Altklausuren

JL
by Jan L.

Describe the DALI algorithm

NEEDS CONFIRMATION FROM SLIDES

  • DALI (Database of structural Alignments) is a bioinformatics algorithm that is used to compare protein structures and identify structural similarities between them. The algorithm is based on the concept of structural alignment, which involves superimposing two or more protein structures in order to identify equivalent regions of the proteins.

  • The DALI algorithm uses a combination of geometric hashing and dynamic programming to compare protein structures. The algorithm starts by dividing the protein structures into smaller structural units, such as individual alpha-helices or beta-strands. These units are then used as the building blocks for the structural alignment.

  • The DALI algorithm then performs a geometric hashing procedure to identify similar units between the two proteins. The algorithm then uses dynamic programming to generate a series of transformations that can be applied to one protein to align it with the other protein. The final alignment is evaluated using a scoring function that takes into account the number of equivalent units and the similarity of their relative orientations.

  • The DALI algorithm has been widely used to analyze large protein structures databases and has been shown to be effective at identifying structural similarities between proteins with different functions and evolutionary origins. The algorithm is also fast and efficient, making it suitable for use in large-scale structural biology studies.


Describe the SSAP algorithm

NEEDS CONFIRMATION FROM SLIDES

  • SSAP (Sequential Structure Alignment Program) is a bioinformatics algorithm that is used to compare protein structures and identify structural similarities between them. The algorithm is based on the concept of structural alignment, which involves superimposing two or more protein structures in order to identify equivalent regions of the proteins.

  • The SSAP algorithm uses a dynamic programming approach to generate a series of transformations that can be applied to one protein to align it with the other protein. The algorithm starts by dividing the protein structures into smaller structural units, such as individual alpha-helices or beta-strands. These units are then used as the building blocks for the structural alignment.

  • The SSAP algorithm then calculates a distance matrix between the structural units of the two proteins, which is used to guide the alignment process. The algorithm then uses dynamic programming to generate a series of transformations that can be applied to one protein to align it with the other protein. The final alignment is evaluated using a scoring function that takes into account the number of equivalent units and the similarity of their relative orientations.

  • The SSAP algorithm has been widely used to analyze large protein structures databases and has been shown to be effective at identifying structural similarities between proteins with different functions and evolutionary origins. The algorithm is also fast and efficient, making it suitable for use in large-scale structural biology studies.


Definiere "implicit solvent model” und “explicit solvent model”

"Implicit solvent model" und "explicit solvent model" sind beides Ansätze zur Simulation der Wechselwirkungen zwischen Proteinstrukturen und ihrer Umgebung in Lösung.

  • Implicit solvent model: Ein implizites Lösungsmittelmodell ist ein Computersimulationsansatz, bei dem das Lösungsmittel nicht explizit berechnet wird, sondern seine Auswirkungen auf das Protein durch eine begrenzte Anzahl an Parametern, wie z.B. Stöchiometrie und thermodynamische Konstanten, modelliert werden. Diese Art von Modell ist schneller und einfacher zu berechnen als ein explizites Lösungsmittelmodell, aber es kann nicht die tatsächlichen räumlichen Konfigurationen des Lösungsmittels und seiner Wechselwirkungen mit dem Protein wiedergeben.

  • Explicit solvent model: Ein explizites Lösungsmittelmodell ist ein Computersimulationsansatz, bei dem das Lösungsmittel explizit berechnet wird, indem jedes Teilchen in der Lösung, einschließlich Wasser- und Salzteilchen, als individuelle Teilchen modelliert werden. Dies ermöglicht eine realistischere Darstellung der Wechselwirkungen zwischen dem Protein und seiner Umgebung, einschließlich der räumlichen Konfigurationen und der thermodynamischen Eigenschaften des Lösungsmittels. Allerdings ist diese Art von Modell aufgrund der hohen Rechenleistung, die für die Berechnung einer großen Anzahl von Teilchen erforderlich ist, sehr viel langsamer und komplexer als ein implizites Lösungsmittelmodell.

Beide Typen von Modellen haben ihre Stärken und Schwächen und werden je nach Anwendungsfall gewählt. Ein implizites Lösungsmittelmodell ist in der Regel schneller und geeigneter für grobe Vorhersagen über das Verhalten von Proteinen in Lösung, während ein explizites Lösungsmittelmodell eine realistischere Darstellung der Wechselwirkungen zwischen dem Protein und seiner Umgebung bietet und für detailliertere Vorhersagen und Analysen verwendet wird.

Comment on: “The limited number of observed domain topologies may be due to the evolution of protein domains from a limited ‘vocabulary’ of such supersecondary structure elements.” (Söding & Lupas, 2003)

  • Die kombinatorische Komplexität von der Entwicklung einer ganzen Domäne in einem Stück ist unvorstellbar:

    • Es gibt 20^100 mögliche Sequenzen für eine Domäne mit 100 Resten, nur ein vernachlässigbarer Teil davon ist in der Lage sich zu falten oder zeigt sogar eine biologische Aktivität

    • Im Vergleich dazu, ist eine Sequenzoptimierung von etwa 20 Aminosäuren erforderlich, um eine Supersekundärstruktureinheit zu erstellen, die auch innerhalb der Reichweite von biologischen Systemen ist

    • der Unterschied in der kombinatorischen Komplexität liegt in der gleichen Größenordnung wie zwischen der Masse eines Elektrons und des gesamten Universums

  • Es ist kein biologischer Mechanismus bekannt, der Polypeptidketten von ausreichender Länge erzeugen könnte, um eine Domäne zu bilden. Es scheint wahrscheinlicher zu sein, dass der Entwicklungsprozess mit kurzen statt langen Peptidketten gestartet hat

  • Auch wenn die de novo Entwicklung ganzer Domänen möglich wäre, wäre es sehr ineffizient in Bezug auf die Anordnung von Modulen, welche die Verwertung von individuell optimierten Eigenschaften auf einem höheren Niveau an Komplexität erlaubt.

  • Eine erhöhte Anzahl an Fragmenten von nicht-homologen Proteinen, die ähnlich in der Sequenz, Struktur und sogar Funktion sind, wurden gefunden und weisen auf einen gemeinsamen Ursprung hin


Author

Jan L.

Information

Last changed