3.3 Der genetische Code

 

Neben der Nukleinsäure DNA als Träger der Erbinformation ist noch RNA (= Ribonukleinsäure) an den molekularen Prozessen um die Erbinformation beteiligt. Sie kommt in der Zelle in 3 Formen vor:

  1. m-RNA = Messenger-RNA oder Boten-RNA
  2. t-RNA = transfer-RNA
  3. r-RNA = ribosomale RNA.

Alle drei RNA-Sorten sind an der Realisierung der genetischen Information beteiligt, also an der Umsetzung der Gene in Stoffwechsel. Den Gedanke, daß die Erbinformation etwas mit dem Stoffwechsel zu tun hat, äußerte Archibald Garrod 1902 zum ersten mal. George Beadle und Edward Tatum bewiesen um 1940 diesen Zusammenhang und stellten die "Ein-GEN ein ENZYM-Hypothese" auf. Sie benutzten Röntgenstrahlen, um beim Pilz Neurospora Mutationen hervorzurufen. Diese betrafen einzelne Gene und einzelne Enzyme in einem speziellen Stoffwechselweg. Für ihre Forschungsergebnisse erhielten sie 1958 den Nobelpreis. Genaueres über das Experiment und die Nobelpreisträger ist in den Quellen zu erfahren.

Heute hat man diese Hypothese in "Ein-Gen-ein-Polypetid" umbenannt, denn viele Proteine wie z.B. Hämoglobin bestehen aus mehreren Polypeptidketten. Das heißt:

Ein Gen trägt die Information für ein Polypetid.

Die DNA im Zellkern arbeitet also mit den Ribosomen im Zytoplasma zusammen, denn dort werden die Proteine hergestellt. Wie kommt nun die Information der DNA aus der Zelle und wird in Proteine umgesetzt? Den grundsätzlichen Zusammenhang stellt die nächste Abbildung her.

Schon F. Crick hat 1953 den Informationsfluß aus der DNA über RNA zu den Ribosomen als zentrales Dogma der Molekularbiologie aufgestellt. Ribonukleinsäure (RNA), die sowohl im Zellkern wie auch im Cytoplasma vorkommt, übernimmt die Überträgerrolle der genetischen Information zu den Proteinen. Man unterscheidet 2 Vorgänge:

  • die Transkription: das Abschreiben von Genen in eine mRNA-Genkopie
  • die Translation: die Proteinsynthese aufgrund der Information der mRNA-Genkopie

Die Ribosomen, die zu 2/3 aus RNA, genauer rRNA bestehen sind der Ort der Proteinbiosynthese.

Um Eiweiße herstellen zu können, braucht die Zelle Aminosäuren. Sie erhält sie aus der Nahrung. t-RNA-Moleküle übernehmen den Transport im Zytoplasma zu den Ribosomen.

Der Genetische Code

Mit Hilfe der Ribosomen wird die "Sprache der Gene" in die "Sprache der Proteine" umgesetzt. Sprachen oder Schriften besitzen als Elemente Zeichen, Buchstaben und Sonderzeichen. Die deutsche Sprache besteht aus 26 Buchstaben, Umlaute nicht mitgerechnet. Die Maschinensprache der Computer besteht aus 2 Zeichen: 0 und 1. Bei beiden werden in Kombinationen der Zeichen, also Wörtern und Sätzen Information gespeichert.

Die Proteinsprache besteht aus 22 Buchstaben, den Aminosäuren. In der Sequenz ist die Information zur spezifischen räumlichen Struktur enthalten, die dem Protein eine spezifische Funktion verleiht.

Die genetische Sprache besitzt 4 Buchstaben: Adenin, Guanin, Cytosin und Thymin. Was liegt also näher, als ebenfalls in der Kombination der Basen die genetische Information zu vermuten. Die Frage war in den 50er Jahren nur:

Wie lange ist ein genetisches Wort und welche Basenkombination entspricht einer Aminosäure?

Mit einer Base könnte man maximal 4 Aminosäuren verschlüsseln, zu wenig. Die Kombination von 2 Basen ergibt 42 Möglichkeiten d.h. 16 Varianten, also immer noch zu wenig. Bei mindestens 3 Basen in Kombination hätte man die Möglichkeit, alle 22 Aminosäuren zu verschlüsseln, maximal 43 = 64 Kombinationsmöglichkeiten.

Dies wurde zu Beginn der 60er Jahre von Marshall Nirenberg und Heinrich Matthaei (Nobelpreis 1968) getestet. Sie gaben in 20 Teströhrchen mit E.Coli-Zellfragmenten mit jeweils einer bestimmten Aminosäure eine Poly-U- RNA. In einem Reaktionsansatz entstand ein Polypeptid, das nur aus Phenylalanin bestand. Dabei fanden Sie, daß eine Kombination von 3 Basen, ein Triplett die Information für eine Aminosäure enthielt. Da an den Ribosomen die zur DNA komplementäre mRNA verwendet wird, ist das entsprechende Codogen in der DNA für Phe AAA, das Codon der mRNA UUU.
Durch Testen mit verschiedensten RNA-Sequenzen wurden alle Codogene geklärt.

Man fand 61 für Aminosäuren codierende Tripletts und 3 Terminator oder Stop-Codogene für die es keine Aminosäure gibt. Deshalb bricht hier die Proteinsynthese ab, man spricht auch von Nonsens-Codonen. Die mRNA-Sequenz ist: UAA, UAG und UGA.

Neben der tabellarischen Form ist auch die "Codesonne" nach Bresch und Hausmann weit verbreitet. Klicken Sie rechts um dies zu sehen. Die Codone werden von innen nach außen gelesen.

Da an den Ribosomen der genetische Code in Form der mRNA übersetzt wird, gibt man den genetischen Code als mRNA-Code in Form der Codone an. Eine tabellarische Zusammenstellung findet man unten. Z.B. bedeutet Isoleucin AUU, AUC oder AUA. Da für eine Aminosäure mehrere Codone zutreffen, nennt man den gentischen Code degeneriert.

Diese Zuordnung der Aminosäuren hat man bei allen Lebewesen gefunden, deshalb bezeichnet man den genetischen Code als universell. Nur in den Mitochondrien und Chloroplasten bzw. den Archäbakterien trifft man auf teilweise andere Codierungen.
Bis vor einigen Jahren waren nur 20 Aminosäuren bekannt. Inzwischen hat man 2 weitere Aminosäuren gefunden, Selenocystein (Sec) und Pyrrolysin (Pyl), die beide an speziellen t-RNAs gebunden an die Stopcodone UAG (Pyl) und AGA (Sec) binden.

Der Code ist auch überlappungsfrei, d.h. die Sequenz eines Gens wird nicht teilweise von einem anderen benützt.

Ein Ausschnitt aus einem Gen könnte so aussehen:

DNA, Codogener Strang

TAC CTT AAG AGC GAG

(3' <- 5')

DNA, komplementärer Strang:

ATG GAA TTC TCG CTC

(5' -> 3')

mRNA

AUG GAA UUC UCG CUC

(5' -> 3')

Protein

 Met - Glu - Phe - Ser - Leu

COOH

Wie sieht nun die tatsächliche Nukleotidsequenz eines Gens aus? Dies ist für Bakterien und Eukaryonten unterschiedlich. Bei Bakterien besteht die komplette DNA aus Genen, die die Information zur Herstellung von Proteinen enthalten.
eeee In Eukaryonten enthält nur ein Teil der DNA Information für Proteine, genannt Exons. Der Sinn des anderen Teils ist derzeit nicht bekannt = Introns. Die Ausdrücke kommen daher, daß ein Gen beide Abschnitte enthält, siehe Abb. 27.

Am Beispiel des Muskelproteins Tropomyosin sieht man die Exons und Introns in einem eukaryontischen Gen.

Tropomyosin ist ein stäbchenförmiges Molekül (ca. 400 Å lang und 20 Å breit). Es besteht aus 2 parallel angeordneten a-Helices. VieleTropomyosin- Moleküle lagern sich eweils kopf- und schwanzseitig aneinander. Ein Skellettmuskel besteht zu 3% aus Tropomyosin.

3.3.1 Modellhafter Ablauf von Transkription und Translation

Um nun aus dem Bauplan in der DNA ein Protein herzustellen wird in einem komplizierten Vorgang zunächst das Gen im Zellkern abgeschrieben. Dazu wird eine Kopie der codogenen Basensequenz der Doppelhelix angefertigt. (codogener Strang = der Strang der das Gen enthält) Den Vorgang nennt man Transkription. Diese Kopie, m-RNA genannt wandert dann aus dem Kern ins Zytoplasma zu den Ribosomen. Dort wird die Basensequenz in die entsprechende Proteinsequenz übersetzt und ein Protein hergestellt. Dies nennt man Translation.

Transkription

Die Transcription läuft in 3 Schritten ab:

  1. Initiation
  2. Elongation
  3. Termination

1. Initiation

Zum Abschreiben des Gens bindet der RNA-Polymerasekomplex an eine bestimmte Stelle, den Promotor. Dazu sind verschiedene Faktoren wie z.B. der Sigmafaktor notwendig. Die nachfolgende Stelle wird nun entschraubt und die Bildung einer komplementären Nukleotidsequenz als mRNA ( messenger RNA) ab dem Startcodon beginnt.

2. Elongation

Der gesamte Transsriptionskomplex samt entstehender mRNA wandert in 5´ - 3´- Richtung entlang dem Gen, wobei das Gen sozusagen komplementär abgeschrieben wird.

3. Termination

Beim Erreichen einer Stopsequenz mit einem Terminatorcodon wird die Abschrift beendet. Der RNA-Polymerasekomplex fällt von der DNA ab.

In Prokaryonten wird diese mRNA direkt von den Robosomen als Matrize benutzt um daraus das entsprechnde Protein (=Translation) herzustellen. In Eukaryonten wird das primäre Transcript (= prä - mRNA) noch bearbeitet und dabei in die zur Translation notwendige mRNA umgewandelt. Dieser Umwandlungsvorgang der prä -mRNA in mRNA bei Eukaryonten besteht aus Capping, Polyadenylierung und Splicing (Spleißen) .

Bearbeitung der der prä - mRNA bei Eukaryonten

Capping: Nach der Transcription wird die prä-m-RNA am 5´-Ende mit einer Kappe (= Cap) versehen (= Capping). Dabei wird eine spezielles Nukleotid (7-Methyl-Guanosin) in einer 5'-5' Bindung an das 5´-Ende der prä-mRNA gebunden.

Polyadenylierung: An das 3´-Ende werden zwischen 20 und 250 Adenin-Nukleotide angefügt. (= Poly-A-Schwanz).

Splicing: Danach werden die durch einen Komplex (= Spliceosom) aus Proteinen und speziellen RNAs (= snRNAs) die Introns herausgeschnitten und die Exons zusammengefügt.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Abb. 24

Dogma der Molekularbiologie

 

 

 

 

 

 

 

Abb. 25

Sprachen

 

Deutsche Sprache: 26 Buchstaben
abcdefghijklmnopqrstuvwxyz
Kombinationen der Buchstaben:
beliebig; Beispiel: sieben=7
Satzzeichen:
.,;:!"?/ usw.
Zeichenabfolge:
ohne Überlappung, Leerzeichen

Binärcode: 2 Buchstaben
0, 1
Kombination der Zeichen:
beliebig; Beispiel: 0111=7
Satzzeichen:
keine
Zeichenabfolge:
nicht überlappend, keine Leerzeichen

Proteinsprache: 22 Buchstaben
G - Glycin (Gly)
P - Prolin (Pro)
A - Alanin (Ala)
V - Valin (Val)
L - Leucin (Leu)
I - Isoleucin (Ile)
M - Methionin (Met)
C - Cystein (Cys)
F - Phenylalanin (Phe)
Y - Tyrosin (Tyr)
W - Tryptophan (Trp)
H - Histidin (His)
K - Lysin (Lys)
R - Arginin (Arg)
Q - Glutamin (Gln)
N - Asparagin (Asn)
E - Glutaminsäure (Glu)
D - Asparaginsäure (Asp)
S - Serin (Ser)
T - Threonin (Thr)
-- Selenocystein (Sec)
-- Pyrrolysin (Pyl)

Kombination der Zeichen:
beliebig; Beispiel: Heptapeptid
Gly-Asp-Ala-Phe-Glu-Cys-Ala
Satzzeichen:
keine
Zeichenabfolge:
nicht überlappend, keine Leerzeichen

Genetischer Code: 4 Buchstaben
DNA: Adenin(A), Guanin(G), Cytosin(C), Thymin(T)
RNA: A, G, C,U= Uracil statt Thymin
Kombination der Zeichen:
als Triplett; Beispiel: ACG
Satzzeichen:
Start- und Stop-Codon
Zeichenabfolge:
nicht überlappend, keine Leerzeichen; Exons, Introns

 

Abb. 26

Marshall W. Nirenberg 1927 -

Nobelpreis für Medizin 1968
Aufklärung des genetischen Codes

 

 

 

 

 

 

 

 

 

 

 

 

 

Abb. 27

Exons - Introns

Die farbigen Regionen codieren für Proteine.

 

Abb. 28

Tropomyosingen

Hellblaue Regionen sind Introns (Nonsens), dunkelblau Exons (codierend).

Ein Muskel ist ein Bündel von Muskelfasern, die aus einzelnen Zellen bestehen und die funktionelle Untereinheit des Muskels sind. Jede Faser hat viele Zellkerne, was zeigt, daß sie sich aus vielen Zellen entwickelt haben. Jede Faser besitzt viele Organelle genannt Myofibrillen, die wiederum aus langen stächenförmigen Strukturen aus hauptsächlich 2 Proteinen bestehen: Aktin und Myosin.

Daneben sind noch Troponin und Tropomyosin am Aufbau beteiligt.

Wer sich mehr über den Muskelaufbau informieren möchte klicke bitte auf das Bild oben.

 

Abb. 29

Transcription - Translation

 

 

 

 

 

 

 

 

Abb. 30

Transcription

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Abb. 31

Splicing

 

Weiterführende Quellen:

genetischer Code

http://users.rcn.com/jkimball.ma.ultranet/BiologyPages/C/Codons.html
http://www.amsci.org/amsci/issues/Comsci98/compsci9801.html

Transcription

http://vcell.ndsu.nodak.edu/~christjo/vcell/animationSite/transcription/

Splicing

http://www.web-books.com/MoBio/Free/Ch5A4.htm

Capping, Polyadenylierung

http://users.rcn.com/jkimball.ma.ultranet/BiologyPages/T/Transcription.html
http://bioweb.wku.edu/courses/biol22000/22mRNAprocessing/default.html