CODIS das genetische Fingerabdrucksystem des FBI

Wie ich in meinem Text über den genetischen Fingerabdruck schon erwähnt habe, kam nach anfänglichen Erfolgen Kritik an diesem Verfahren auf, insbesondere, dass sich Wahrscheinlichkeiten bei Kriminalfällen nicht exakt berechnen ließen. Das führte zu einer intensiven Forschung vom FBI und man entwickelte dort das Verfahren, das ich hier in groben Umrissen darstellen will.
CODIS bedeutet combined DNA Index system und ist dazu entwickelt worden, dass möglichst alle Individuen einer Population unterschieden werden können.
Basis dafür sind 13 verschiedene STRPs also short tandem repeat polymorphisms. Wie diese Polymorphismen aussehen, soll an einem Beispiel erläutert werden.
Die STRPs sind durch Symbole bezeichnet, die hier nicht weiter erläutert werden sollen. Einer von ihnen heißt D7S280. Es ist ein Abschnitt auf dem Chromosom 7. Ein Teil seiner Sequenz sieht folgendermaßen aus:
  1  AATTTTTGTA TTTTTTTTAG AGACGGGGTT TCACCATGTT GGTCAGGCTG ACTATGGAGT
 61 TATTTTAAGG TTAATATATA TAAAGGGTAT GATAGAACAC TTGTCATAGT TTAGAACGAA
121 CTAACGATAG ATAGATAGAT AGATAGATAG ATAGATAGAT AGATAGATAG ATAGACAGAT
181 TGATAGTTTT TTTTTATCTC ACTAAATAGT CTATAGTAAA CATTTAATTA CCAATATTTG
241 GTGCAATTCT GTCAATGAGG ATAAATGTGG AATCGTTATA ATTCTTAAGA ATATATATTC
301 CCTCTGAGTT TTTGATACCT CAGATTTTAA GGCC
Die Zahlen am Beginn der Zeile bedeuten die Nummer der Base des DNA-Abschnitts. Die kurze tandemartig wiederholte Sequenz ist hier "gata". Verschiedene Allele dieses Genortes können zwischen 6 bis 15 solcher Wiederholungen aufweisen. Wie hervorgehoben dargestellt kann man ab Base 126 12 fehlerfreie "gata"-Sequenzen erkennen, worauf noch 3 relativ ähnliche Sequenzen folgen (erste kursiv dargestellt).
Diese STRPs verhalten sich wie mendelsche Gene. Das soll nun an einem Beispiel vorgeführt werden.

Abb.1

a) Vererbung der STR-Sequenzen von Bob und Anne am Locus D21S11
Anne hat auf dem einen Chromosom 28, auf dem homologen Chromosom 30 Repeats.
Bob hat auf den entsprechenden Chromosomen 29 und 31 Repeats.
Die Typen der möglichen Kinder sind in den vier Feldern dargestellt.>
b) Schlussfolgerung über die Vererbung der Chromosomen von Bobs Eltern an ihn.

Wenn man die Genotypen beider Eltern kennt, so kann man voraussagen, von welchem Typ ihre Kinder sein können. Jedes Kind erbt von jedem Elternteil genau ein Chromosom vom selben Typ, also z.B. vom Chromosom 1 usw. und damit die Eigenschaft dieses Chromosoms. Am Genlocus D21S11, der auf Chromosom 7 liegt, hat der Vater Bob auf einem Chromosom 7 ein Allel mit 29 und auf dem anderen (homologen) Chromosom 7 ein Allel mit 31 Wiederholungen (repeats), die Mutter Anne hat 28 und 30 Wiederholungen. Dann sieht das Schema für die möglichen Kinder so wie in der Tabelle dargestellt aus (es gibt also vier Typen).
Welches der beiden Chromosomen Bob von seiner Mutter und seinem Vater geerbt hat, läßt sich aus der Kenntnis der elterlichen Typen erschließen.
Fred und Norma sind Bobs Eltern. Sein Chromosom mit 31 Wiederholungen muss er von seiner Mutter haben, weil sein Vater ein solches nicht besitzt. Daraus folgt, dass sein Chromosom mit 29 Wiederholungen vom Vater stammen muss, obwohl seine Mutter auch ein Chromosom mit 29 Wiederholungen hat.
Wie man hieran leicht erkennen kann, ist schon ein Genlocus relativ aussagekräftig, jedenfalls für bestimmte Situationen. Von solchen Loci wurden nun 13 verschiedene ausgewählt und zu einem Gesamtsystem, das man CODIS nennt, kombiniert.

Manchmal werden die Eltern bestimmter Kinder gesucht. Auch sie können eventuell mit diesem System gefunden werden, wie folgendes Beispiel zeigt.
An den drei Geschwistern wurde der STRP D18S51 analysiert. Die linke Abb. zeigt das Ergebnis. Oben über der rechten Spalte muss ein Chromosom mit 18 Wiederholungen stehen, weil in beiden Feldern die 18 vorkommt. So kann man weiter schließen, dass links neben der ersten Zeile 12 stehen muss. Daraus folgt dann, dass oben über der ersten Spalte 13 stehen muss und links neben der unteren Zeile 17. Die Eltern müssen also einerseits den Typ 13;18 und andererseits den Typ 12;17 besitzen. So könnte man also die richtigen Eltern im Zweifelsfall herausfinden.

Abb. 2    Suche nach den Eltern von drei Geschwistern.

Die Schlussfolgerungen, wie man sie aus dem links dargestellten Schema ziehen kann, werden im Text erläutert.
Die Eltern müssen die Typen 13;18 und 12;17 besitzen. Andere Elterntypen kommen nicht in Frage.

Das Vorgehen zur Herstellung eines genetischen Fingerabdrucks ist nun folgendermaßen:
1. Es wird eine DNA Probe genommen, wofür Blut, Haare oder irgendein Gewebe verwendet werden kann.
2. Die DNA-Probe wird mit Restriktionsenzymen geschnitten, so dass die 13 STRPs herausgeschnitten werden.
3. Zu jedem der 13 STRPs gibt es Primer, (s. hierzu PCR) die es ermöglichen, gerade die genetischen Abschnitte um die Tandem-Sequenzen herum mit Hilfe der PCR zu amplifizieren (vervielfältigen).
4. Die Primer sind nun so gewählt, dass später bei der Gelelektrophorese die Sequenzen nicht überlappen (s. unten), sondern wegen ihrer unterschiedlichen Länge verschiedene Banden bilden.
5. Die Primer sind mit fluoresceierenden Farbstoffen beladen, so dass sie später automatisch erkannt werden können.

Eine Analyse, bei der 3 STRPs gleichzeitig verwendet wurden, wurde bei Norma durchgeführt. Sie sieht so aus, wie es in der Abb.3 dargestellt wird.

Abb.3 Analyse von Normas Erbgut bzgl. der drei STPRs D3S1358, vWA, FGA.

Oben: wird dargestellt, wie lang die entstehenden Sequenzen bei den drei STRPs werden können. Bei D3S1358 reichen diese von 95-145 bp, bei vWA von 150-200 bp und bei FGA von 200-335 bp. Überlappungen sind also nicht möglich.
Mitte: In der mittleren Zeile sind Bezugs-Sequenzen von allen bekannten Allelen der Population dargestellt.
Unten: Ist das Ergebnis von Norma dargestellt. Es kann aus ihm ablesen werden, dass sie den Genotyp 15;15 in Bezug auf D3S1358 hat, 14;16 in Bezug auf vWA und 24;25 hinsichtlich FGA.

Schon bei der Verwendung dieser drei Loci kann man sich vorstellen, dass die Wahrscheinlichkeit, dass irgend eine andere Person genau dasselbe Profil aufweist, sehr gering ist. Für diese speziellen Typen kenne ich die Häufigkeiten in der Bevölkerung nicht, aber wenn man davon ausgeht, dass sie jeweils in der Größenordnung von 10% liegen, dann ist die Wahrscheinlichkeit, dass jemand denselben Typ besitzt, nur noch ca. 0,1%.

Abschließend soll noch eine Wahrscheinlichkeitsberechnung vorgeführt werden. Bob hat seinen eigenen Typ für jeden der 13 Loci bestimmt. In der folgenden Tabelle sind die 13 STRPs aufgeführt und darunter Bobs Typ jeweils angegeben. Außerdem wird in der dritten Zeile die Häufigkeit mit der Bobs Typ in der Bevölkerung vorkommt wiedergegeben. Daraus läßt sich nun erschließen, dass die Wahrscheinlichkeit, einen Menschen vom gleichen Typ zu begegnen dem Produkt der Wahrscheinlichkeiten entspricht also:
p = 0,082*0,044*0,019*0,099*0,023*0,043*0,13*0,012*0,063*0,095*0,096*0,0352*0,07 = 1,5*1017.
Das bedeutet, dass wenn man wirklich alle 13 Loci verwendet, man die Wahrscheinlichkeit einer Übereinstimmung praktisch beliebig klein machen kann.
 
Locus D3S1358 vWA FGA D8S1179 D21S11 D18S51 D5S818 
Genotyp 15, 18 16, 16 19, 24 12, 13 29, 31 12, 13 11, 13
Häufigkeit 8.2% 4.4% 1.7% 9.9% 2.3% 4.3% 13%
Locus D13S317 D7S820 D16S539 THO1 TPOX CSF1PO AMEL
Genotyp 11, 11 10, 10 11, 11 9, 9.3 8, 8 11, 11 X Y
Häufigkeit 1.2% 6.3% 9.5% 9.6% 3.52% 7.2% (Mann)

Abschließend sei bemerkt, dass es mir sehr wahrscheinlich vorkommt, dass die 13 STRPs keine Schlussfolgerung auf die Persönlichkeit der untersuchten Person zulassen werden, was ich ebenfalls sehr wichtig finde. Zum einen sind die repeats selbst mit Sicherheit sinnlose Sequenzen, zum anderen wird die Länge der Sequenz, die um die repeats herumliegt, so festgelegt, dass sich die Längen der erhaltenen kopierten Abschnitte der DNA nicht überlappen. Das hat zur Wirkung, dass die herausgeschnittene DNA selbst keine Bedeutung haben kann.
Weiter können die Daten leicht digitalisiert werden und so für Computer verarbeitbar.

Für Anregungen und Kritik bin ich dankbar, Zusammenarbeit würde ich begrüßen.

Nachlesbar ist das Ganze auch unter:
http://www.biology.arizona.edu/human_bio/human_bio.html
Von dort habe ich die Abbildungen, die Tabelle übernommen.

Mario Hupfeld ,78464 Konstanz, Mario.Hupfeld@uni-konstanz.de
     Home