Labo Online - Analytic, Labortechnik, Life Sciences
Labo Online - Analytic, Labortechnik, Life Sciences
sep
Diesen Artikel bookmarken bei
Wie funktioniert Bookmarken?
Mit so genannten “Social Bookmarks” können Sie Links auf interessante Webseiten mit anderen Nutzern teilen.
sep
Marktübersicht, 06-2008
Marktübersicht

DNA-Sequenzierung

DNA-Strukturformel (Bild: Quelokee/Wikipedia).
die Entwicklung einer Technologie und ihres Marktes

Dr. Oskar Urwesen

Die DNA-Sequenzierung – also die Identifikation der Basenabfolge eines DNA-Stranges – erlebt zur Zeit einen in der Industriegeschichte einzigartigen Boom. Die Forschung in der Agrarwirtschaft, der Evolutionsbiologie, der Taxonomie, der Pharmazie und der Medizin ist an einem Punkt angelangt, an dem die Kenntnis der DNA-Sequenz von Tieren, Pflanzen und Menschen (bzw. Patienten) essenziell für den weiteren Fortschritt in der Forschung geworden ist.

DNA ist ein monotones Makromolekül. Eine der vier Basen Adenin (A), Cytosin (C), Guanin (G) und Thymin (T) sind jeweils an ein Desoxyribose-Molekül gebunden. Zusammen mit einem Phosphatrest nennt man eine solche Einheit Nukleotid. Jedes Nukleotid ist seinerseits mit den Desoxyribose-Molekülen der benachbarten Nukleotide über eine Phosphodiesterbindung verknüpft. Eine solche Kette bildet einen Einzelstrang der DNA. Jedes der Nukleotide ist über Wasserstoffbrücken mit einem Nukleotid des gegenüberliegenden, zweiten DNA-Stranges verbunden. Die Purinbasen A und G können jeweils nur mit einer der Pyrimidinbasen (T und C) paaren. Das lässt lediglich zwei mögliche Paarungen zu: A paart mit T und G paart mit C. Durch diese Struktur ist der zweite DNA-Strang komplementär zum ersten. Alle Information des DNA-Moleküls ist demzufolge in der Sequenz der DNA-Bausteine auf einem einzelnen DNA-Strang kodiert. Alle funktionellen Moleküle eines Lebewesens bestehen, außer den Nukleinsäuren, zumindest überwiegend, aus aneinandergeketteten Aminosäuren, die zusammen Proteine bilden. Eine Abfolge von drei aufeinanderfolgenden Nukleotiden (= Codons) kodieren für eine der 22 möglichen Aminosäuren in der Sequenz eines Proteins.

Anzeige

Dieser Code ist für alle Lebewesen der Erde gleichermaßen gültig, weshalb man annimmt, dass alles Leben auf Erden aus einem einzigen Vorläufer hervorgegangen ist (Monophylie). Diese relativ einfache Struktur der DNA, in der die gesamte Information eines jeden existierenden Lebewesens gespeichert ist, ist für Biologen Fluch und Segen zugleich. Das Molekül ist einfach und leicht zugänglich, aber sehr groß. Das Problem für die Wissenschaft ist in erster Linie die unglaubliche Datenmenge. Zum Beispiel besitzt die DNA des Menschen ungefähr 3 x 109 Bausteine bzw. Basenpaare (bp), die für 10000...25000 Gene codieren. Möchte man in Zukunft die genetische Individualität eines Menschen identifizieren, um zum Beispiel eine individuelle medizinische Therapie zu planen, müsste man das Genom jedes einzelnen Menschen sequenzieren. Für die reine Sequenz wären dafür bei 8 Bit/Zeichen (UTF-8) und 6 Milliarden Menschen 8 x (6 x 109) x (3 x 109) = 14,4 x 1019 Bit zur Speicherung nötig. Die Speicherkapazität der größten Rechenzentren der Welt betrug 2002 zusammengenommen ca. 10 x 1015 Bit, die gesamten gedruckten Schriften der Menschheit haben zusammen ca. 0,2 x 1017 Bit. Wir würden natürlich auch gerne die Sequenz der DNA aller anderen Tiere (ca. 2000000 Arten), Pflanzen (viel mehr als Tiere), Bakterien (noch mehr) und Viren kennen. Am liebsten auch die genetische Varianz innerhalb einer jeden Spezies!

Die Entwicklung

Als 1990 beschlossen wurde, das Genom eines menschlichen Individuums beispielhaft zu sequenzieren, galt dieses Projekt als extrem ehrgeizig. Mit den damals vorhandenen Techniken der Sequenzierung ging man davon aus, dass dieses Projekt, selbst bei rasanter Entwicklung der Technologie, erst in mehreren Jahrzehnten abgeschlossen werden könne. Kritiker behaupteten, dass das ganze Projekt undurchführbar wäre. Daher schlossen sich Forschungsinstitute und Forschungsdienstleister zusammen, um gemeinsam dieses Ziel zu erreichen. Im Jahr 2003 war man durch.

Ende 2007 gab der derzeit größte Sequenzierdienstleister GATC bekannt, bis zum Jahr 2010 hundert menschliche Genome sequenzieren zu wollen. Das entspricht einer Beschleunigung der Sequenziertechnologie um den Faktor 650 in 18 Jahren. Also hat sich die Sequenziergeschwindigkeit durchschnittlich jährlich versechsunddreißigfacht. Daraus lässt sich leicht absehen, dass eine Technologie, die heute die leistungsfähigste am Markt ist, schon nach sehr kurzer Zeit nicht mehr zeitgemäß ist und daher ausgetauscht werden muss. Noch extremer werden die Verhältnisse, wenn man sich den Bedarf an Sequenzierungen ansieht. Noch vor wenigen Jahren gab es lediglich eine Hand voll Anbieter von Sequenzierdienstleistungen, die Aufträge, wie die Sequenzierung eines DNA-Abschnittes von ca. 1000 bp, in einigen Tagen erledigten. Heute kämpfen hunderte von Dienstleistern um Aufträge – sowohl um die kleinen (einige hundert bp) wie auch um größere Projekte wie DNA-Bibliotheken oder Genomsequenzierungen. Der Bedarf an Sequenzierdienstleistung steigt weiter, denn Genomsequenzierungen werden von allen forschenden Nationen gleich reihenweise finanziert. Schon bald wird sogar die Sequenzierung des eigenen Genoms aus medizinischen Gründen, z.B. für individuelle Therapien oder Prophylaxe, erschwinglich sein. Das Ziel der Dienstleister bis 2010 heißt Einzelgenomsequenzierung für weniger als 1000 US $.

Für die erste Sequenzierung eines menschlichen Genoms gab die Human Genome Organisation ca. 300000000 US $ aus. Mit der neuesten erhältlichen Technologie konnten die Kosten für ein solches Projekt auf ca. 60000 US $ gedrückt werden. Hintergrund dieser rasanten Entwicklung ist unter anderem auch ein Programm des US National Institute of Health (NIH) und des National Human Genome Research Institute (NHGRI) zur finanziellen Förderung neuer Sequenziertechnologie. Für Entwicklungen neuer Technologien für das 1000 US $ Genom wurden zunächst 13000000 US $ bereitgestellt. Die X-Price Foundation hat für den ersten, der es schafft, 100 menschliche Genome innerhalb von 10 Tagen bereitzustellen, weitere 10000000 US $ in bar ausgelobt. Das klingt gut und schiebt die Technologieentwicklung weiter an.

Die Technologie

Methoden, die auf einzelnen PCR-Ansätzen basieren, können die erforderlichen Sequenziergeschwindigkeiten nicht leisten. Die PCR kann nur für begrenzte Längen der hergestellten DNA-Fragmente verwendet werden, danach macht die Polymerase schlapp. Außerdem arbeitet das Enzym nicht fehlerfrei, vor allem bei Bereichen, in denen sich einzelne Nukleotide oder kurze Nukleotidbereiche sich mehrfach wiederhohlen. Zu diesem „Stottern“ der Polymerasen kommt ein mindestens genauso häufiges „Stottern“ der chromatografischen Verfahren bzw. ihrer Auswertung. Zudem ist es schwierig, mehrere PCR-Reaktionen in einem Gefäß simultan durchzuführen (Multiplex-PCR). Um diese Probleme zu lösen, wurden in den letzen Jahren neue Technologien entwickelt und kommen oder sind gerade neu auf dem Markt. Durch diese Techniken wird die Sequenziergeschwindigkeit nochmals vervielfacht.

Möchte man sich heute ein leistungsfähiges System anschaffen, muss man schon sehr genau darauf achten, dass es die jeweiligen speziellen Anforderungen erfüllt. Natürlich ist für jedes wirtschaftlich agierende Unternehmen letztendlich nur eines für eine solche Anschaffung ausschlaggebend, der Preis pro sequenzierter Base. Die Faktoren, die auf diesen Preis Einfluss nehmen, sind jedoch vielfältig:

Wie werden zu sequenzierende Proben vorbereitet? Wie schnell geht die Probenvorbereitung und der einzelne Sequenzierlauf? Sind hierfür Personal- oder kostenintensive Schritte nötig? Werden die notwendigen Chemikalien oder Kits nur vom Hersteller des Gerätes angeboten oder gibt es Mitbewerber am Markt? Wie steht es mit der Reproduzierbarkeit? Wieviel Wartung braucht das Gerät und muss man die Bediener aufwändig schulen? Wie hoch muss ein Gerät ausgelastet sein, damit es sich rentiert? Wann ist die nächste Generation von Geräten erhältlich?

Der Klassiker: Dideoxy- Sequenzierung

Für die ersten entwickelten Sequenzierungsmethoden erhielten Frederik Sanger, Walter Gilbert und Paul Berg 1980 gemeinsam den Nobelpreis für Chemie. Im großen Maßstab eingesetzt wurde zunächst die sogenannte Kettenabbruchmethode nach Sanger. Hier werden in einer PCR-Reaktion neben den einzelnen Bausteinen der DNA auch modifizierte Bausteine zugegeben, nach deren Einbau in einen neu entstehenden DNA-Strang die weitere Verlängerung dieses Einzelmoleküls zum Abbruch kommt. Fügt man nun in vier getrennten Ansätzen jeweils nur ein (A, C, G oder T) modifiziertes Analogon in geringer Konzentration zu den normalen Einzelbausteinen hinzu, kommt eine der vier PCR-Reaktionen an jeder Position des zu sequenzierenden Stranges zum Abbruch. Trägt man nun alle vier Reaktionen nebeneinander in einem hochauflösenden Polyacrylamidgel auf, kann man die Abfolge der DNA-Bausteine im Ausgangsmolekül einfach ablesen. Zunächst musste man die DNA-Stränge radioaktiv markieren, um sie im Gel sichtbar machen zu können. Phosphor ist im DNA-Rückgrat reichlich vorhanden und bot sich so zur radioaktiven Markierung an. Man kann sich vorstellen, was diese Arbeit für eine unerfreuliche Sache war. Radioaktivität gepaart mit der Giftigkeit von Acrylamid – eine Kombination für Hartgesottene.

Bald waren fluoreszierende Farbstoffe erhältlich, die die radioaktive Markierung ersetzten und bequem mit einem Laser detektiert werden können. Das war der entscheidende Schritt für die Automatisierung des Prozesses. Die Laser wurden besser, was es ermöglichte, nur das Abbruchanalogon zu markieren. Dies widerum machte das Zusammenlegen der vier PCR-Reaktionen möglich. Statt des Polyacrylamidgeles konnte man bald auch die Kapillarelektrophorese verwenden. Diese Methode schafft, wie auch die Gelelektrophorese, knapp tausend bp pro Lauf, ist aber viel besser automatisierbar.

Dieses Verfahren ist im Moment noch marktbestimmend, aber die nächste Geräte-Generation ist schon kommerziell erhältlich. Vermutlich werden sich in den nächsten Jahren die Anforderungen an ein Sequenziergerät verschieben. Die Genomprojekte der meisten „Modellorganismen“ sind abgeschlossen, womit sich der Bedarf an „de novo“ Sequenzierungen langfristig eher verringern dürfte. Dagegen wird die Feststellung von individuellen Varianzen stark zunehmen, was auch Einfluss auf die neuen Technologien haben wird.

Die „neue Generation“ am Markt

Cyclic-Array-Sequencing:
Alle im Moment angebotenen Next-Generation-Sequenziersysteme (Roche, Applied Biosystems, Helicos, Solexa/Illumina ) basieren auf dem gleichen Grundprinzip, dem Cyclic-Array-Sequencing. Hierbei wird eine Bibliothek aus zufällig (z.B. durch Scherung) gewonnenen DNA-Fragmenten auf einer festen Oberfläche gebunden. Nun wird die Position eines jeden Fragmentes identifiziert (=> Array). Im nächsten Schritt wird in sich wiederholenden Zyklen (=> Cyclic) die Identität der aufeinanderfolgenden DNA-Bausteine jedes einzelnen Fragmentes gleichzeitig durch eine enzymatische Reaktion festgestellt. Die enzymatische Reaktion des Einbaus eines Nukleotids in ein DNA-Fragment erzeugt jeweils ein Lichtsignal, das mit einer CCD-Kamera ausgelesen wird. Obwohl die grundlegende Idee bei allen Next-Generation-Geräten prinzipiell ähnlich ist, gibt es doch gravierende Unterschiede in der technischen Ausführung. Diese Unterschiede bedingen auch die besondere Eignung eines Geräte für die eine oder andere Aufgabe.

Das Kunstwort „Polony“ ist aus den Wörtern Polymerase und Colony zusammengesetzt und bezeichnet die klonale Amplifikation einer DNA-Bibliothek, die lokal gruppiert bleibt. Dieser Vermehrungsschritt von vereinzelten DNA-Fragmenten ist eine weitere Gemeinsamkeit der neuen Systeme – mit Ausnahme des Helicos-Systems, das auf diesen Schritt vollständig verzichten kann. Hier reicht das Fluoreszenzsignal eines einzelnen inkoorporierten, markierten Nukleotids für die Detektion aus.

Sequencing by Synthesis (Roche, Helicos):
Beim Verfahren von Roche werden die DNA-Fragmente auf Beads vereinzelt, immobilisiert und amplifiziert. Die Beads werden dann auf speziellen Mikrotiterplatten verteilt. Bei diesen Platten passt jeweils nur ein einziges Bead in eine der Vertiefungen. Anschließend werden PCR-Reaktionen durchgeführt, bei denen die verschiedenen Nukleotide (A, C, G, T) nacheinander über die Platte gespült werden. Dieser Vorgang wird so oft wiederholt, bis alle Fragmente vollständig sind. Das Gerät von Roche ist besonders für kurze Reads (bis 250 bp) geeignet. Es erreicht eine Gesamtsequenzierleistung von bis zu 100 Megabasen (Mb)/Tag.

Beim Helicos-Verfahren werden die vereinzelten Fragmente auf der Oberfläche einer speziellen Durchflusskammer immobilisiert. Die sensible Detektion des Systems macht eine klonale Amplifikation überflüssig. Diese Technologie kann bis zu 1000 Mb/Tag sequenzieren, liest jedoch nur 35-bp-Fragmente. Damit ist das Gerät vor allem für Resequenzierungsprojekte geeignet.

Sequencing by Ligation (Polonator, ABI):
DNA-Ligasen sind Enzyme, die DNA-Stränge miteinander verbinden. Neben Ligasen, die doppelsträngige DNA-Stücke miteinander verbinden, gibt es auch solche, die Unterbrechungen eines der beiden Stränge reparieren können. Diese Ligasen sind extrem sensibel gegen Falschpaarungen in der Umgebung der Unterbrechung. Diese Empfindlichkeit macht man sich im Sequencing-by-Ligation-Verfahren zunutze. Zunächst wird wiederum die zu sequenzierende DNA in zufällig verteilte Bruchstücke zerlegt. Einzelbruchstücke werden auf Beads aufgebracht und dort klonal vermehrt. Anschließend werden die Bruchstücke in Einzelstränge überführt und an die Enden der Stücke werden bekannte Ankersequenzen angehängt. Die Beads werden auf einem Träger vereinzelt und die Ankersequenz wird mit einem Oligomer mit der komplementären Sequenz hybridisiert. Dieser kurze doppelsträngige Bereich dient nun als Ansatzpunkt für die Ligase. Zum Reaktionsansatz wird ein Gemisch von Nonameren zugesetzt, bei denen acht der neun Positionen mit jeder Base paaren können. Nur eine Position dieser Nonamere ist spezifisch. In jedem Ansatz sind alle vier möglichen Basen an dieser Position enthalten, aber mit verschiedenen Fluophoren markiert. Die Ligase baut nun in den zu sequenzierenden Strang nur das „richtige“ Nonamer ein. Die anderen Nonamere werden weggewaschen und die Farbe und somit die korrekte Base an der Position detektiert. Im nächsten Zyklus werden Nonamere zugegeben, bei denen die spezifische Base um eine Position verschoben ist.

Applied Biosystems hat dieses Verfahren erweitert und kann zwei benachbarte Basenpaarungen gleichzeitig erreichen. Der Sequenzer ist der genaueste, aber auch der langsamste der neuen Gerätegeneration. Er erreicht bis zu 1 Mb/Tag bei einer Read-Länge von bis zu 1100 bp.

Die „nächste“ Next-Generation sitzt schon in den Startlöchern:
Am Himmel der Sequenziertechnologie zeichnet sich ein Verfahren ab, bei dem durch Atomic-Force-Microscopy der ausgebreitete vollständige DNA-Strang eines Chromosoms abgefahren und dabei die Sequenz direkt ausgelesen werden kann. Ebenfalls weit in der Entwicklung fortgeschritten sind sogenannte Nanopore-Lösungen. Hier wird ein DNA-Strang durch eine Mikropore geschleust, durch die er gerade soeben hindurch passt. Die Natur einer Base, die gerade die Pore passiert, beeinflusst hierbei den Ionen-Strom durch die Pore, wodurch sich die Base identifizieren lässt.

Ein weiteres Verfahren in der Entwicklung basiert auf der Massenspektrometrie. Hier wird eine klassische Kettenabbruchreaktion durchgeführt. Zuvor werden die Basen der DNA durch Addition verschieden schwerer Tags markiert und anschließend durch Massenspektrometrie identifiziert.

application/pdf
71,9 KB
Marktübersicht DNA-Sequenzierung
Diesen Artikel bookmarken bei
Wie funktioniert Bookmarken?
Mit so genannten “Social Bookmarks” können Sie Links auf interessante Webseiten mit anderen Nutzern teilen.
sepsepsep
Externe Nutzung / Nutzungsrechte
Wenn Sie auf diesen Beitrag von LABO online verlinken möchten, können Sie einfach und kostenlos folgenden HTML-Code in Ihre Internetseite einbinden:

Weitere Beiträge aus dem Bereich LABO-Marktübersichten

Fermenter fürs Labor und Technikum
Marktübersicht, 09/2011
Bildverarbeitungs-Software
Marktübersicht, 08/2011

Marktübersichten en bloc 2011/12

Die Marktübersichten aus unserer neuen Ausgabe LABO Marktübersichten en bloc 2011/2012 zum Thema "Allgemeinen Labortechnik" stehen Ihnen als PDF oder als ePaper zur Verfügung.

Die Printausgabe fordern Sie über unseren Bestellservice an.

LABO ONLINE Newsletter

LABO Online Newsletter bestellen

Unser Newsletter informiert Sie kostenlos über die wichtigsten Neuigkeiten aus dem Bereich Labortechnik und Life Sciences.

Weitere Services von LABO ONLINE

RSS Feeds
Erhalten Sie aktuelle Nachrichten in Ihrem RSS-Reader
>>...mehr
iGoogle
Die LABO News direkt auf Ihrer iGoogle Startseite
>>...mehr