Az
eukarióta nukleáris DNS nem kódoló szakaszai
A következőkben a genom növekedésének
néhány következményét vizsgáljuk meg elsősorban abból a szempontból,
hogy a zoológus munkájához milyen "anyag" áll rendelkezésre.
Amint említettük, a transzpozíció, a gén- vagy genom duplikációt
követő mutációk gyakran olyan DNS szakaszt eredményeznek, amelyek
elvesztették eredeti kódoló funkciójukat. Az eukarióta géneken
belül is rendszerint nagy számban vannak olyan beékelődött szakaszok
(interspersed sequence, intron), amelyek ugyan átfordítódnak
RNS szekvenciára, de a fehérjeszintézis előtt a pre m-RNS-ből
kihasítódnak. Az intronok száma génről génre változik. Vannak
gének, amelyek tucatnyi intront tartalmaznak, amelyek között
több ezer nukleotid hosszúságú is lehet. Más gének (pl. a legtöbb
hiszton gén) egyáltalán nem tartalmaznak intront. Ezzel együtt,
a legtöbb fehérjét kódoló nukleáris gén bázisszekvenciáinak
zömét intronok alkotják.
A nem kódoló szekvenciák
a zoológus számára fontos információkat hordoznak pl. a fajok
közötti genetikai távolságok becsléséhez. Most röviden áttekintjük
az ismétlődő szakaszok fajtáit, abból a szempontból, hogy hol
találhatók a genomban, mekkorák, és mit tartalmaznak.
Az ismétlődő szekvenciák
(repetitive sequences) több formáját szokás megkülönböztetni.
A sokszorosan ismétlődő (highly repetitive) szekvenciák rövidek,
hosszuk néhány bázispár és több száz bázispár között változik,
és a genomban igen nagy ismétléssel fordulnak elő (átlagosan
félmillió másolatban). Vannak ezeknél jóval hosszabb, több száz
vagy ezer bp. nagyságú szakaszok, amelyek kevesebb, néhány száz
példányban fordulnak elő a genomban (middle-repetitive DNA).
A repetitív szekvenciáknak nem csak hossza, de eloszlása is
változatos: a nem kódoló szakaszok másolatai a genomban vagy
szétszórva találhatók, vagy egymás mögött, mint utasok a tandem
kerékpáron.
Lokalizált repetitív szekvenciák
A legtöbb eukarióta genomban
nagy mennyiséget képviselnek az egymás után elhelyezkedő (tandem),
sokszorosan ismétlődő DNS szekvenciák. Néhány fajban ezek teszik
ki a genom többségét. A patkány kenguru (Dipodomus ordii) genomjának
több mint fele háromféle ismétlődő szekvenciából áll: AAG (2,4
milliárd másolat), TTAGGG (2,2 milliárd másolat) és ACACAGCGGG
(1,2 milliárd másolat). A másolatok azonban nem hajszálpontosan
azonosak: a TTAGGG szekvencia családban például találtak TTAGAG
változatot is. Ezzel együtt, a tandem repetitív szekvenciák
egyszerű eszközökkel elválaszthatók a DNS többi részétől, amely
sokkal változatosabb bázis-sorrendű szakaszokból áll. A könnyen
elkülöníthető, tandem, sokszorosan ismétlődő DNS szakaszokat
szatellita DNS-nek (satellite DNA) nevezik. Mivel e szakaszok
hossza eltérő, ezért szokás ezeket mint változó hosszúságú tandem
ismétléseket (variable number of tandem repeats = VNTR) említeni.
Mivel a szatellita DNS nem
íródik át és így valószínűleg semmilyen genetikai információt
nem tartalmaz, felmerül a kérdés, hogy hogyan keletkezett, van-e
valami funkciója és miért maradhatott fent. A lokalizált repetitív
szekvenciák keletkezését illetően több elképzelés is van, amelyek
közül két mechanizmus tekinthető általánosan elfogadottnak:
a gén konverzió (gene conversion) és az egyenlőtlen átkapcsolódás
(unequal crossing over) (ábra).
A szatellita DNS funkciója
nem ismert és valószínűleg nincs is funkciója. Nem játszhat
jelentős szerepet a kromoszóma stabilizálásában, mert találtak
olyan fajokat, amelyekben az összes szatellita DNS egyetlen
kromoszómán összpontosul. Például a Drosophila nasutoides genomjának
60%-a szatellita DNS-ből áll, és ezek a 4 kromoszóma egyikén
találhatók, amely mást nem is nagyon tartalmaz. A többi kromoszómán
nem találtak szatellita DNS-t. A repetitív szekvenciák fennmaradását
tehát valószínűleg nem az biztosítja, hogy fontos szerepet tölt
be, hanem az, hogy a gyakori crossing-over hibák következtében
nagy valószínűséggel keletkezik, és megjelenése nem okoz számottevő
zavart az állat életében.
Szétszórt ismétlődő szekvenciák
A sokszorosan ismétlődő DNS
szakaszok egy része a genomban szétszórva található (dispersed
highly repetitive sequences) az intronokban, a gének promóter
régióiban, a gének közötti régiókban és a nem kódoló DNS szakaszokon.
A szétszórt szekvenciákat méretük alapján két fő osztályba sorolják:
rövid beékelődő ismétlődő szakaszok, amelyek általános neve
SINE ( a short interspersed repeated sequences angol kifejezésből)
és hosszú beékelődő ismétlődő szakaszok, amelyeket LINE-ként
említenek (a long interspersed repeated sequences angol kifejezésből).
A SINE-ok zöme 500 bp-nál
rövidebb és 105 vagy ennél több másolatban fordul
elő. Az emberi genom legismertebb rövid ismétlődő szekvencia
az Alu család.
A LINE olyan DNS szekvencia,
amely 5 kb-nál hosszabb és rendszerint legalább 104
másolatban fordul elő a genomban. Az emberi genom valószínűleg
egyetlen LINE családot tartalmaz, amelyet L1-el jelölnek. Több
jel mutat arra, hogy a az L1 szekvenciák reverz transzkripcióval
jöttek létre. Az L-1 szekvencia kb. 6 kb hosszú, egyik végén
poli-A -t tartalmaz, és a szárnyain rövid ismétlődések vannak,
amelyek hossza rendszerint 20 bp-nél kisebb. A haploid humán
genom kb. 100000 L-1 másolatot tartalmaz. Az intakt L-1 szekvenciákban
két nyitott leolvasási keret (ORF) van, az ORF-1 és az ORF-2.
Az ORF-2 által kódolt aminosav szekvencia jellegében a reverz
transzkriptáz enzimre emlékeztet. Ezek a tulajdonságok arra
utalnak, hogy az L-1 szakaszok mRNS reverz transzkripciója után
az átiratok beékelődésével jöttek létre. Mivel az L-1 szakaszok
hosszú terminális ismétlődéseket (LTR) nem tartalmaznak, retropozonoknak
tekinthetők. A humán L-1 szekvenciához hasonló LINE szakaszokat
minden emlősben, még az erszényesekben is találtak. Az L-1 kópiák
fajon belül is változatosak, a fajok közötti különbség mértéke
azonban meghaladja a fajon belüli varianciát. Egerek között
kb. 4% eltérést találtak az L-1 szakaszban, míg a humán és egér
L-1 közötti különbség kb. 30%-ra tehető.
|
|
|