Történeti áttekintés
DNS
A genom szerveződése
A genom megváltozása
Módszerek
Mendeli genetika
Populáció-genetika
Példatár
Matematikai alapok
Bioinfo
DNS törzsfa rekonstrukció

SALVE 1% Nem kódoló szekvenciák
 
   
 
     
     
     

 Az eukarióta nukleáris DNS nem kódoló szakaszai

 A következőkben a genom növekedésének néhány következményét vizsgáljuk meg elsősorban abból a szempontból, hogy a zoológus munkájához milyen "anyag" áll rendelkezésre. Amint említettük, a transzpozíció, a gén- vagy genom duplikációt követő mutációk gyakran olyan DNS szakaszt eredményeznek, amelyek elvesztették eredeti kódoló funkciójukat. Az eukarióta géneken belül is rendszerint nagy számban vannak olyan beékelődött szakaszok (interspersed sequence, intron), amelyek ugyan átfordítódnak RNS szekvenciára, de a fehérjeszintézis előtt a pre m-RNS-ből kihasítódnak. Az intronok száma génről génre változik. Vannak gének, amelyek tucatnyi intront tartalmaznak, amelyek között több ezer nukleotid hosszúságú is lehet. Más gének (pl. a legtöbb hiszton gén) egyáltalán nem tartalmaznak intront. Ezzel együtt, a legtöbb fehérjét kódoló nukleáris gén bázisszekvenciáinak zömét intronok alkotják.

 A nem kódoló szekvenciák a zoológus számára fontos információkat hordoznak pl. a fajok közötti genetikai távolságok becsléséhez. Most röviden áttekintjük az ismétlődő szakaszok fajtáit, abból a szempontból, hogy hol találhatók a genomban, mekkorák, és mit tartalmaznak.

 Az ismétlődő szekvenciák (repetitive sequences) több formáját szokás megkülönböztetni. A sokszorosan ismétlődő (highly repetitive) szekvenciák rövidek, hosszuk néhány bázispár és több száz bázispár között változik, és a genomban igen nagy ismétléssel fordulnak elő (átlagosan félmillió másolatban). Vannak ezeknél jóval hosszabb, több száz vagy ezer bp. nagyságú szakaszok, amelyek kevesebb, néhány száz példányban fordulnak elő a genomban (middle-repetitive DNA). A repetitív szekvenciáknak nem csak hossza, de eloszlása is változatos: a nem kódoló szakaszok másolatai a genomban vagy szétszórva találhatók, vagy egymás mögött, mint utasok a tandem kerékpáron.

 

Lokalizált repetitív szekvenciák

 A legtöbb eukarióta genomban nagy mennyiséget képviselnek az egymás után elhelyezkedő (tandem), sokszorosan ismétlődő DNS szekvenciák. Néhány fajban ezek teszik ki a genom többségét. A patkány kenguru (Dipodomus ordii) genomjának több mint fele háromféle ismétlődő szekvenciából áll: AAG (2,4 milliárd másolat), TTAGGG (2,2 milliárd másolat) és ACACAGCGGG (1,2 milliárd másolat). A másolatok azonban nem hajszálpontosan azonosak: a TTAGGG szekvencia családban például találtak TTAGAG változatot is. Ezzel együtt, a tandem repetitív szekvenciák egyszerű eszközökkel elválaszthatók a DNS többi részétől, amely sokkal változatosabb bázis-sorrendű szakaszokból áll. A könnyen elkülöníthető, tandem, sokszorosan ismétlődő DNS szakaszokat szatellita DNS-nek (satellite DNA) nevezik. Mivel e szakaszok hossza eltérő, ezért szokás ezeket mint változó hosszúságú tandem ismétléseket (variable number of tandem repeats = VNTR) említeni. 

 

Mivel a szatellita DNS nem íródik át és így valószínűleg semmilyen genetikai információt nem tartalmaz, felmerül a kérdés, hogy hogyan keletkezett, van-e valami funkciója és miért maradhatott fent. A lokalizált repetitív szekvenciák keletkezését illetően több elképzelés is van, amelyek közül két mechanizmus tekinthető általánosan elfogadottnak: a gén konverzió (gene conversion) és az egyenlőtlen átkapcsolódás (unequal crossing over) (ábra).

 

A szatellita DNS funkciója nem ismert és valószínűleg nincs is funkciója. Nem játszhat jelentős szerepet a kromoszóma stabilizálásában, mert találtak olyan fajokat, amelyekben az összes szatellita DNS egyetlen kromoszómán összpontosul. Például a Drosophila nasutoides genomjának 60%-a szatellita DNS-ből áll, és ezek a 4 kromoszóma egyikén találhatók, amely mást nem is nagyon tartalmaz. A többi kromoszómán nem találtak szatellita DNS-t. A repetitív szekvenciák fennmaradását tehát valószínűleg nem az biztosítja, hogy fontos szerepet tölt be, hanem az, hogy a gyakori crossing-over hibák következtében nagy valószínűséggel keletkezik, és megjelenése nem okoz számottevő zavart az állat életében.

 

Szétszórt ismétlődő szekvenciák

A sokszorosan ismétlődő DNS szakaszok egy része a genomban szétszórva található (dispersed highly repetitive sequences) az intronokban, a gének promóter régióiban, a gének közötti régiókban és a nem kódoló DNS szakaszokon. A szétszórt szekvenciákat méretük alapján két fő osztályba sorolják: rövid beékelődő ismétlődő szakaszok, amelyek általános neve SINE ( a short interspersed repeated sequences angol kifejezésből) és hosszú beékelődő ismétlődő szakaszok, amelyeket LINE-ként említenek (a long interspersed repeated sequences angol kifejezésből).

 A SINE-ok zöme 500 bp-nál rövidebb és 105 vagy ennél több másolatban fordul elő. Az emberi genom legismertebb rövid ismétlődő szekvencia az Alu család.

 A LINE olyan DNS szekvencia, amely 5 kb-nál hosszabb és rendszerint legalább 104 másolatban fordul elő a genomban. Az emberi genom valószínűleg egyetlen LINE családot tartalmaz, amelyet L1-el jelölnek. Több jel mutat arra, hogy a az L1 szekvenciák reverz transzkripcióval jöttek létre. Az L-1 szekvencia kb. 6 kb hosszú, egyik végén poli-A -t tartalmaz, és a szárnyain rövid ismétlődések vannak, amelyek hossza rendszerint 20 bp-nél kisebb. A haploid humán genom kb. 100000 L-1 másolatot tartalmaz. Az intakt L-1 szekvenciákban két nyitott leolvasási keret (ORF) van, az ORF-1 és az ORF-2. Az ORF-2 által kódolt aminosav szekvencia jellegében a reverz transzkriptáz enzimre emlékeztet. Ezek a tulajdonságok arra utalnak, hogy az L-1 szakaszok mRNS reverz transzkripciója után az átiratok beékelődésével jöttek létre. Mivel az L-1 szakaszok hosszú terminális ismétlődéseket (LTR) nem tartalmaznak, retropozonoknak tekinthetők. A humán L-1 szekvenciához hasonló LINE szakaszokat minden emlősben, még az erszényesekben is találtak. Az L-1 kópiák fajon belül is változatosak, a fajok közötti különbség mértéke azonban meghaladja a fajon belüli varianciát. Egerek között kb. 4% eltérést találtak az L-1 szakaszban, míg a humán és egér L-1 közötti különbség kb. 30%-ra tehető.

 

 

   
Új fejlemény: Tiny slice of genome reveals bustling activity in the gaps between genes (Scientific American)    
     
     
     
     
     
     
     

 

   
     
     
     
     

 

Szerző: Kabai Péter
Szerkesztő:Kabai Péter
Megírás: 91-01-30
Módosítás: .

 

 

 

 

 

 

 

{.