Fehérje domének és exonok
A
fehérjék amint említettük, gyakran több külön kódolt alegységből
állnak. Nem ritka azonban az sem, hogy a fehérje egyetlen molekulán
belül is tartalmaz hasonló szakaszokat. A fehérje molekulákban
többnyire körvonalazható egy-egy olyan rész, amely specifikus
funkciót lát el (pl. megköti a szubsztrátot), vagy amely jól
felismerhető, kompakt szerkezetet alkot (pl. egy strukturális
alegység). Ezeket az részegységeket funkcionális, illetve strukturális
doméneknek nevezik (functional, structural domain). A fehérje
funkciójához szükséges aminosavak szét is lehetnek szórva az
elsődleges szerkezet sok pontján, ilyen esetben nehéz meghatározni
a funkcionális domén határait. A strukturális domének határai
általában pontosan meghatározhatók.
Számos fehérjében meghatározták
a strukturális domének határait, és a fehérjét kódoló gén szekvenciáját.
Többé-kevésbé pontos összefüggést lehet találni a gén exonjai
és a fehérjék doménjei között (Go, 1981). A legegyszerűbb esetben
egy exon egy domént határoz meg. Van arra is példa, hogy egyetlen
domént egynél több exon kódol. Sokkal gyakoribb azonban, hogy
számos domént intron-mentes génszakasz, tehát egyetlen exon
határoz meg. Bár az exonok és intronok közötti megfelelés nem
teljesen egyértelmű, egyetlen olyan fehérjét sem találtak, amelyben
a fehérje domén struktúrája és a gén exon-intron szerkezete
között ne lett volna valamiféle összefüggés.
A hemoglobin a és b láncai például 4-4 domént tartalmaznak,
az ezeket meghatározó gének pedig mindössze három exont. A szúnyog
globin génje egyáltalán nem tartalmaz intront, az állatok globin
fehérjéjével homológ növényi leghemoglobin génje ugyanakkor
4 exonból áll. Az exonok és domének közötti összefüggések azonban
ebben az esetben világossá válnak, ha a globin gének lehetséges
evolúciós változásait vesszük figyelembe. Feltételezhető, hogy
az ősi globin gén szerkezete a növényi leghemoglobin gén szerkezetére
hasonlított, és az evolúció során intronok kiesése miatt tűnt
el az exon-domén egyértelmű megfelelés.

(Meglepő lehet, hogy a fetételezett
ősi génben 3 nem kódoló szakasz (intron) van, és az evolúció
során ezekből egy vagy mind elveszett. Ma a legtöbben úgy vélik,
hogy minden génre nézve a sok intron jelenti az eredeti állapotot.
A prokarióták génjei másodlagosan veszítették el intronjaikat.
További példa angolul www)
Számos fehérjében az egyes
domének aminosav sorrendje hasonló, és ilyenkor könnyen belátható,
hogy a hasonló doméneket kódoló exonok ugyanannak az eredeti
szakasznak a másolatai. A mutációk következtében az egyes szakaszok
között azonban olyan nagy különbségek is létrejöhetnek, hogy
elfedhetik az eredeti közös származást. Az immunglobulin fehérjék
konstans és variábilis régióinak aminosavsorrendje például nagy
változatosságot mutat. Közös származásra utal azonban e régiók
másodlagos szerkezete, amelyeknek hasonlósága sokkal inkább
megmaradt, mint a tényleges szekvencia. Feltételezhető tehát,
hogy a génen belüli szekvencia duplikáció jóval gyakoribb jelenség
az evolúció során, mint azt a bázis-sorrendek összehasonlítása
alapján feltételezhetjük.
Táblázat Néhány fehérje, amely
belső domén duplikációt tartalmaz
| Szekvencia |
a
fehérje hosszaa |
az
ismétlés hossza |
ismétlések száma |
ismétlődés
arányab |
| Imunnoglobulin
e-lánc C régiója (humán) |
423 |
108 |
4 |
100 |
| Imunnoglobulin
g-lánc C régiója (humán) |
329 |
108 |
3 |
98 |
| Szérum
albumin (humán) |
584 |
195 |
3 |
100 |
| Parvalbumin
(humán) |
108 |
39 |
2 |
72 |
| Ferredoxin
(Clostridium) |
55 |
28 |
2 |
100 |
| Plasminogen
(humán) |
790 |
79 |
5 |
50 |
| Kalcium
függő regulátor protein (humán) |
148 |
74 |
2 |
100 |
| Tropomiozin
a lánc (humán) |
284 |
42 |
7 |
100 |
Barker és mtsai után (1978)
a aminosav szekvencia
hossza
b az ismétlődő szekvenciák
hossza a protein teljes hosszának százalékában
|