Történeti áttekintés
DNS
A genom szerveződése
A genom megváltozása
Módszerek
Mendeli genetika
Populáció-genetika
Példatár
Matematikai alapok
Bioinfo
DNS törzsfa rekonstrukció

SALVE 1% bevezetés
 
   

Bioinfo linkek

Akinek ez nem elég, olvassa el Miklós István jegyzetét!

 

Mi is az a bioinformatika?

Számítógépes modellek és módszerek kidolgozása és alkalmazása a biológiai információ (szűkebb értelemben a biológiai szekvenciák) kezelésére és értelmezésére

~ Szekvencianalízis: a szekvenciában rejlő információ kinyerése, ami lehet funkció vagy evolúciós összefüggés

 

Szekvencia-adatbázisok

Típusok:

1. Nukleinsav  
  A. elsődleges nukleinsav-adatbázisok
  B. speciális nukleinsav-adatbázisok
2. Fehérje  
  A. elsődleges
  B. másodlagos és harmadlagos (szekvenciamintázat)
  C. összetett
3. Térszerkezet-adatbázisok, fehérjecsalád-adatbázisok

 

Homológiák keresése

Analógia: hasonlóság, közös eredet nélkül (konvergens evolúció eredménye lehet)

Homológia: közös evolúciós eredet lehet:

  • ortológia: különböző fajokban található, azonos evolúciós eredetű és hasonló funkciójú pl. béta-globin emberben és egérben
  • paralógia: egy fajban található, funkciójuk ált. különbözik, de közel áll egymáshoz, ált. génduplikációval jött létre pl. alfa és béta globin emberben

Szekvencia-azonosság: az összerendezésben egy pozícióban szereplő azonos bázisok ill. aminosavak aránya; 20% körül van a "twilight zone", ahol már nem dönthető el egyértelműen a homológia megléte

Páronkénti összerendezés

Célja: két szekvencia homológ részeinek a megtalálása

  • Ha bármennyi szubsztitúciót megengedünk:
ATGCGTCGTT  
  S = 5
ATCCGCGTC  

 

  • Ha bármennyi gap-et beszúrhatunk:
ATG_CGTCGTT_  
  S = 8
AT_CCG_CGT_C  

Adjunk pontszámokat! gap (g)=2; szubsztitúció (m)=1

Ez az optimális összerendezés?

A legjobb összerendezés:

ATGCGTCGTT  
  S = 4
ATCCG_CGTC  

 

Dinamikus programozás

Smith-Waterman algoritmus, 1981

D ij = min { Di-1,j + g; Di,j-1 + g; Di-1,j-1 + { 0 ha Di = Dj; m ha Di<>Dj}}

 

Kisebb bonyolítások
(valójában biológiailag relevánsabb megoldások és a hasonlósági keresésekhez fontosak)

Szubsztitúciók:

  • eddig: van vagy nincs (S=1 vagy S=0)
  • valójában: nukleotidok esetén a tranzíció gyakoribb a transzverziónál => pl. legyen S=0,5 és S=1!
ATGCGTCGTT
  S = 3,5
ATCCG_CGTC
  • a kodonok 3. poziciójában gyakoribb a szubsztitúció
  • a mutációs ráta lehet különböző régiónként

 

fehérjék esetében:

  • nagyobb a valószínűsége egy aminosavnak egy hasonló aminosavra való kicserélődésére (pl. bázikus aminosav bázikus aminosavra)

PAM = evolúciós távolság mértékegysége, 1 PAM az az idő, ami alatt két kezdetben azonos szekvencia között 1 % eltérés alakul ki

Gap-ek büntetésének változatai:

  • nukleinsavak esetén 1 bázis hosszúságú gap beszúródásának valószínűsége kisebb, mint egy 3 bázis hosszúságúé
  • a szekvenciák különböző régióiban eltéro valószínűséggel történhet deléció ill. inzerció

Gyakori megoldás: g = gap opening + gap extension

 

Többszörös összerendezés

Célja: filogenetikai analízis fehérjék esetén a motívumok megtalálása

Módszerek: a páronkénti összerendezés módszerei kiterjeszthetők több szekvenciára is, de a számítási idő exponenciálisan nő.

=> heurisztikus algoritmusok kidolgozása

pl. Clustal: páronkénti illesztés => távolság-félmátrix => UPGMA vezérfa =>a fa mentén összeillesztés

További lehetőség: többszörös összerendezés adatbázisainak használata (PRINTS, PROSITE.)

 

Adatbázisok szekvencia-hasonlósági keresései

Összerendezések alapján keresnek, de az algoritmusuk kicsit más, mint az eddigiek (azok túl lassúak lennének a nagymennyiségű szekvenciához)

Pl. (gapped) BLAST:

adott hosszúságú, bizonyos hasonlósági pontszámnál magasabb pontszámú hasonló szakaszt keres a két szekvenciában, ezután mindkét irányban kiterjeszti az összerendezést dinamikus programozással adott küszöbérték eléréséig

Szelektivitás : valódi homológok megtalálásának valószínűsége

Érzékenység : távoli homológok megtalálásának valószínűsége

 

Fehérje-térszerkezet predikció

Másodlagos szerkezet predikciója a szekvenciából:

  • az egyes aminosavtípusok különbözõ másodlagos szerkezeti elemekben való előfordulása alapján
  • aminosavak fizikai-kémiai tulajdonságai alapján
  • többszörös összerendezéseken alapuló mesterséges neuronhálóval (ez alapján felismerhetők a konzervatív régiók, amik ált. nem a fehérje szélén vannak, vagy pl. az együttesen mutálódó részek gyakran egymáshoz közel esnek)
  • legjobbak: konszenzusos módszerek

Eszközök: http://www.expasy.org/tools/

 

3D térszerkezet predikciók

Homológiamodellezés (20-30% szekvenciaazonosságnál):

Pl. lánctöredékek összerakása: Ismert térszerkezetű fehérjékkel összerendezés => variábilis és konzerválódott régiók felismerése => konzerválódott régió: térszerkezet kb. ugyanaz mindben => variábilis régió: kikeressük a leghasonlóbbat az ismertek közül => durva szerkezeti modell, amely még finomítható pl. energiaminimalizálással

Fold recognition Ismert térszerkezetekre megpróbálják "felfűzni" az új szekvenciát, aztán valamilyen függvénnyel értékelik a szerkezet és a szekvencia illeszkedését

Ab initio szerkezetjóslás : ha a többi módszer nem használható

 

Genomika

Genomika : a teljes genom információjának tanulmányozása

funkcionális ~: gének funkciójának megtalálása

szerkezeti ~: a génekben kódolt fehérjék térszerkezetének megtalálása

Módszerek:

 

A szekvenciaanalízis javasolt stratégiája
(Dr. Szilágyi András nyomán)

additional readings:

Szerző: Schrott Anikó
Szerkesztő:Kabai Péter
Megírás: .2003
Módosítás: .2004

 

 

 

 

 

 

 

{out}