Ricerche in banche dati
Ricerche in banche dati
Ricerche in banche dati
UNIPROT PROTEINASCONOSCIUTA
Ricerca
PROT_24563 - KinasiPROT_534346 - FosfatasiPROT_33463 - Prot di membranaPROT_234234 - Kinasi di membranaPROT_23423 - Fattore di trascrizione
Per similarità di sequenzaID Orga
nismo
Sequenza
RPD2_HUMAN Human
MTERENNVYKAKLAEQAERYDEMVEAFYYKMKGDYHRYLAEFIAMNDLPP
FFS_MOUSE Mouse MKKVASMDVELTVE ERNLLSVAYKDFLEKHLIPCATSGESKVFYHPIRLGL
RHA_MOUSE Mouse ASKKJFOWERMPVCOVCOXKVODFKAAFDDAIAELDTLSEIRLGLALNF
GCN4_YEAST Yeast LNVLEKHLIPCATSGESKVFYYKMKGDYHRYLAEFATGSDRKDAAENSLIYKA
RAS_HUMAN Human
LNSPDR ACRLAKAAFDDAIAELDTLS EESYKDSTLI MQLLRDNLTLALNFS
ID Similarità
RPD2_HUMAN 254
FFS_MOUSE 128
RHA_MOUSE 95
GCN4_YEAST 12
RAS_HUMAN 10
Smith-Waterman5 appaiamenti
ENNVYKAKLAEQAERYDEMVEAFRENNVYKAK
Sequenza query
Risultati
Banca dati
Metodi Euristici
Algoritmoesaustivo
Algoritmoeuristico
Cervelloumano
Allineamento a occhio
Lettere e ParoleLettere = A,B,D,E,F,G,H, ..., Y
7 aminaocidi: L, T, A, G, A, G, I
Sequenza LTAGAGI lunghezza =7 contiene:
8000 Parole di lunghezza 3 =AAA, AAB, AAC, .., ABA, ABB, .., BAA, BAB, ..
400 Parole di lunghezza 2 = AA, AB, AC, .., BA, BB, BC, .., CA, ..
Parole = GTY, ADEF, TR, etc..
4 parole lunghe 4: LTAG, TAGA, …, …
5 parole lunghe 3: LTA, TAG, AGA, GAG, AGI
6 parole lunghe 2: LT, TA, AG, GA, AG, GI
Allineamenti con parole tg rd pl di dw lw ie wt LTGARDWEDIPLWTDDIEQES TGCRDWTDDPLWTQDIENSCNTD
8 Parole identicheDi lunghezza 2
rdw plw die lwt LTGARDWEDIPLWTDDIEQES TGCRDWTDDPLWTQDIENSCNTD
4 Parole identicheDi lunghezza 3
Matrice di parole
A G W W R A A W A A R G W A G A
G
W
W
R
A
G
W
A
A
* * *
* * * *
* * * *
* *
* * * * * * *
* * *
* * * *
* * * * * *
* * * * * * *
Matrice di parole
A G W W R A A W A A R G W A G A
G
W
W
R
A
G
W
A
A
13 Coppie di parole identiche di lunghezza 2
* * *
* * * *
* * * *
* *
* * * * * * *
* * *
* * * *
* * * * * *
* * * * * * *
*
*
Parola 2
Matrice di parole
A G W W R A A W A A R G W A G A
G
W
W
R
A
G
W
A
A
13 Coppie di parole identiche di lunghezza 2
*
*
Parola 2
FastA-------- Sequenza A ------------->
-------- Seq
uen
za B
----------->
-------- Sequenza A ------------->
-------- Seq
uen
za B
----------->
Matrice di punti
Matrice di parole di lunghezza 2
Matrice di parole 2A G W W R A A W A A R G W A G A
E
W
W
R
A
G
W
A
A
Unione diagonaliA G W W R A A W A A R G W A G A
E
W
W
R
A
G
W
A
A
Unione parole contigue-------- Sequenza A ------------->
-------- Seq
uen
za B
----------->
-------- Sequenza A ------------->
-------- Seq
uen
za B
----------->
Calcolo similarità-------- Sequenza A ------------->
-------- Seq
uen
za B
----------->
-------- Sequenza A ------------->
-------- Seq
uen
za B
----------->
Inserimento gaps-------- Sequenza A ------------->
-------- Seq
uen
za B
----------->
-------- Sequenza A ------------->
-------- Seq
uen
za B
----------->
Calcolo Opt-------- Sequenza A ------------->
-------- Seq
uen
za B
----------->
Parole con errori
10 Parole lunghe 3 con 1 errore ammesso
LTAGARIDEDWEDISLHDWRTDWTSGCRKDEWWTWDSIHSTQWSD
LTAGARIDEDWEDISLHDWRTDWTSGCRKDEWWTWDSIHSTQWSD
LTAGARIDEDWEDISLHDWRTDWTSGCRKDEWWTWDSIHSTQWSD
Nessuna parola identica di lunghezza 3
18 Parole lunghe 4 con 2 errori ammessi
EDWEWW
Parole lunghezza 3Identiche con 1 Errore
EDWLEWWA
Parole lunghezza 4Identiche con 2 Errori
Parole similiSLH 16SIH 14SMH 13SVH 13ALH 13TLH 13NLH 13------SFH 12DLH 12KLH 12TMQ 11......
SLHTutte le 8000 parole
di lunghezza 3
Matrice disostituzione
Calcolopunteggio di similarità
e ordinamentoSLH
||| 4+5+7=16 SIH
SLH||| 1-1-2=-2 AAA
SLH||| -1+6+7=12 DLH
Parole similia SLH
Parole Non-similiA SLH
Valore soglia = 12
Blast-------- Sequenza A ------------->
-------- Seq
uen
za B
----------->
-------- Sequenza A ------------->
-------- Seq
uen
za B
----------->
N W H N N L C R H WC -4 -8 -3 -4 -4 -6 12 -4 -3 -8W -4 17 -3 -4 -4 -2 -8 2 -3 17Y -2 0 0 -2 -2 -1 0 -4 0 0M -2 -4 -2 -2 -2 4 -5 0 -2 -4C -4 -8 -3 -4 -4 -6 12 -4 -3 -8G 0 -6 -2 0 0 -4 -3 -3 -2 -6K 1 -3 0 1 1 -3 -5 3 0 -3Q 1 -5 3 1 1 -2 -5 1 3 -5N 2 -4 2 2 2 -3 -4 0 2 -4
- Parole lunghezza 3 similarità > di 14
N W H N N L C R H WC -4 -8 -3 -4 -4 -6 12 -4 -3 -8W -4 17 -3 -4 -4 -2 -8 2 -3 17Y -2 0 0 -2 -2 -1 0 -4 0 0M -2 -4 -2 -2 -2 4 -5 0 -2 -4C -4 -8 -3 -4 -4 -6 12 -4 -3 -8G 0 -6 -2 0 0 -4 -3 -3 -2 -6K 1 -3 0 1 1 -3 -5 3 0 -3Q 1 -5 3 1 1 -2 -5 1 3 -5N 2 -4 2 2 2 -3 -4 0 2 -4
- Parole lunghezza 3 similarità > di 14 - Estensione fino a quando similarità > di 10
Migliore Punteggio- Lunghezza della sequenza
- Grandezza banca dati
- Composizione della sequenza
Punteggio sequenze random
PunteggioOPT
100 200 300 400 500 600 700 800 900100
0110
0120
0130
0
Opt = 1070
NumeroSequenzecasuali 70
60
50
40
30
20
10
Significatività statistica
PunteggioOPT
NumeroSequenzecasuali
100 200 300 400 500 600 700 800 900100
0110
0120
0130
0
70
60
50
40
30
20
10
Opt = 1070
Significatività statistica
PunteggioOPT
NumeroSequenzecasuali
100 200 300 400 500 600 700 800 900100
0110
0120
0130
0
70
60
50
40
30
20
10
E = 1.21*10-21
E value =Numero atteso per caso di sequenze con punteggio > opt