Top Banner
BIOLOGICZNE BAZY DANYCH (2) GENOMY I ICH ADNOTACJE Podstawy Bioinformatyki wykład 4
58

BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

Feb 28, 2019

Download

Documents

danglien
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

BIOLOGICZNE BAZY DANYCH (2)GENOMY I ICH ADNOTACJE

Podstawy Bioinformatyki

wykład 4

Page 2: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

GENOMY I ICH ADNOTACJE

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 2

UCSCEnsemblNCBI

Page 3: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

GENOMY I ICH ADNOTACJE

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 3

NCBI

Page 4: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

NCBI REFERENCE SEQUENCE DATABASE

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 4

NCBI RefSeq:

kompleksowy, zintegrowany, niepowtarzalny dobrze opisany zestaw sekwencji referencyjnych

genomy, transkrypty, białka

baza niepowtarzalna (non-redundant)

informacje sprawdzone (często weryfikowane manualnie)

Page 5: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

NCBI REFERENCE SEQUENCE DATABASE

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 5

NCBI RefSeq:

kompleksowy, zintegrowany, niepowtarzalny dobrze opisany zestaw sekwencji referencyjnych

genomy, transkrypty, białka

baza niepowtarzalna (non-redundant)

Page 6: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

NCBI REFERENCE SEQUENCE DATABASE

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 6

Page 7: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

NCBI REFERENCE SEQUENCE DATABASE

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 7

Page 8: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

NCBI REFERENCE SEQUENCE DATABASE

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 8

Page 9: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

NCBI REFERENCE SEQUENCE DATABASE

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 9

Page 10: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

NCBI REFERENCE SEQUENCE DATABASE

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 10

Identyfikatory:

NM_numer / XM_ numer mRNA

NP_numer / XP_numer białka

NR_ numer / XR_ numer niekodujące RNA

NC_ numer, NG_ numer kontigi, sekwencje genomowe

N – sekwencje uzyskane z wyników eksperymentów

X – sekwencje z adnotacji (sekwencja została przewidziana np. przez zmapowanie białka do genomu spokrewnionego organizmu)

Page 11: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

NCBI REFERENCE SEQUENCE DATABASE

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 11

Page 12: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

NCBI GENOME DATABASE

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 12

Page 13: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

NCBI GENOME DATABASE

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 13

Page 14: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

NCBI DOWNLOADFTP (FILE TRANSFER PROTOCOL)

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 14

Page 15: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

GENOMY I ICH ADNOTACJE

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 15

EnsemblNCBI

Page 16: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

ENSEMBL

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 16

„Przeglądarka” genomów kręgowców

Wspiera badania z zakresu genomiki porównawczej, ewolucji i regulacji ekspresji genów

Dostępne narzędzia: BLAST, BLAT, BioMart, Variant Effect Predictor (VEP)

Page 17: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

ENSEMBL

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 17

Ensembl

EnsemblGenomes

EnsemblFungi

EnsemblMetazoa

EnsemblProtists

EnsemblBacteria

EnsemblPlants

PreEnsembl

Page 18: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

ENSEMBL

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 18

Identyfikatory (Homo sapiens):

ENSG→ Gene

ENST→ Transcript

ENSP→ Protein

ENSE→ Exon

Identyfikatory (inne gatunki):

ENSFCAT00000032635 Felis catus

ENSRNOG00000050313 Rattus norvegicus

ENSCAFG00000022708 Canis lupus familiaris

ENSBTAT00000064726 Bos taurus

Zagadka:

ENST00000471181.7 ? ?

ENSRNOT00000075759.1 ? ?

ENSSSCG00000018060 ? ?

Page 19: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

ENSEMBL

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 19

Page 20: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

ANALIZA DANYCH NGS 2017/2018 MAGDA MIELCZAREK 20

Page 21: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

ENSEMBL

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 21

Page 22: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

ENSEMBL

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 22

Page 23: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

ENSEMBL

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 23

Page 24: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

ENSEMBL

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 24

Na którym chromosomie leży gen BRCA1?

Ile ma form splicingowych?

Page 25: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

ENSEMBL

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 25

Który transkrypt jest najdłuższy?

Page 26: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

ENSEMBL

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 26

Który transkrypt jest najdłuższy?

Page 27: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

ENSEMBL

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 27

Downloads → Download data via FTP

Page 28: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

ENSEMBL

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 28

Downloads → Download data via FTP

Page 29: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

ENSEMBL

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 29

Masked and unmasked genome sequences associated with the

assembly (contigs, chromosomes etc.)

Coordinate-system string: coord_system:version:name:start:end:strand

Page 30: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

ENSEMBL

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 30

cDNA sequences for Ensembl or ab initio predicted genes.

Page 31: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

ENSEMBL

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 31

Non-coding RNA gene predictions.

Page 32: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

ENSEMBL

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 32

Protein sequences for Ensembl or ab initio predicted genes.

Page 33: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

ENSEMBL

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 33

GTF → Gene sets for each species. These files include annotations of

both coding and non-coding genes.

GFF3 → provides access to all annotated transcripts which make up

an Ensembl gene set.

Page 34: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

ENSEMBL

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 34

GTF → Gene sets for each species. These files include annotations of

both coding and non-coding genes

Page 35: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

ENSEMBL

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 35

GFF3 → provides access to all annotated transcripts which make up

an Ensembl gene set

Page 36: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

ENSEMBL TOOLS

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 36

VEP → Analyse your own variants and predict the functional

consequences of known and unknown variants

Page 37: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

VEP

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 37

VEP → Analyse your own variants and predict the functional

consequences of known and unknown variants

Page 38: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

VEP

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 38

VEP → Analyse your own variants and predict the functional

consequences of known and unknown variants

Page 39: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

BIOMART

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 39

BioMart → Export custom datasets from Ensembl with this data-mining

tool

Page 40: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

BIOMART

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 40

BioMart → Export custom datasets from Ensembl with this data-mining

tool

Dataset:

Ensembl genes

Mouse strains

Ensembl Variation

Ensembl Regulation

Page 41: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

BIOMART

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 41

BioMart → Export custom datasets from Ensembl with this data-mining

tool

Filters → specifikacja przeszukiwań

Atributes → określenie formatowania danych wyjściowe

Count → dostępne rekordy o określonych parametrach

Results → wyniki, eksport plików

Page 42: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

BIOMART

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 42

BioMart → Export custom datasets from Ensembl with this data-mining

tool

Page 43: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

BIOMART

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 43

BioMart → Export custom datasets from Ensembl with this data-mining

tool

Page 44: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

BIOMART

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 44

BioMart → Export custom datasets from Ensembl with this data-mining

tool

Page 45: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

BIOMART

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 45

BioMart → Export custom datasets from Ensembl with this data-mining

tool

Page 46: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

GENOMY I ICH ADNOTACJE

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 46

UCSCEnsemblNCBI

Page 47: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

UCSC

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 47

Page 48: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

UCSC

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 48

Page 49: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 49

Page 50: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

UCSC – GEN PAH

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 50

Gen PAH (enzym hydroksylazy fenyloalaninowej)

Na którym chromosomie jest zlokalizowany?

Jakiej długości jest sekwencja?

Page 51: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

UCSC – GEN PAH

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 51

Gen PAH (enzym hydroksylazy fenyloalaninowej)

Ile ma wariantów splicingowych?

Ile ma egzonów?

Page 52: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

UCSC – GEN PAH

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 52

Gen PAH (enzym hydroksylazy fenyloalaninowej)

Czy zawiera elementy powtarzalne?

Ile w danym regionie zaobserwowano SNP?

Page 53: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

UCSC – GEN PAH

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 53

Gen PAH (enzym hydroksylazy fenyloalaninowej)

Gdzie ulega najwyższej ekspresji?

Page 54: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

UCSC – OPCJE WYŚWIETLANIA

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 54

Page 55: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

UCSC

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 55

Page 56: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

UCSC – TABLE BROWSER

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 56

Wszystkie znane geny z bazy UCSC dla myszy

Chromosome 1

Format BED

Page 57: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

UCSC – TABLE BROWSER

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 57

Wszystkie znane geny z bazy UCSC dla myszy

Chromosome 1

Format BED

Page 58: BIOLOGICZNE BAZY DANYCH (2)theta.edu.pl/wp-content/uploads/2018/05/PodstBioinf_wd4.pdf · genomy i ich adnotacje podstawy bioinformatyki 2017/2018 magda mielczarek 2 ncbi ensembl

UCSC – TABLE BROWSER

PODSTAWY BIOINFORMATYKI 2017/2018 MAGDA MIELCZAREK 58

Wszystkie znane geny z bazy UCSC dla myszy

Chromosome 1

Format BED