Laporan PraktikumHari/ Tanggal: Kamis/ 04 Desember
2014BioinformatikaWaktu: 09.00-11.00PJP: Dr Laksmi Ambarsari
MSAsisten: Asep Didi Suryadi M. Maftuchin S Rini Kurniasih
PRIMER DESIGN DAN MULTIPLE SEQUENCE ALIGNMENT
Kathirina B Riwu Wolo G841110021Desi AmaliawatiG84110037
DEPARTEMEN BIOKIMIAFAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN
ALAMINSTITUT PERTANIAN BOGORBOGOR2014
PENDAHULUANBioinformatika adalah organisasi dan analisis komplek
data yang dihasilkan dari analisa molekuler dan teknik biokimia,
disamping itu bioinformatika merupakan teknologi untuk koleksi,
peyimpanan analisis, interprestasi, pelepasan dan aplikasi untuk
informasi biologi. Analisis dilakukan dengan cara membandingkan
data yang masuk dengan ribuan data lain yang tersedia di dalam
pangkalan data. Suatu urutan DNA ataupun asam amino dari hasil
sekuensing dapat diketahui kemiripannya dengan urutan yang
tersimpan dalam data base melalui teknik bioinformatik. Bahkan dari
urutan DNA maupun asam amino yang ada, dapat diprediksikan peran
proteinnya, tingkat aktivitas dan mekanisme kerjanya menggunakan
berbagai jenis perangkat lunak yang tersedia. Selain itu, dengan
bioinformatik perancang primer untuk mendeteksi keberadaan suatu
gen dari spesies tertentu dapat dilakukan (Krane dan Raymer 2003).
Bioinformatika juga menerjemahkan penemuan ke klinik dengan
menyebarkan penemuan melalui curated, database dicari seperti Pharm
GKB, dbGaP, PacDB dan FDAAERS. Sebuah hambatan utama bagi database
ini adalah kurasi manual data. Secara biologis dan secara medis
fokus pada teks penambahan algoritma yang dapat mempercepat koleksi
data terstruktur, seperti metode yang menggunakan sintaks kalimat
dan pengolahan bahasa alami untuk mendapatkan obat-gen dan gen-gen
interaksi dari literatur ilmiah. Database dan metode ini perlu
dikembangkan dan digunakan dengan hati-hati. Semua sumber-sumber
data yang rentan terhadap kesalahan dan sehingga validasi data
sangat penting, terutama sebelum informasi tersebut diterapkan di
klinik (Mount 2001).Gen yang dianalisis pada praktikum ini adalah
gen p53 yang diperoleh dari individu Mus musculus baik yang mutan
maupun yang tidak mutan. Gen p53 adalah tumor suppressor gene yang
sering termutasi pada kanker manusia. Hilangnya fungsi G1-S
checkpoint menjadi hallmark dari kanker dengan mutasi pada p53
(Gambar 1).
Gambar 1 Peranan gen p53Praktikum ini bertujuan mendesain primer
heterologus yang spesifik untuk mengamplifikasi fragmen ataupun
full length dari suatu gen baik secara manual maupun dengan
menggunakan program. Selain itu pula melatih untuk mencari domain
atau daerah terkonservasi menggunakan multiple sequence
alignment.
METODE PRAKTIKUMPraktikum Primer Design dan Multiple Sequence
Aligment ini dilaksanakan di Ruang Kelas C9-C10, Fakultas
Peternakan IPB, pada tanggal 4 Desember 2014 pukul 09.00-11.00 WIB.
Alat Alat-alat yang digunakan pada percobaan ini adalah laptop,
flashdrive, modem. Prosedur PercobaanPencarian daerah terkonservasi
dari suatu gen. Untuk mendapatkan sekuen-sekuen yang homolog dari
genp53 akan dilakukan dari situs NCBI, dipilih analisis blastn.
Dari hasil blast dipilih beberapa sekuen yang menunjukkan homolohi
cukup tinggi dengan query (nilai bit score tinggi) dan diklik pada
accession numbernya. Sekuen yang merupakan full length CDS dipilih.
Display diubah ke dalam bentuk FASTA kemudian sekuen di copy ke
file baru di Notepad. Setelah itu, dibuka program Multiple sequence
alignment ClustalW dan dimasukkan set sekuen dari Notepad dengan
cara copy dan paste ke box input sequence. File sekuen juga dapat
diunduh secara langsung dari situs NCBI. Daerah yang menunjukkan
homologi sekuen yang tinggi diantara seluruh sekuen yang disebut
daerah terkonservasi pada hasil alignment diperhatikan, diambil
lalu di copy dan paste ke Notepad dan disimpan. Sekuen tersebut
akan menjadi basis sekuen untuk mendesain primer heterologus
spesifik untuk mengamplifikasi gen p53.Pendesainan primer secara
manual. Sekuen Open Reading Frame dari gen p53 pada Mus musculus
dan daerah terkonservasi diberikan. Masing-masing sekuen tersebut
didesain sepasang primer (forward dan reverse) dengan ketentuan di
buku penuntun praktikum. Kemudian ditentukan sekuen kedua pasang
primer beserta suhu annealingnya. Hasil desain primer yang
dilakukan secara manual dibandingkan dengan yang didesain
menggunakan program komputer. Untuk mencari sekuen reverse
complement primer dapat menggunakan program
(http://www.bioinformatics.org/SMS/rev_comp.html).Pendesainan
primer menggunakan program komputer. Pertama-tama dibuka situs
program Primer3 (http://frodo.wi.mit.edu/) kemudian sekuen target
dicopy pada box input sequence. Parameter yang diinginkan dipilih
atau dapat diikuti default yang ada di program apabila sesuai
kecuali mungkin ukuran produk PCR yang diinginkan, dipilih salah
satu dari beberapa pilihan yang disediakan. Kemudian diklik pick
primer. Akan tampak beberapa pilihan primer forward dan reverse,
lalu dipilihlah yang terbaik.Analisis gen/protein family dengan
multiple sequence alignment. Satu set sekuen protein dari bZIP
transcription factor pada beberapa tanaman diberikan pada buku
penuntun praktikum. Kemudian dicoba untuk melakukan multiple
sequence alignment dengan menggunakan ClustalW atay ClustalX.
Output dari alignment sekuen bZIP tersebut diperhatikan protein
domain atau motif yang terkonservasi dari transcription factor bZIP
dan perbedaan antara daerah terkonservasi antarspesies maupun satu
spesies tanaman.
HASIL DAN PEMBAHASANSekuen sebagian digunakan untuk menemukan
potensi homolog yang akan digunakan untuk menduga fungsi dari query
sekuen yang merupakan target sekuen yang dibutuhkan untuk
menganalisis atau untuk membantu dalam permodelan pada struktur 3
dimensi.Setelah informasi terkumpul dalam database, langkah
berikutnya adalah menganalisa data. Pencarian database umumnya
berdasar hasil alignment/pensejajaran sekuen, baik sekuen DNA
maupun protein. Metode ini digunakan berdasar kenyataan bahwa
sekuen DNA/protein bisa berbeda sedikit tetapi memiliki fungsi yang
sama. Salah satu perangkat lunak yang digunakan untuk melakukan
alignment terhadap sekuen terbatas di antaranya yang lazim
digunakan adalah CLUSTAL dan CLUSTAL W.Clustal adalah program
bioinformatrika untuk alignment multiple ( multiple aligment) yaitu
aligment beberapa sekuens sekaligus. Dua varian utama clustal
adalah clustal W dan clustal X.
Gambar 1 Tampilan ClustalW
Gambar 2 Daerah terkonservasi hasil aligment menggunakan
clustalWClustal W adalah suatu program umum yang bertujuan untuk
sekuensing alignment ganda. Langkah selanjutnya yaitu menganalisis
sekuens asam amino menggunakan program ClustalX2.1, pada gambar 3
diperoleh daerah terkonservasi yang ditandai dengan tanda bintang
*, daerah terkonservasi dapat digunakan sebagai primer untuk ketiga
sekuens tersebut, daerah terkonservasi pada analisis ini cukup
panjang, hal ini disebabkan karena sekuens yang didapat diperoleh
dari gen p53, namun dengan mutasi dan tanpa mutasi yang
dibandingkan
Gambar 3 Sekuens nukleotida gen p53Primer juga dapat didesain
secara manual menggunakan ORF dan dihitung nilai tm.
Gambar 4 Pencarian reverse complement Desain primer secara
manualtm= 4(G+c) + 2(A+T)= 4(7)+ 2(3)= 28 + 6= 34Disain primer
dapat menggunakan program dari PRIMER3 yang dapat diakses melalui
internet. PRIMER3 merupakan program untuk perancangan primer.
Primer berfungsi sebagai penginisiasi reaksi polimerisasi DNA
secara in vitro, karena tanpa primer, reaksi polimerisasi DNA tidak
akan terjadi meskipun enzim dan komponen lainnya sudah tersedia.
Selain itu primer juga berfungsi untuk membatasi daerah mana yang
akan diamplifikasi pada reaksi PCR. Tahap-tahap dalam merancang
primer denagn mentukan tujuan, menyiapkan sekuens referensi, dan
bisa di desain dengan batuan software. Perancangan primer
menggunakan software PRIMER 3 dengan memeprhatikan parameter untuk
masing-masing primer sebagai berikut. Panjang primer Secara umum
disepakati bahwa panjang primer PCR yang optimal adalah 18-22 bp.
Panjang ini cukup panjang untuk mencapai spesifisitas yang cukup,
dan cukup pendek bagi primer untuk terikat dengan mudah pada DNA
template pada suhu annealing-nya.Suhu leleh atau melting
temperature (Tm) adalah temperatur dimana setengah dari duplex DNA
akan terpisah menjadi utas tunggal dan Tm juga mengindikasikan
stabilitas duplex. Hasil terbaik biasanya diperoleh jika primer
memiliki Tm 52-58 C. Primer dengan nilai Tm di atas 65 C memiliki
kecenderungan untuk terjadinya annealing sekunder. Nilai Tm bisa
diindikasikan dari GC content dan dapat dihitung secara akurat
menggunakan rumus-rumus tertentu. Nilai Temperatur Leleh (Tm)
merupakan estimasi stabilitas hibrid DNA-DNA dan penting untuk
menentukan suhu annealing. Jika Ta terlalu tinggi maka akan
menyebabkan hibridisasi primer-template yang kurang baik sehingga
yield produk PCR pun akan rendah. Sebaliknya jika Ta terlalu rendah
maka bisa menyebabkan banyaknya produk-produk non-spesifik karena
akan terjadi banyak mismatch yang menurunkan spesifisitas
PCR.Clustal juga merupakan program bioinformatika untuk alignment
multipel (multiple alignment), yaitu alignment beberapa sekuens
sekaligus. Dua varian utama Clustal adalah ClustalW dan ClustalX.
Metode lain yang dapat diterapkan untuk alignment sekuens adalah
metode yang berhubungan dengan Hidden Markov Model ("Model Markov
Tersembunyi", HMM). HMM merupakan model statistika yang mulanya
digunakan dalam ilmu komputer untuk mengenali pembicaraan manusia
(speech recognition). Selain digunakan untuk alignment, HMM juga
digunakan dalam metode-metode analisis sekuens lainnya, seperti
prediksi daerah pengkode protein dalam genom dan prediksi struktur
sekunder protein. Berikut adalah out out dari analisis primer
menggunakan program primer3 pada sekuens Mus musculus mutant p53
mRNA, Mus musculus p53 mRNA, dan Mus musculus tumor supresor p53
mRNA (Gambar 5).
Gambar 5 Output dari program primer3
Gambar 5 (lanjutan) Out put dari program primer3
Gambar 5 (lanjutan) Out put dari program primer3Berdasarkan
hasil analisis yang diperoleh maka ditentukan primer yang digunakan
yaitu left primer CACGTACTCTCCTCCCCTCA, right primer
ATTCCTTCCACCCGGATAC dengan produk yang memiliki ukuran 229bp,
pemilihan primer ini didasari oleh jumlah GC yang lebih sedikit
dibandingkan dengan primer 1, 2, dan 3.
SIMPULANprimer dapat didesain secara otomatis mneggunakan
program komputer maupun secara manual.DAFTAR PUSTAKAKrane, DE dan
ML Raymer. 2003.Fundamental Concepts of Bioinformatics. San
Francisco: Benjamin Cummings.Mount, DW. 2001.Bioinformatics:
Sequence and Genome Analysis. Cold Spring Harbor: Cold Spring
Harbor Laboratory Press