Нахождение ориджинов в последовательности нуклеотидов Выполнил: Ромашкин Амир, 445 гр. Руководитель: Профессор АФТУ, Порозов Юрий
Jan 06, 2016
Нахождение ориджинов впоследовательности
нуклеотидов
Выполнил:Ромашкин Амир, 445 гр.
Руководитель: Профессор АФТУ, Порозов Юрий
Основные понятия ДНК – последовательность
нуклеотидов(сиквенс): А, G, C, T
Репликация – процесс синтеза дочерней молекулы ДНК
Ориджины(ORI) – место(<50 нуклеотидов) начала репликации.
Мотивация Есть гипотезы о влиянии некоторых
факторов на положение ORI Знания о положении ориджинов позволят:
Регенерировать клетки и управлять ростом организмов
Найти ключи к понимаю лечения рака Современные экспериментальные методы
трудоемки, затратны, неточны Нет реальных вычислительных методов!
Гипотеза: Факторы
Температура плавления(Tm) CpG-острова(CpG) Палиндромы(Pal)
Геометрические факторы(Banana)
Факторы транскрипций(Tfs)
Цели работы Изучить проблему нахождения ORI
Сформулировать варианты решения
Написать приложение для упрощение анализа сиквенсов на наличие факторов
Уметь удобно получать сиквенсы и вычислять все факторы
Исследовать зависимость ORI от факторов
Попробовать с “хорошей” вероятностью определять, есть ли в последовательности ориджин
Используемые технологии
Python, BioPython lib. .Net, Neurodotnet lib.
Проблемы Нетронутость проблемной области
Нет доказанных теорий Все с нуля
Неоднозначность факторов Неясная интерпретация
Гипотетичность темы
Двумя способами: Количественно, на весь сиквенс
количество Cpg-островов, средняя темп. плавления, количество палиндромов и тд
По окнам размером в 30 нуклеотидов Cpg, палиндромы, транскр.: сумма 3х
минимальных расстояний до факторов. Темп. плавления, геом. факторы: среднее
значение на окне.
Обучение нейронной сети
Результаты(1\2)Практический вклад
Сформирована база для дальнейшего исследования
Был написано приложение, которое позволяет: Получить последовательности
Вычислить все 5 факторов
Вручную: Темп. плавления, Транскрипции Используя eMboss: остальные
Посмотреть результаты вычисления факторов
Посмотреть сосредоточение факторов в сиквенсе в виде графиков
В нем реализована нейронная сеть, которая обучалась 2 вариантами:
Факторы на сиквенс
Факторы по окнам(30 нукл.)
Результаты обоих вариантов неудовлетворительны.
Результаты(2\2)Теоретический вклад
Известные “сильные” ORI-содержащие сиквенсы не отличаются от обычных по количеству или сосредоточению факторов => эти факторы слабо определяют, либо вовсе не определяют ORI