آگهی دفاع از رساله دکتری

دانشکده ریاضی، آمار و علوم کامپیوتر

عنوان: پیش بینی تغییرات تعداد کپی ژنی در سطح ژنوم با استفاده از یک مدل محاسباتی

دانشجو : سید امیر ملک پور

رشته:  آمار

استاد راهنما : دکتر حمید پزشک

استاد مشاور : دکتر مهدی صادقی

 

داوران داخلی : دکتر فیروزه حقیقی ، دکتر سید امیر مرعشی، دکتر  کاوه کاووسی

داوران خارجی : دکتر مجتبی گنجعلی        از دانشگاه شهید بهشتی

زمان : سه شنبه 20 تیر 1396، ساعت 10 صبح

مکان : دانشکده ریاضی، آمار و علوم کامپیوتر دانشگاه تهران، تالار هشترودی

چکیده:

تصور می‌شود که تغییر در تعداد کپی‌های ژنی (Copy Number Variation, CNV) یکی از منابع عمده تغییرات ساختاری گسترده و بزرگ در سطح ژنوم انسان باشد که در آن تعداد کپی قطاع‌های کرومزومی از فردی به فرد دیگر تغییر می‌کند. در سال‌های اخیر ابداع روش‌های نسل جدید توالی‌یابی (Next Generation Sequencing, NGS) مطالعه CNV در سطح ژنوم را تسهیل کرده، به طوری که می توانیم با صرف هزینه پایین CNV های ژنومی را مطالعه کنیم. در این رساله با استفاده از جفت خوانش‌هایی که با روش NGS از ژنوم فرد نمونه تولید می‌شوند، قطعاتی از ژنوم نمونه که نسبت به ژنوم مرجع دارای CNV هستند شناسایی می‌شوند. در واقع اطلاعاتی که در جفت خوانش‌های تولید شده از ژنوم نمونه وجود دارد توسط روش‌های محاسباتی مورد مدل سازی قرار گرفته و برای تشخیص CNV استفاده می شود. این اطلاعات شامل جهت و همچنین فاصله بین جفت خوانش‌ها می شود.

در این رساله، از دو روش پارامتریک مبتنی بر مدل‌های مارکفی پنهان (Hidden Markov Models, HMM) برای پیش‌بینی CNV های ژنومی استفاده میشود که هریک از این مدل ها از یک چگالی گوسی آمیخته برای گسیل مشاهدات مربوط به فاصله و جهت جفت خوانش‌های نگاشته شده روی ژنوم مرجع استفاده می‌کند. علاوه بر دو روش پارامتریک بالا، یک روش ناپارامتریک مبتنی بر تئوری اطلاعات نیز برای تشخیص CNV های ژنومی توسعه داده شده است. این مدل برای انجام این کار از معیار واگرایی کالبک-لیبلر (Kullback-Leibler, KL) برای محاسبه واگرایی بین توزیع جفت خوانش‌ها و اندازه‌گیری اختلالات مشاهده شده در آنها – پس از نگاشت روی کرومزوم مرجع – بهره می برد.