پیش بینی تغییرات تعداد کپی ژنی در سطح ژنوم با استفاده از یک مدل محاسباتی - science- دانشکدگان علوم
آگهی دفاع از رساله دکتری
دانشکده ریاضی، آمار و علوم کامپیوتر
عنوان: پیش بینی تغییرات تعداد کپی ژنی در سطح ژنوم با استفاده از یک مدل محاسباتی
دانشجو : سید امیر ملک پور
رشته: آمار
استاد راهنما : دکتر حمید پزشک
استاد مشاور : دکتر مهدی صادقی
داوران داخلی : دکتر فیروزه حقیقی ، دکتر سید امیر مرعشی، دکتر کاوه کاووسی
داوران خارجی : دکتر مجتبی گنجعلی از دانشگاه شهید بهشتی
زمان : سه شنبه 20 تیر 1396، ساعت 10 صبح
مکان : دانشکده ریاضی، آمار و علوم کامپیوتر دانشگاه تهران، تالار هشترودی
چکیده:
تصور میشود که تغییر در تعداد کپیهای ژنی (Copy Number Variation, CNV) یکی از منابع عمده تغییرات ساختاری گسترده و بزرگ در سطح ژنوم انسان باشد که در آن تعداد کپی قطاعهای کرومزومی از فردی به فرد دیگر تغییر میکند. در سالهای اخیر ابداع روشهای نسل جدید توالییابی (Next Generation Sequencing, NGS) مطالعه CNV در سطح ژنوم را تسهیل کرده، به طوری که می توانیم با صرف هزینه پایین CNV های ژنومی را مطالعه کنیم. در این رساله با استفاده از جفت خوانشهایی که با روش NGS از ژنوم فرد نمونه تولید میشوند، قطعاتی از ژنوم نمونه که نسبت به ژنوم مرجع دارای CNV هستند شناسایی میشوند. در واقع اطلاعاتی که در جفت خوانشهای تولید شده از ژنوم نمونه وجود دارد توسط روشهای محاسباتی مورد مدل سازی قرار گرفته و برای تشخیص CNV استفاده می شود. این اطلاعات شامل جهت و همچنین فاصله بین جفت خوانشها می شود.
در این رساله، از دو روش پارامتریک مبتنی بر مدلهای مارکفی پنهان (Hidden Markov Models, HMM) برای پیشبینی CNV های ژنومی استفاده میشود که هریک از این مدل ها از یک چگالی گوسی آمیخته برای گسیل مشاهدات مربوط به فاصله و جهت جفت خوانشهای نگاشته شده روی ژنوم مرجع استفاده میکند. علاوه بر دو روش پارامتریک بالا، یک روش ناپارامتریک مبتنی بر تئوری اطلاعات نیز برای تشخیص CNV های ژنومی توسعه داده شده است. این مدل برای انجام این کار از معیار واگرایی کالبک-لیبلر (Kullback-Leibler, KL) برای محاسبه واگرایی بین توزیع جفت خوانشها و اندازهگیری اختلالات مشاهده شده در آنها – پس از نگاشت روی کرومزوم مرجع – بهره می برد.