Документи
Препис на откриване на точки на промяна в митохондриалните ДНК последователности
Откриване на точки за промяна
в ДНК последователности
Нора Мартнес Вилануева
Магистър по статистически техники
Университет във Виго
Откриване на точки на промяна в последователности от
Нора Мартнес Вилануева
Разрешение за доставка
Г-н Хавиер Рока Пардинас и г-н Мигел Мендока Фонсека
Че проектът е озаглавен Откриване на точки на промяна в последователностите на ДНК мита-
хондриал е направен от ДНК. Нора Мартнес Вилануева, с D.N.I. 53179846-
М, под ръководството на г-н Хавиер Рока Пардинас и г-н Мигел Мендока Фонсека.
Този доклад представлява документацията, която, с наше разрешение, предоставя
каза студентът като окончателен магистърски проект.
Хавиер Рока Пардинас Мигел М. Фонсека
Виго, 16 януари 2012 г.
Идентифицирането на мутационните процеси, които засягат ДНК последователностите, е от съществено значение-
за по-добро разбиране на това как се развиват геномите. Механизмът
репликация, по време на която веригите са изложени на големи мутационни щети-
Накрая, той е описан като един от основните източници на пристрастия в композицията
нуклеотидни вериги. В тази работа е представен seq2R, R пакет, който
открива особености в състава на митохондриалните геноми (mtDNA). За
Следователно са приложени техники за изглаждане от ядро, които оценяват индексите
при конструирането на интервали на
увереност за тези оценки. В допълнение, този пакет позволява да се представят graphi-
получените оценки и прави извод за точките на промяна (или
особености) на интерес.
1. Въведение 1
2. Статистическа методология 7
2.1. Алгоритъм за оценка. . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2. Избор на прозорец. . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.3. Изчислителни аспекти. . . . . . . . . . . . . . . . . . . . . . . . 10
2.4. Доверителни интервали. . . . . . . . . . . . . . . . . . . . . . . . . . единадесет
3. Разработка на софтуер 13
3.1. Функция Read.genbank (). . . . . . . . . . . . . . . . . . . . . . . . . 14.
3.2. Функция Read.all (). . . . . . . . . . . . . . . . . . . . . . . . . . . петнадесет
3.3. Функция Change.binary (). . . . . . . . . . . . . . . . . . . . . . . . 16.
3.4. Функция Change.points (). . . . . . . . . . . . . . . . . . . . . . . . 17
3.5. Функция plot.change.points (). . . . . . . . . . . . . . . . . . . . . 19.
3.6. Критична () функция. . . . . . . . . . . . . . . . . . . . . . . . . . . 19.
4. Изследване на митохондриална ДНК при Homo sapiens 23
Пакет seq2R 33
Повечето еукариотни организми съдържат в клетките си няколко
органели, които са известни с името на митохондриите. Споменатите органели са есен-
за клетъчна активност, тъй като те са отговорни за преобразуването на калориите
че ние включваме в диетата използваема енергия (аденозин трифосфат, АТФ) чрез
на процеса на окислително фосфорилиране (Wallace, 1992). Този процес обаче не е такъв
той е единственият, в който митохондриите се намесват. Например, известно е, че са
участва в биосинтеза на други клетъчни метаболити и в регулацията на
програмирана клетъчна смърт или апоптоза (Orrenius, 2004).
Тези органели са изградени от външна митохондриална мембрана, пространство
междумембранна, вътрешна митохондриална мембрана (с инвагинации, наречени
гребени) и митохондриална матрица. Въпреки че по-голямата част от ДНК в клетката е
В ядрото митохондрията има собствен геном, митохондриална ДНК (mtDNA,
Фиг. 1.1) (Bruces et al., 2007).
Броят на митохондриите на клетка варира в широки граници в зависимост от вида на органа.-
низъм или тъкан и всеки се изчислява да има 2-10 копия на mtDNA
(Wiesner et al., 1992).
Геномът на митохондриите е разположен в митохондриалната матрица и има
обикновено кръгла структура, съставена от две нишки на ДНК. Това са ea-
поставя се главно от четири азотни основи: аденин (а), тимин (т), гуанин
(g) и цитозин (c). Обединението на двете вериги се получава чрез сдвояването на
Тези основи, аденин и тимин, се допълват, докато гуанинът се допълва.
то е с цитозин. Поради своя биохимичен състав, двете нишки са различни, тъй като
че нуклеотидната последователност на едната е богата на G (тежка верига или Н верига), а другата верига е бедна на тази азотна основа (лека верига или Lstrand) (Anderson
2 Глава 1. Въведение
и др., 1981). Митохондриалният геном кодира 13 протеина, участващи във веригата
дихателна, 2 рибозомни РНК и 22 трансферни РНК, които са свързани
с процеса на транскрипция на mtDNA (P. F. Chinnery, 2003). На фигура 1.2
е представена схема на човешка mtDNA.
Фигура 1.1: Структура на митохондрия (център) на еукариотна клетка (вляво). Микроскопско изображение на митохондрия (вдясно) (http://bio1151b.nicerweb.com/Locked/media/ch06/mitochondrion.html).
Откриването на този уникален геном в митохондриите беше много
важно е да можете да провеждате изследвания за произхода и еволюцията на споменатите органели
(Mounolou et al., 1966; Schatz, 1963).
Мутацията е промяна на един нуклеотид за друг. Генетична вариация
в mtDNA произхожда от мутации, които се натрупват в генома. The
средната скорост на мутация на mtDNA е 10 пъти по-голяма от тази на ядрената ДНК.
Това е така, защото (i) mtDNA е изложена на окислително увреждане, причинено от
реакциите, които се случват в митохондриите, (ii) ядрената ДНК е по-добра
защитени и (iii) механизмите за възстановяване на увреждане на ДНК не са много ефективни
в митохондриите. Тъй като mtDNA се наследява чрез майката (Dawid и
Блеклер, 1972; 3rd Hutchison et al., 1974) и скоростта на рекомбинация е ограничена и
рядко генерира нови генетични варианти (Tsaousis et al., 2005), тези мутации
са предимно източник на вариации в този геном.
Фиг. 1.2: Homo sapiens митохондриален геном. Това е малка молекула от 16 569 kb двуверижна mDNA, която кодира 13 основни компонента в дихателната верига: ND1-ND6 гени, които кодират 7 субединици от комплекс I, Cyt b кодира субединицата на комплекс III, CO I-III кодира три субединици на комплекс IV, гените ATP6 и ATP8 кодират две субединици на комплекса V. Освен това той съдържа 2 гена на рибозомни РНК (12S и 16 S rRNA) и 22 трансферни РНК гени. D-loop е некодиращ регион, участващ в регулирането на важни процеси, OH и OL, са началото на репликацията на тежката верига и леката верига на mtDNA. Съкращения: ND1 до ND6, NADH дехидрогеназни субединици 1-6; Cyt b, субединица на цитохром b; COI-III, субединици на цитохром с оксидаза; ATP6 и ATP8, субединици на ATP синтаза. 12S и 16S рРНК; tRNA гените са обозначени с буква на съответната аминокиселина.
Когато мутагенните механизми и процесът на подбор влияят еднакво
и към двете вериги на ДНК, нуклеотидната честота във всяка от тях трябва да бъде
балансирано, второ правило за паритет (Chargaff, 1950; Lobry, 1995). въпреки това,
пристрастията в състава на веригите могат да бъдат идентифицирани като отклонения в
тази връзка, която предполага съществуването на асиметрични мутации, получени от различни-
различни механизми на мутация, например основни промени по време на репликация,
ДНК транскрипция или възстановяване (Frank и Lobry, 1999). Ако тези мутации имат-
На място по време на репликацията, можете да очаквате големи промени в
4 Глава 1. Въведение
нуклеотиден състав в началото на репликацията (при гръбначни животни-
две, наречени OH и OL) и в края на новите последователности на
MtDNA (Touchon and Rocha, 2008).
Въз основа на състава на последователностите и за да се оцени местоположението
от двата произхода на репликацията (OH и OL), Григориев (1998) използва acu-
GC mulate: метод, който се състои от сумата от (G-C)/(G + C) от точка
произволен старт на последователността, докато тя премине изцяло през нея. Можех да го наблюдавам
GC пристрастието се увеличава, когато се приближаваме към OH и OL. Този метод обаче
както много други използвани досега, липсва статистическа строгост.
В този проект е представена нова статистическа методология, която позволява-
откриване на промени в състава на геномни последователности с помощта
регресия. Определянето на тези точки на превключване е полезно при закупуването-