откриване

Документи

Препис на откриване на точки на промяна в митохондриалните ДНК последователности

Откриване на точки за промяна

в ДНК последователности

Нора Мартнес Вилануева

Магистър по статистически техники

Университет във Виго

Откриване на точки на промяна в последователности от

Нора Мартнес Вилануева

Разрешение за доставка

Г-н Хавиер Рока Пардинас и г-н Мигел Мендока Фонсека

Че проектът е озаглавен Откриване на точки на промяна в последователностите на ДНК мита-

хондриал е направен от ДНК. Нора Мартнес Вилануева, с D.N.I. 53179846-

М, под ръководството на г-н Хавиер Рока Пардинас и г-н Мигел Мендока Фонсека.

Този доклад представлява документацията, която, с наше разрешение, предоставя

каза студентът като окончателен магистърски проект.

Хавиер Рока Пардинас Мигел М. Фонсека

Виго, 16 януари 2012 г.

Идентифицирането на мутационните процеси, които засягат ДНК последователностите, е от съществено значение-

за по-добро разбиране на това как се развиват геномите. Механизмът

репликация, по време на която веригите са изложени на големи мутационни щети-

Накрая, той е описан като един от основните източници на пристрастия в композицията

нуклеотидни вериги. В тази работа е представен seq2R, R пакет, който

открива особености в състава на митохондриалните геноми (mtDNA). За

Следователно са приложени техники за изглаждане от ядро, които оценяват индексите

при конструирането на интервали на

увереност за тези оценки. В допълнение, този пакет позволява да се представят graphi-

получените оценки и прави извод за точките на промяна (или

особености) на интерес.

1. Въведение 1

2. Статистическа методология 7

2.1. Алгоритъм за оценка. . . . . . . . . . . . . . . . . . . . . . . . . 8

2.2. Избор на прозорец. . . . . . . . . . . . . . . . . . . . . . . . . . 9

2.3. Изчислителни аспекти. . . . . . . . . . . . . . . . . . . . . . . . 10

2.4. Доверителни интервали. . . . . . . . . . . . . . . . . . . . . . . . . . единадесет

3. Разработка на софтуер 13

3.1. Функция Read.genbank (). . . . . . . . . . . . . . . . . . . . . . . . . 14.

3.2. Функция Read.all (). . . . . . . . . . . . . . . . . . . . . . . . . . . петнадесет

3.3. Функция Change.binary (). . . . . . . . . . . . . . . . . . . . . . . . 16.

3.4. Функция Change.points (). . . . . . . . . . . . . . . . . . . . . . . . 17

3.5. Функция plot.change.points (). . . . . . . . . . . . . . . . . . . . . 19.

3.6. Критична () функция. . . . . . . . . . . . . . . . . . . . . . . . . . . 19.

4. Изследване на митохондриална ДНК при Homo sapiens 23

Пакет seq2R 33

Повечето еукариотни организми съдържат в клетките си няколко

органели, които са известни с името на митохондриите. Споменатите органели са есен-

за клетъчна активност, тъй като те са отговорни за преобразуването на калориите

че ние включваме в диетата използваема енергия (аденозин трифосфат, АТФ) чрез

на процеса на окислително фосфорилиране (Wallace, 1992). Този процес обаче не е такъв

той е единственият, в който митохондриите се намесват. Например, известно е, че са

участва в биосинтеза на други клетъчни метаболити и в регулацията на

програмирана клетъчна смърт или апоптоза (Orrenius, 2004).

Тези органели са изградени от външна митохондриална мембрана, пространство

междумембранна, вътрешна митохондриална мембрана (с инвагинации, наречени

гребени) и митохондриална матрица. Въпреки че по-голямата част от ДНК в клетката е

В ядрото митохондрията има собствен геном, митохондриална ДНК (mtDNA,

Фиг. 1.1) (Bruces et al., 2007).

Броят на митохондриите на клетка варира в широки граници в зависимост от вида на органа.-

низъм или тъкан и всеки се изчислява да има 2-10 копия на mtDNA

(Wiesner et al., 1992).

Геномът на митохондриите е разположен в митохондриалната матрица и има

обикновено кръгла структура, съставена от две нишки на ДНК. Това са ea-

поставя се главно от четири азотни основи: аденин (а), тимин (т), гуанин

(g) и цитозин (c). Обединението на двете вериги се получава чрез сдвояването на

Тези основи, аденин и тимин, се допълват, докато гуанинът се допълва.

то е с цитозин. Поради своя биохимичен състав, двете нишки са различни, тъй като

че нуклеотидната последователност на едната е богата на G (тежка верига или Н верига), а другата верига е бедна на тази азотна основа (лека верига или Lstrand) (Anderson

2 Глава 1. Въведение

и др., 1981). Митохондриалният геном кодира 13 протеина, участващи във веригата

дихателна, 2 рибозомни РНК и 22 трансферни РНК, които са свързани

с процеса на транскрипция на mtDNA (P. F. Chinnery, 2003). На фигура 1.2

е представена схема на човешка mtDNA.

Фигура 1.1: Структура на митохондрия (център) на еукариотна клетка (вляво). Микроскопско изображение на митохондрия (вдясно) (http://bio1151b.nicerweb.com/Locked/media/ch06/mitochondrion.html).

Откриването на този уникален геном в митохондриите беше много

важно е да можете да провеждате изследвания за произхода и еволюцията на споменатите органели

(Mounolou et al., 1966; Schatz, 1963).

Мутацията е промяна на един нуклеотид за друг. Генетична вариация

в mtDNA произхожда от мутации, които се натрупват в генома. The

средната скорост на мутация на mtDNA е 10 пъти по-голяма от тази на ядрената ДНК.

Това е така, защото (i) mtDNA е изложена на окислително увреждане, причинено от

реакциите, които се случват в митохондриите, (ii) ядрената ДНК е по-добра

защитени и (iii) механизмите за възстановяване на увреждане на ДНК не са много ефективни

в митохондриите. Тъй като mtDNA се наследява чрез майката (Dawid и

Блеклер, 1972; 3rd Hutchison et al., 1974) и скоростта на рекомбинация е ограничена и

рядко генерира нови генетични варианти (Tsaousis et al., 2005), тези мутации

са предимно източник на вариации в този геном.

Фиг. 1.2: Homo sapiens митохондриален геном. Това е малка молекула от 16 569 kb двуверижна mDNA, която кодира 13 основни компонента в дихателната верига: ND1-ND6 гени, които кодират 7 субединици от комплекс I, Cyt b кодира субединицата на комплекс III, CO I-III кодира три субединици на комплекс IV, гените ATP6 и ATP8 кодират две субединици на комплекса V. Освен това той съдържа 2 гена на рибозомни РНК (12S и 16 S rRNA) и 22 трансферни РНК гени. D-loop е некодиращ регион, участващ в регулирането на важни процеси, OH и OL, са началото на репликацията на тежката верига и леката верига на mtDNA. Съкращения: ND1 до ND6, NADH дехидрогеназни субединици 1-6; Cyt b, субединица на цитохром b; COI-III, субединици на цитохром с оксидаза; ATP6 и ATP8, субединици на ATP синтаза. 12S и 16S рРНК; tRNA гените са обозначени с буква на съответната аминокиселина.

Когато мутагенните механизми и процесът на подбор влияят еднакво

и към двете вериги на ДНК, нуклеотидната честота във всяка от тях трябва да бъде

балансирано, второ правило за паритет (Chargaff, 1950; Lobry, 1995). въпреки това,

пристрастията в състава на веригите могат да бъдат идентифицирани като отклонения в

тази връзка, която предполага съществуването на асиметрични мутации, получени от различни-

различни механизми на мутация, например основни промени по време на репликация,

ДНК транскрипция или възстановяване (Frank и Lobry, 1999). Ако тези мутации имат-

На място по време на репликацията, можете да очаквате големи промени в

4 Глава 1. Въведение

нуклеотиден състав в началото на репликацията (при гръбначни животни-

две, наречени OH и OL) и в края на новите последователности на

MtDNA (Touchon and Rocha, 2008).

Въз основа на състава на последователностите и за да се оцени местоположението

от двата произхода на репликацията (OH и OL), Григориев (1998) използва acu-

GC mulate: метод, който се състои от сумата от (G-C)/(G + C) от точка

произволен старт на последователността, докато тя премине изцяло през нея. Можех да го наблюдавам

GC пристрастието се увеличава, когато се приближаваме към OH и OL. Този метод обаче

както много други използвани досега, липсва статистическа строгост.

В този проект е представена нова статистическа методология, която позволява-

откриване на промени в състава на геномни последователности с помощта

регресия. Определянето на тези точки на превключване е полезно при закупуването-