Субекти

Обобщение

Доказано е, че рецесивното наследяване на генно-разрушаващи алели, или чрез специфична за мястото хомозиготност, или комбинирана хетерозиготност, е в основата на много болести на Мендел и някои сложни психиатрични разстройства. Въз основа на данни за секвениране на екзома, при аутизъм е идентифициран увеличен товар на пълни варианти на делеция (хомозиготен или комбиниран хетерозиготен). Освен това, когато се използват данни за микроматичност на единичен нуклеотиден полиморфизъм, увеличаването на степента на хомозиготност или автозиготност на потомството е свързано с риска от шизофрения (SCZ). Тук, в голяма шведска проба SCZ за контрол на случая (11 244 индивида, 5079 от които имат налични данни за последователността на екзомите), ние изследваме приноса както на автозиготността, така и на пълните нокаути за риска от заболяване. Не открихме доказателства за връзка с SCZ, нито от целия геном, нито от определени локуси. Ние обаче разглеждаме възможното въздействие на размера на извадката и генетичните фактори на популацията върху способността за откриване и количествено определяне на всяка тежест, която може да съществува.

няма

Въведение

Шизофренията (SCZ) е силно наследствено инвалидизиращо разстройство (h 2

Докато секвенирането позволява директно откриване на точни цели генотипове, степента на автозиготност (хомозиготност по произход) също може да бъде информативна при рецесивни модели. Предишни проучвания са използвали SNP микрочипове за идентифициране на множество мегабазови хомозиготност (ROH), вероятно отразяващи автозиготност, получена от скорошна инбридинг. 13, 14 Проучване на 9 388, предимно европейски случаи на SCZ и 12 456 контроли, показва значителна положителна корелация между степента на ROH на индивида и риска от заболяване. 15 Те обаче не идентифицираха никакви значими отделни локуси.

Тук ние прилагаме двата подхода в голяма шведска популация, базирана на 8, 16 извадка от SCZ случаи и контроли: първо тестваме рецесивния модел индиректно, като сравняваме получената от SNP тежест на ROH в случаите спрямо контролите, и второ, използваме последователност на exome за Директно оценете натоварването на пълните варианти за елиминиране.

Методи

Пример за анализ и генериране на данни.

Пробите бяха получени от националните регистри в Швеция, случаите бяха идентифицирани чрез шведския регистър за освобождаване от болница и контролите бяха избрани на случаен принцип от шведските регистри на населението. Всички субекти бяха надлежно съгласни и институционалните комитети от човешки субекти одобриха изследването. Последователността беше извършена в Broad Institute с помощта на машини Illumina (Сан Диего, Калифорния, САЩ) GAII или HiSeq2000. Заснемането на Exome беше извършено с помощта на версия 1 или версия 2 на комплекта SureSelect Human All Exon от Agilent (Санта Клара, Калифорния, САЩ). Допълнителни подробности относно анализа на пробите и генерирането на данни за последователността са публикувани преди това. 8 BAM и VCF файлове са достъпни от проучването dbGaP phs000473.v1 (//www.ncbi.nlm.nih.gov/projects/gap/cgi-bin/study.cgi?study_id=phs000473.v1.p1).

Хомозиготните раси, които те наричат.

Използвахме данни за импутиране от 16 по-рано публикувани SNP от целия шведски набор от данни, които представляват супермножество от индивидите, които са били секвенирани. Ние избираме

55 k SNPs в приблизително свързващо равновесие на висококачествени генотипове, наречени вменена доза в 5001 случая и 6243 контроли. Опитахме се да открием ROH, използвайки PLINK 17 с ROH дължина> 1 Mb конфигурационни параметри, поне един SNP на 100 kb и разпределението на едно хетерозиготно събитие в прозорец 50 SNP, разделяйки разговорите, ако те обхващат 500 kb без маркер . Този метод и избор на параметри представлява тези, предложени в литературата след внимателно сравнение 18 и е много подобен на подхода, използван по-рано за подмножество от тези данни. петнадесет

Съединена хетерозиготна идентификация

За да оценим функцията на елиминационни пълни варианти в SCZ, внедрихме метод за идентифициране на тези варианти в рамките на статистическия пакет Plink/Seq (//research.mssm.edu/statgen/software.html). Методът анализира всеки препис независимо, като гарантира, че и двата разрушителни варианта засягат един и същ протеин. Тъй като повечето двойки варианти няма да бъдат в рамките на необходимото разстояние за фаза (дължина на четене на секвениране), ние използвахме използван преди това статистически фазов подход за идентифициране на съставни хетерозиготни събития. 12 Определяме хетерозиготността на съединението като индивид, носещ хетерозиготен генотип на всяка хромозома на различни места в рамките на един и същ ген.

Оценка на значимостта с помощта на пермутация

Значимостта на пълните варианти на нокаутиране се оценява чрез пермутиране на отделни алели независимо от равновесието на Харди-Вайнберг (HWE). Пермутацията беше извършена в рамките на 296 групи съвпадащи индивиди в IBS от данни на GWAS за контрол на фината субструктура на популацията (среден брой индивиди на група = 17). Ние оценяваме важността на генните набори чрез добавяне на множество варианти, като приемаме независимост.

Резултати

Между 5001 случая и 6243 контроли, ние идентифицирахме 4117 ROH през 2001 г.; 16% от хората са имали поне един ROH. Средната дължина на ROH е била 8 Mb (средна дължина от 6,8 Mb) и варира между 1,6 и 55,2 Mb. Ние също така определихме количествено степента на хомозиготност в генома на всеки индивид, използвайки коефициента на Райт за инбридинг (F). След включването на първите 10 многомерни компонента за мащабиране (MDS) за отчитане на предците, хомозиготността е сходна в случаите и контролите според количеството ROH (0,38 случая, 0,32 контроли, P = 0, 60), общите килобази на ROH (3123 kb случаи, 2544 kb контроли, P = 0,88) или F (0,0026 случая, 0,0029 контроли, P = 0,09, таблица 1).

Таблица в пълен размер

След това потърсихме пълни варианти за изтриване в подмножество от 2477 случая и 2481 контроли, за които бяха налични данни за последователността на екзомите. 8 Идентифицирахме 462 пълни, редки генотипа (честота на незначителни алели 8 В 2546 гена в седем комплекта, идентифицирахме 35 пълни деструктивни генотипа или мъжка Х хромозома, 19 в случаите и 16 в контролите (P = 0,38; Допълнителна таблица S3). Въпреки че наборът от гени, носещи неразрушаващи алели в SCZ, показа номинално значение (4: 0, едностранно P = 0,027), това не оцелява при корекцията на седемте теста. Ние също така разглеждаме гени с автозомни соматични причини, известни рецесии на аутизъм или интелектуална инвалидност.19 Три случая генотипове и пет контролни генотипа са открити в 119 гена за интелектуална инвалидност и един случай генотип и нулев контролен генотип в 28 гена за аутизъм; нито един от тестовете не е достигнал номинална значимост (P умствено увреждане = 0.72, P аутизъм = 0.57).

Дискусия

Като цяло не наблюдавахме значително обогатяване на ROH в случаите на SCZ. В по-голяма извадка (21 844), Keller et al. 15 съобщават за значително по-високо натоварване на ROH в случаите на SCZ, което предполага, че настоящото проучване може да е недостатъчно. Отбелязваме, че Keller et al. изследването включва малка част от докладваните тук шведски индивиди, въпреки че авторите не откриват доказателства за увеличаване на ROH в шведската подгрупа, в съгласие с нашите резултати. Това предполага, че генетичните характеристики и характеристиките на произхода на популацията на извадката могат да бъдат допълнителен определящ фактор за относителната роля на редки рецесивни варианти в риска от SCZ.

Количеството скорошни инбридинги ще допринесе за нивата на хомозиготност в дадена популация. Нашата извадка беше определена в Швеция, но включва част от индивидите от финландски произход. Използването на популации с неотдавна инбридинг ще увеличи честотата на тези събития и способността за откриване на обогатяване, подход, който се използва успешно за CNV. двайсет

В заключение, тази проба не осигурява подкрепа за важна роля за разрушителните рецесивни хетерозиготни или съставни хетерозиготни варианти при риска от SCZ. Няма общо натоварване на вариантите на ROH с широк или пълен екзомен нокаут, няма специфично свързани геномни места и няма гени, които да достигнат значимост след корекция. Тези резултати до голяма степен отразяват тези от проучванията за три ново SCZ трио (Fromer et al. 11), в които няма значително по-голяма тежест и много малко отделни гени са недвусмислено замесени, въпреки че за мутациите de novo те могат да видят по-широки ефекти сред функционално свързани генни подмножества. Съставните хетерозиготни и рецесивни редки места могат да играят роля за риска от заболяване, въпреки че може да са необходими по-големи проби или различни аналитични подходи.