екзома

  • Субекти
  • Обобщение
  • Въведение
  • Предмети и методи
  • Избор на проби
  • ДНК подготовка и групиране
  • Екзоме секвениране
  • Прочетете последователност на картографиране, извикване на вариант и функционална анотация
  • Вариантна филтрация и обогатяване при затлъстяване.
  • Валидиране на варианти чрез генотипиране
  • Статистически анализ на асоциацията.
  • Резултати
  • Откриване на редки варианти чрез секвениране на екзоми
  • SNV валидиране и анализ на асоцииране
  • Дискусия
  • Допълнителна информация
  • Word документи
  • Допълнителна информация

Субекти

Обобщение

Въведение

Наскоро разработената технология за секвениране с висока производителност допълва SNP масивите и показва способността да открива редки болестотворни варианти чрез дълбоко секвениране на всички известни екзони. 7, 8, 9 Тази технологична революция обещава да изясни сложните заболявания, като позволи нискочестотно, широко геномно търсене на редки и предполагаемо функционални варианти. Екзоме секвенирането може да бъде по-ефективно, когато се прилага при пациенти с по-екстремни форми на често срещани заболявания, като болестно затлъстяване; първо, това увеличава шансовете за получаване на значителна асоциация за редки варианти с висока пенетрантност; второ, генетичните варианти в кодиращата протеинова последователност може да имат по-голяма вероятност да имат силно въздействие върху фенотипа, отколкото вариантите в междугенните региони.

В това проучване ние използвахме секвениране на екзома, за да открием обогатени нискочестотни и редки генни варианти при пациенти със затлъстяване при възрастни и ги утвърдихме срещу по-възрастни възрастни със затлъстяване. Ние разсъждавахме, че по този начин ще обогатим гените за затлъстяване сред случаите и ще ги филтрираме в контролите. Тук докладваме вариант, свързан с нискочестотно затлъстяване в кодиращата област на гена на синаптофизин тип 2 (SYPL2).

Предмети и методи

Избор на проби

Таблица в пълен размер

Не-затлъстелите контроли за секвениране на екзоми са имали сколиоза. В противен случай всички други контролни субекти са здрави според самоотчета. Имаше свръхпредставителство на жени в изследваните кохорти. Затлъстелите жени са по-склонни да търсят медицинска помощ за затлъстяването си. Сколиозата е по-често срещана сред жените. Темите бяха от европейски произход и живееха в Швеция. Изследването е одобрено от местните комисии по етика и всички субекти са дали своето информирано съгласие за участие.

ДНК подготовка и групиране

Геномната ДНК се получава от PBMC, като се използва QiAmp DNA Blood Maxi Kit (Cat. No. 51194, Qiagen, Hilden, Германия). Чистотата и качеството на ДНК се потвърждава от съотношението A260/280> 1,8 в Nanodrop (Thermo Fisher Scientific Inc., Waltham, MA, USA) и електрофореза в агарозен гел. Концентрацията на ДНК беше измерена от Qubit (Life Technologies, Стокхолм, Швеция). Впоследствие взехме 0,8 μg от всяка ДНК проба и ги разпределихме на случаен принцип в 10 групи, всяка от които съдържа 10 проби от случаи със затлъстяване или контролни групи. Събраните концентрации на ДНК проби бяха измерени с Qubit и пробите бяха пуснати на агарозен гел.

Екзоме секвениране

Секвенирането на екзома се извършва в лабораторията Science for Life (SciLifeLab), Стокхолм, Швеция. Всяка ДНК библиотека се приготвя от 3 µg обединена геномна ДНК. ДНК беше изрязана при 300 bp с инструмент Covaris S2 и обогатена с комплект SureSelectXT Human All Exon 50 Mb и работна станция Agilent NGS в съответствие с инструкциите на производителя (SureSelectXT автоматизирано обогатяване на целите за двойно мултиплексирано секвениране на Illumina, версия A, Agilent Technologies, Санта Клара, Калифорния, САЩ).

Обединяването беше извършено на система за изграждане на клъстер cBot, използвайки сдвоен комплект за четене на клъстер за четене HiSeq в съответствие с инструкциите на производителя (Illumina, Сан Диего, Калифорния, САЩ). Пробите бяха секвенирани на Illumina HiSeq 2000 като сдвоени четения при 100 bp/четене (Illumina). Всички ленти бяха обогатени с 1% phiX контролна библиотека, с изключение на лента 8, която беше 2% phiX. Провеждането на последователността се извършва в съответствие с инструкциите на производителя. Основното преобразуване е направено с помощта на Illumina OLB v1.9 (Illumina).

Прочетете последователност на картографиране, извикване на вариант и функционална анотация

Четенията на последователността бяха подравнени към текущата човешка референтна последователност (монтаж hg19, NCBI компилация 37) (//hgdownload.soe.ucsc.edu/goldenPath/hg19/chromosomes/) с помощта на Burrows-Wheeler Aligner (BWA версия 0.6.1,//bio-bwa.sourceforge.net/, Li и Durbin 12) с параметър за отчитане на изрязване - q от 20. Вариантите на последователността бяха извикани от функцията за многократно натрупване на samtools-0.1.18 (//samtools.sourceforge. net /), с минимално качество на картографиране 20 и минимална дълбочина на четене 5 × за филтриране. PCR дубликатите бяха премахнати с помощта на samtools преди така наречения вариант. За функционално анотиране на варианти на последователности използвахме annovar (//www.openbioinformatics.org/annovar/, Wang et al 13), за да интегрираме информация от различни бази данни в публични домейни, като например генната справка (/ /hgdownload.soe . ucsc.edu/goldenPath/hg19/database/refGene.txt, 2013), dbSNP (SNP135, //hgdownload.soe.ucsc.edu/goldenPath/hg19/database/snp137.txt.gz) и проекта 1000 Genome (//www.1000genomes.org/).

Вариантна филтрация и обогатяване при затлъстяване.

Използваме следните скринингови критерии, за да изберем нискочестотни и редки варианти на единичен нуклеотид (SNV) от данните за секвениране на екзома. Обогатени SNV при пациенти със затлъстяване със затлъстяване бяха извършени за валидиране (Фигура 1). Първо, ние филтрираме вариантите с дълбочина 5 × и качество на картографиране (MQ) ≥20. След това търсим предполагаеми функционални варианти, т.е. варианти на екзонови области, места за снаждане или 5 'нагоре по региони. В следващата стъпка сравняваме появата на вариант между затлъстели и контролни групи. В допълнителната стъпка на филтриране бяха използвани само вариантите, извикани в ≥2 групи със затлъстяване, но нито един извикан или извикан веднъж в контролни групи; Тази стъпка беше приложена, за да се избегнат възможни фалшиво положителни варианти. Последното филтриране се основава на честотата на алелите. Търсихме нискочестотни и редки SNV, т.е. варианти, които не бяха намерени в публични бази данни или известни SNP с MAF≤5% в общите популации (проект 1000 Genomes 2011, май версия).

Обобщение на работните процеси. Непубликувани SNV: Варианти, които не са включени в SNP135.

Изображение в пълен размер

Валидиране на варианти чрез генотипиране

Статистически анализ на асоциацията.

Субектите се характеризират с ИТМ и стойностите се отчитат като средна стойност ± SD за затлъстяване и контроли поотделно. Анализът на генетичната асоциация и изчисляването на съотношението на шансовете бяха извършени с помощта на PLINK (//pngu.mgh.harvard.edu/

purcell/plink /, Purcell et al 16). Равновесието на Hardy-Weinberg (HWE) на честотите на генотипа между случаите и контролите се проверява отделно за всеки цикъл на валидиране преди анализа на асоциирането. Номинална стойност на HWE P от 0,01 в контролите беше използвана като гранична точка за изключване на варианти от по-нататъшен анализ. ИТМ се анализира, като се използва стандартната линейна регресия, внедрена в PLINK. Пол и възраст са използвани като ковариатори за оценка на тяхното влияние върху връзката на вариант с ИТМ.

Резултати

Откриване на редки варианти чрез секвениране на екзоми

Таблица в пълен размер

SNV валидиране и анализ на асоцииране

От 1032 SNV изключихме варианти за вмъкване или изтриване, за да избегнем възможни технически затруднения при генотипирането. След това филтрираме SNV, споделени от поне две групи със затлъстяване с най-висока производителност. След като ръчно проверихме подравняванията на четенията, носещи вариантите, използвайки софтуера IGV (//www.broadinstitute.org/igv/), за да изключим възможни артефакти, избрахме 144 SNV за генотип (142 dbSNP и 2 неизвестни SNV). Дълбочината на последователността и броят на споделените групи за затлъстяване на 144 SNV са показани в допълнителна таблица S3. Повечето SNV са открити в две (83) или три (31) групи. Десет SNVs имаха трудности при проектирането на грунда за генотипиране и бяха заменени от SNV singleton.

Таблица в пълен размер

Важността на асоциациите на 5 SNV със затлъстяване или ИТМ при първия и окончателния анализ не беше засегната, когато за анализите изключихме 100 субекта, използвани в секвенирането на екзома (допълнителни таблици S6 и S7).

За по-нататъшна оценка на объркващите ефекти на възрастта или пола, ние добавихме тези променливи като ковариати в регресионните модели и тествахме отделните им ефекти. rs62623713 поддържа силни връзки с ИТМ след корекция на възрастта или пола (допълнителна таблица S8). Връзката между rs35923425 и ИТМ изчезна след корекция на възрастта. Освен това извършваме различни тестове, за да коригираме анализа за множество генетични варианти. Асоциацията на rs62623713 с ИТМ все още е значителна с коригирана от Bonferroni стойност на Р от 3.0 × 10 -4 и геномна контрола, коригирана стойност на Р от 0.05. Асоциацията на rs35923425 стана незначителна с геномните контроли, докато коригираната от Bonferroni стойност на P беше 0,029 (допълнителна таблица S9).

Дискусия

Използвайки секвениране на екзоми, последвано от широкомащабно генотипиране, ние идентифицирахме вариант с нискочестотно кодиране, rs62623713 (E99G) в екзон 4 на гена SYPL2, показващ постоянна връзка с болестното затлъстяване. rs62623713 има MAF от 2,9% за алела G в общите популации според 1000 генома. Вариантът е свръхпредставен сред нашите затлъстели субекти (MAF 8%). rs62623713 не беше обхванат от генотипиращите матрици Illumina или Affymetrix, използвани в предишни проучвания на GWA, и нито един друг вариант в тези матрици не беше в неравновесие със силна връзка с rs62623713.

Доколкото ни е известно, има само три съобщения за свързани със затлъстяването варианти, открити чрез секвениране на екзома. 9, 17, 18 Albrechtsen et al 17 анализират кохорта с метаболитния синдром и изследват множество метаболитни фенотипове. Проучването на Huang et al 18 анализира главно диабет тип 2. Gill et al 9 идентифицира нови варианти на LEPR при тежко затлъстяване в детска възраст чрез секвениране на екзома.

Хипотезата, лежаща в основата на нашето изследване, е, че най-тежките форми на често срещано затлъстяване може да се дължат на нискочестотни или редки варианти с по-голямо въздействие върху фенотипа. Доказано е, че малка част от случаите на болестно затлъстяване се дължат на генетични варианти с висока пенетрантност. Вариантите в гена на меланокортинов рецептор 4 (MC4R) обясняват малък процент детско затлъстяване 19, а повторението на броя на копията в хромозома 16-20 има висока проникваща способност при някои проценти от пациенти със затлъстяване с когнитивни дефекти. Не открихме никакъв вариант в екзоничните или близко разположени региони на MC4R в нашите данни за секвениране на екзоми, което може да се дължи на малкия брой изследвани субекти. Нашите резултати, тоест откриването на SNP в SYPL2, който остава значително свързан със затлъстяването след корекция за множество тестове, подкрепят схващането, че редки и нискочестотни варианти допринасят за болестното затлъстяване. Настоящото проучване обаче няма сила да оцени степента, до която редки генетични варианти причиняват болестно затлъстяване сред популацията.

SYPL2 (наричан още MG29) се експресира в мастната тъкан, мозъка, бъбреците, сърцето и малкия мозък. Функционално се предлага, че протеинът SYPL2 участва в клетъчната хомеостаза на калциевите йони. 21 Очаква се протеинът да участва в активността на транспортера и да се локализира в няколко отделения, като синаптичния везикул. 22 Интересното е, че мишките, които нямат Sypl2/Mg29, показват намалено телесно тегло, анормални мембрани на скелетните мускули и неравномерна контрактилност на скелетните мускули. 23 Как генът може да повлияе на образуването на мастна тъкан и неговата потенциална роля за развитието на затлъстяване е неясно и се нуждае от допълнителни изследвания, което е извън обхвата на това проучване.

В предишни доклади SYPL2 е свързан с голямо депресивно разстройство сред европейското население. 24 Многократно е установявана връзка между затлъстяването и депресията. При мета-анализ е установено, че затлъстяването увеличава риска от депресия. Освен това беше установено, че депресията е предсказваща за затлъстяването. 25 Друго проучване установи, че връзката на затлъстяването с депресията се ограничава главно до хора със силно затлъстяване. 26

SYPL2 принадлежи към семейството на синаптофизините. Синаптофизинът регулира зависимото от активността образуване на синапс в култивирани хипокампални неврони 27 и е необходим за кинетично ефективната ендоцитоза на синаптични везикули в култивирани хипокампални неврони. 28 Приемът на храна подлежи на сложна регулация от хипоталамуса и други мозъчни центрове, включително мозъчния ствол и хипокампуса. Следователно би могло да се предположи, че SYPL2 участва в централната регулация на приема на храна, вероятно засягайки централните системи за възнаграждение и хедоничните ефекти на храната.

В заключение идентифицирахме нискочестотен вариант на кодиране, свързан със затлъстяването в гена SYPL2, използвайки обединено секвениране на ДНК екзома на 100 пациенти със затлъстяване и 100 лица със затлъстяване, последвано от валидиране на генотипа при 3197 субекта на случаи и контроли. Нашите резултати предоставят доказателство за съществуването на кодиращ вариант, свързан със затлъстяването, въпреки че по-нататъшни функционални изследвания на този генетичен вариант все още не са провеждани.