Аналитичен процес
Семеен и трио анализ
Клиничните диагнози на редки менделови заболявания се възползват изключително от семеен контекст. Вариант, класифициран като VUS при WES само на пробанда, може да бъде повишен до вероятно патогенен, след като родителските генотипи потвърдят de novo произход. Двойките със съставна хетерозиготност в рецесивни гени са невидими без определяне на фаза. Сегрегацията на вариант със статуса на заболяване при членовете на семейството осигурява допълнителни доказателства съгласно указанията на ClinGen SVI 2021. Услугата за семеен анализ автоматизира тази обработка, съобразена със семейния контекст, върху предварително класифицирани WGS или WES данни.
Без повторно извикване на варианти. Без повторна VEP анотация. Услугата работи изцяло върху предварително класифицираните бази данни, произведени от услугата за анализ на варианти, запазвайки ACMG класификационния контекст и добавяйки доказателства за наследяване.
Съдържание
Клинично позициониране
Три конкретни клинични сценария илюстрират защо семейният анализ променя диагностичния отговор по начини, по които анализът на единичен пробанд не може.
Три сценария
VUS при пробанда, потвърден de novo от родителите. Вариант с променен смисъл (missense) в ген с висока нетолерантност, първоначално класифициран като VUS при единичен пробанд. След като родителските генотипи потвърдят, че вариантът е възникнал de novo, силата на доказателствата се повишава съществено - de novo произход в ген с висока нетолерантност е едно от най-силните единични клинични доказателства.
Два хетерозиготни варианта в рецесивен ген, с определена фаза in trans. Двойка варианти в рецесивен болестен ген, всеки наследен от различен родител, формира двуалелна загуба на функция. Това е диагностичният отговор за много рецесивни състояния и е невидимо без родителско определяне на фаза.
Вариантът сегрегира с болестта. Вариант, присъстващ при засегнати членове на семейството и липсващ при незасегнати, осигурява сегрегационни доказателства по ClinGen SVI. Силата зависи от броя наблюдавани мейози - трио се ограничава до подкрепящо ниво; разширено родословие е необходимо за умерено или по-силно.
Всяко от тях е различен алгоритъм за наследяване с различни изисквания към данните. Услугата за семеен анализ изпълнява и трите върху едни и същи трио данни и представя комбинираните доказателства на генетика заедно с предходната ACMG класификация.
Поддържани семейни композиции
Трио е каноничната конфигурация. Дуо и пробанд с брат/сестра се поддържат с изрично маркиране на намалена достоверност за засегнатите алгоритми.
Трио
Пробанд, майка, баща. Каноничната композиция. Позволява пълно откриване на de novo варианти, определяне на фаза при съставна хетерозиготност с установяване на родителски произход и сегрегационна оценка през две мейози.
Възможности: И трите алгоритъма за наследяване работят.
Дуо
Пробанд и един родител. Поддържа анализ на наследяването с намалена достоверност при de novo определянията (един родител не е наблюдаван) и частично определяне на фаза.
Възможности: De novo и сегрегация работят с изрично маркиране на намалена достоверност. Определянето на фаза при съставна хетерозиготност е ограничено.
Пробанд и брат/сестра
За семейства, в които родителите не са налични, братът или сестрата може да осигури сегрегационни доказателства, когато статусът на засегнатост е известен и при двамата.
Възможности: Сегрегационното оценяване работи. De novo и анализ при съставна хетерозиготност не са възможни без родителски данни.
Архитектура на процеса
Четири етапа се изпълняват последователно върху типично WGS трио за приблизително 30–90 секунди. Процесът е атомичен по фаза - ако фаза се провали, последващите фази не се изпълняват и точката на провал се записва.
Етап 1
Конструиране на трио JOIN
Услугата прикачва предварително класифицираната база данни на всеки член само за четене и конструира унифицирана трио таблица чрез join по (chromosome, position, reference allele, alternate allele). Колоните за всеки член са със суфикс за ролята (proband, mother, father). Колоните за наследяване са предварително заделени и се попълват от последващите етапи.
Етап 2
Контрол на качеството на пробите
Когато комбиниран VCF е наличен, се извиква PLINK 1.9 за анализ на идентичност по произход (identity-by-descent, IBD). Резултатът се анализира за размяна на проби, кръвно родство или дублирани проби. Полученият доклад за качество се записва заедно с трио данните и се извежда в обобщението на случая.
Етап 3
Процес за анализ на наследяването
Три последователни фази работят върху трио таблицата: откриване на de novo варианти, определяне на фаза при съставна хетерозиготност и сегрегационна оценка. Всяка фаза е атомична - ако фаза се провали, последващите фази не се изпълняват и етапът на провала се записва за преглед от оператор.
Етап 4
Агрегация на доказателства
Анотациите за наследяване на ниво вариант се обобщават в обобщения на доказателствата и качеството в JSON формат, съхранени в записа на трио анализа за бързо извличане. Детайлът на ниво вариант остава в трио базата данни за разглеждане при поискване от генетика.
Контрол на качеството на пробите
Преди всеки анализ на наследяването услугата проверява, че семейните връзки в метаданните съответстват на генетичните връзки в данните. Размяна на проби, случайно дублиране и недокладвано кръвно родство нарушават последващите анализи за наследяване, ако не бъдат открити.
PLINK анализ на идентичност по произход (IBD)
Когато комбиниран VCF е наличен от лабораторията, услугата изпълнява PLINK 1.9 IBD анализ върху биалелни SNPs над праг на честота на минорния алел. Двойковата IBD матрица се анализира за три класа предупреждения.
Размяна на проби
Когато IBD между пробанд и заявен родител не съвпада с очакваната връзка родител-дете.
Кръвно родство
Когато IBD между двамата заявени родители е повишен над очакваната базова стойност за несвързани индивиди.
Дублирана проба
Когато двама заявени членове на семейството са генетично идентични - типично грешка при качване, а не реален биологичен сценарий.
Предупрежденията се извеждат в обобщението на случая заедно с доказателствата за наследяване. Генетикът вижда резултатите от контрола на качеството преди да чете резултатите от анализа.
Откриване на de novo варианти
Идентифицира варианти, налични в пробанда, но липсващи и при двамата родители, с изрични нива на достоверност, отразяващи силата на подкрепящите доказателства.
Пет-степенна класификация по достоверност
Вариантите се класифицират през множество нива на достоверност, отразяващи силата на доказателствата за de novo произход. По-високите нива изискват както чисти родителски генотипи, така и достатъчна дълбочина на четене; по-ниските нива отразяват неяснота в родителското покритие или качеството на генотипа.
Проверка за наличие на хромозома
Когато родителски генотип е NULL, системата разграничава потвърден извод за хомозиготен референтен генотип (хромозомата е секвенирана и определена като референтна) от подозрително отсъствие (хромозомата може да не е била адекватно покрита). Това е ключов клиничен предпазен механизъм, предотвратяващ фалшиви de novo резултати от пропуски в покритието.
Изключения за хромозоми, съобразени с пола
Биологично очакваните NULL се разпознават като такива: хромозома Y при майка, митохондриална ДНК при баща. Те не водят до понижаване на достоверността. Полът на всеки член на семейството е част от входа.
Запазена чиста ACMG класификация
De novo анотацията се добавя върху предходната ACMG класификация. Оригиналното P (патогенен) / LP (вероятно патогенен) / VUS / LB (вероятно доброкачествен) / B (доброкачествен) присвояване от анализа на варианти се запазва непроменено. Генетиците виждат и двете: класификацията и новите доказателства от семейния анализ.
Определяне на фаза при съставна хетерозиготност
Идентифицира двойки от хетерозиготни кодиращи или сплайсингови варианти в същия ген, които може да формират двуалелна загуба на функция. Определянето на фаза изисква информация за родителския произход и разграничава in trans (двуалелни) от in cis (моноалелни) конфигурации.
Определяне на фаза по родителски произход
Когато родителските генотипи са налични, услугата определя дали двойка хетерозиготни варианти в същия ген идват от различни родители (in trans, двуалелни) или от един родител (in cis, моноалелни). Само in trans двойките представляват истинска двуалелна загуба на функция.
Откриване на множество партньори
Вариант може да участва в множество двойки кандидати със съставна хетерозиготност. Услугата маркира това, така че генетикът да види пълната картина от двуалелни кандидати в гена, а не само първата открита двойка.
Кодиращо и сплайсингово ограничение
Кандидатурата за съставна хетерозиготност е ограничена до кодиращи и сплайсингови последици. Синонимни, интронни и регулаторни варианти са коректно изключени - те не представляват двуалелна загуба на функция независимо от зиготността.
Симетрична анотация
Когато варианти A и B формират двойка със съставна хетерозиготност, и двата реда в трио таблицата са анотирани. Генетикът може да попадне на който и да е вариант и веднага да види партньора.
Сегрегационна оценка
LOD оценки на ниво вариант чрез методологията на Jarvik, определена от ClinGen SVI 2021. Привеждане към категории за сила на доказателствата по ClinGen с изрично отчитане на ограниченията на трио данните.
Методология ClinGen SVI 2021
LOD оценки на ниво вариант се изчисляват чрез методологията на Jarvik за отношение на правдоподобности, определена от работната група на ClinGen SVI (Sequence Variant Interpretation). Методологията е публикувана, рецензирана и проектирана за клинично приложение.
Привеждане към пет нива на сила
LOD оценките се съпоставят с категории за сила на доказателствата, съобразени с ClinGen - not_applicable, indeterminate, supporting, moderate, strong, very_strong. Клиничната комуникация оперира с тези нива; суровите LOD стойности остават достъпни за одит.
Реалистичен трио таван
Трио носи само две мейози сегрегационни доказателства. Математическият таван за LOD само за трио е приблизително 0,3 - подкрепящо ниво дори при идеални условия. Повечето реални трио попадат в supporting или indeterminate. strong и very_strong нива изискват данни от разширено родословие - това е планираната следваща стъпка.
Съобразено с хипотезата
Когато хипотезата за наследяване е неизвестна, сегрегационната фаза изрично записва not_applicable, вместо да произвежда изкуствен LOD = 0 резултат. Това предотвратява погрешно тълкуване на „няма изчислени доказателства“ като „доказателства против“.
Планиране на осъществимостта
Преди процесът да се изпълни, услугата оценява кои фази на анализа за наследяване са осъществими предвид семейния състав и хипотезата за наследяване. Маркерите за осъществимост и текстовата обосновка се записват заедно с анализа и осигуряват клиничен одитен запис.
| Маркер | Значение |
|---|---|
| de_novo_feasible | True когато и двамата родители са секвенирани и хипотеза за наследяване, съвместима с de novo (автозомно-доминантно или спорадично), е правдоподобна. False иначе - например дуо без засегнатия родител. |
| compound_het_feasible | True когато поне един родител е секвениран и хипотезата за наследяване е автозомно-рецесивна. Определянето на фаза изисква информация за родителския произход. |
| segregation_feasible | True когато са налични поне двама членове на семейството със статус на засегнатост. Трио със засегнат пробанд и един засегнат родител отговаря; единичен случай - не. |
| plan_rationale | Структурирано текстово обяснение защо всяка фаза е била планирана като осъществима или не. Осигурява клиничен одитен запис - генетикът може да провери кои доказателства за наследяване са били търсени и кои не, и защо. |
Входни и изходни данни
Какво получава системата от предходните етапи и от генетика, и какво произвежда за преглед и последващите модули.
От предходните етапи
Предварително класифицирани бази данни с класифицирани варианти от анализа (по една на член на семейството)
ACMG/AMP класификация, критерии и подкрепящи доказателства, приложени за всеки вариант
Незадължителен комбиниран VCF, когато е наличен от лабораторията
Без повторно извикване на варианти, без повторна VEP анотация - услугата работи изцяло върху предварително класифицирани данни
Входове от генетика
Семейна композиция: трио (пробанд + майка + баща), дуо (пробанд + един родител) или пробанд + брат/сестра
Метаданни за всеки член: идентификатор на сесия, пол, статус на засегнатост (засегнат / незасегнат / неизвестен)
Хипотеза за наследяване, когато е налична (автозомно-доминантно, автозомно-рецесивно, X-свързано, митохондриално, спорадично, неизвестно)
Незадължителен комбиниран VCF път за проверка за размяна на проби и кръвно родство
Резултати за генетика
De novo анотация за всеки вариант: ниво на достоверност и подкрепящи доказателства
Двойки със съставна хетерозиготност: определяне на фазата, партньорски варианти, маркери за множество партньори
Сегрегационни доказателства: LOD оценка на ниво вариант и категория, съобразена с ClinGen
Обобщение от контрола на качеството: IBD резултати, предупреждения за размяна на проби или кръвно родство
Осъществимост и обосновка: кои фази са били планирани като осъществими и защо
Обобщение на доказателствата в JSON, записано в анализа за бързо извличане
Данни за последващите модули
Записана трио база данни с варианти, използвана от модула с изкуствен интелект за доклада от семейния анализ
Данни за всеки случай, налични за кохортна аналитика при популационна работа
Стандарти и граници
Услугата работи спрямо публикувани стандарти и в рамките на ясни клинични граници.
ACMG/AMP
Класификацията на варианти следва ACMG/AMP 2015 със следващите ClinGen спецификации. Извършва се преди това от услугата за анализ на варианти. Услугата за семеен анализ използва тази класификация и добавя доказателства, съобразени с наследяването - не рекласифицира.
Препратка: Richards et al., Genetics in Medicine, 2015, PMID: 25741868
Сегрегация по ClinGen SVI 2021
Сегрегационното LOD оценяване следва методологията на работната група на ClinGen SVI (Sequence Variant Interpretation) за клинично приложение. Методологията на Jarvik за отношение на правдоподобности е публикувана и валидирана.
Препратка: ClinGen Sequence Variant Interpretation Working Group, 2021
Методология на Jarvik за правдоподобност
LOD изчисление на ниво вариант. Утвърдена методология за сегрегационни доказателства, основани на правдоподобност, в клиничната генетика.
Препратка: Jarvik and Browning, AJHG, 2016, PMID: 27374771
PLINK 1.9
Анализ на идентичност по произход на ниво проба за откриване на размяна на проби, кръвно родство и дублирани проби. Утвърден инструмент за установяване на генетични връзки.
Препратка: Chang et al., GigaScience, 2015, PMID: 25722852
Само предварително класифицирани данни
Услугата не извиква повторно варианти. Без локално извикване на DeepTrio, GLnexus или VEP. Съвместното извикване (joint calling), когато е налично, се извършва в лабораторията и се използва като вход. Това запазва ACMG класификационния контекст и избягва дублиране на изчисления, вече извършени от услугата за анализ на варианти.
Граници на докладването
Услугата произвежда данни за варианти с анотация за наследяване, изрични нива на достоверност, категории за сила на доказателствата и обосновка на осъществимостта. Не генерира клинични интерпретации, не прави диагностични решения и не замества клиничния преглед. Целият изход е предназначен за преглед от квалифициран генетик преди каквото и да е действие.
Местоположение на данните
Услугата работи в рамките на платформата Helena върху инфраструктура в ЕС, съвместима с GDPR Член 9 и техническите изисквания на 1+MG. Никакви семейни геномни данни не напускат платформата по време на анализа.
Какво я отличава
Осем проектни решения, които правят семейния и трио анализ различен от стандартните инструменти за родословен анализ.
Анализ на наследяването с максимална точност
Работи върху предварително класифицирани данни от услугата за анализ на варианти. Запазва ACMG класификационния контекст. Без повторно извикване, без повторна анотация, без загуба на информация.
Три алгоритъма за наследяване в един процес
Откриването на de novo варианти, определянето на фаза при съставна хетерозиготност и сегрегационното оценяване работят последователно върху едни и същи трио данни. Генетикът вижда пълната картина на наследяването на едно място.
Честни относно ограниченията на трио
Трио се ограничава до приблизително 0,3 LOD - подкрепящо ниво дори при идеални условия. Документираме това изрично, вместо да преувеличаваме силата на доказателствата. strong и very_strong нива изискват разширено родословие.
Проверка за наличие на хромозома
Разграничава потвърден извод за хомозиготен референтен генотип от подозрително отсъствие, когато родителският генотип е NULL. Клиничен предпазен механизъм, който предотвратява фалшиви de novo резултати от пропуски в покритието.
Изключения, съобразени с пола
chrY NULL за майка и chrM NULL за баща са биологично очаквани, не пропуски в покритието. Системата разпознава това и не понижава достоверността.
Маркери за осъществимост с обосновка
Всеки анализ записва кои фази са били планирани като осъществими и защо. Генетикът може да провери какви доказателства са били търсени и какви не - осигурява клиничен одитен запис.
Атомична фазова семантика
Ако фаза се провали, последващите фази не се изпълняват. Точният етап на повредата се записва. Частичното състояние се запазва за преглед от оператор, вместо да се презаписва.
Вграден контрол на качеството на пробите
PLINK IBD анализът работи като част от стандартния процес, когато комбиниран VCF е наличен. Предупрежденията за размяна на проби, кръвно родство и дублирани проби излизат на повърхността преди клиничната интерпретация.
Вижте семейния анализ в действие
Заявете демонстрация, за да видите как Helena обработва реално трио през пълния процес - с откриване на de novo варианти, определяне на фаза при съставна хетерозиготност и сегрегационна оценка, всички изведени заедно с предходната ACMG класификация.