Как работи Helena
Helena работи на прост принцип - класификацията на варианти се основава на правила и е изцяло проверима. Изкуственият интелект помага за обобщаване на доказателствата, но не взема класификационни решения. Всеки резултат може да се проследи до изходните данни, критериите и литературата.
По-малко от 15 минути
Обработка на цял геном и клинична интерпретация
Аналитичният процес
Седем етапа водят от суров VCF файл до готов клиничен доклад. Всеки етап дава проследим и проверим резултат.
Обработка на VCF и контрол на качеството
Helena приема VCF файлове от всяка секвенационна платформа - цял геном, екзом или целеви панели. Качеството на всеки вариант се оценява по дълбочина на покритие, качество на генотипа и алелен баланс.
Варианти с известно клинично значение в ClinVar се запазват винаги, дори при ниски метрики за качество. Така нито един клинично значим вариант не се губи заради качеството на секвениране.
Резултат: Филтрирани по качество варианти със запазени клинично значими варианти
Анотация на варианти
Ensembl VEP определя функционалните последици, белтъчния ефект и засегнатите домейни за всеки вариант. Обработката е паралелна и покрива милиони варианти на геном.
Към всеки вариант се добавят данни от множество бази: популационни честоти от gnomAD, клинично значение от ClinVar, предсказания от 12+ инструмента (SIFT, PolyPhen-2, CADD, REVEL, AlphaMissense, DANN, MetaSVM, GERP++, PhyloP, PhastCons), показатели за генна нетолерантност (pLI, LOEUF) и асоциации ген-заболяване от ClinGen.
Резултат: Напълно анотирани варианти с популационни, функционални, консервационни и клинични данни
ACMG/AMP класификация
Вариантите се класифицират по ACMG/AMP 2015 (Richards et al.) - международният стандарт за клинична интерпретация. Всеки от 28-те критерия (PVS1, PS1–4, PM1–6, PP1–5, BA1, BS1–4, BP1–7) се оценява систематично.
Класификацията е изцяло на основата на правила - никакъв модел с изкуствен интелект не определя патогенността. Всеки вариант получава една от петте стандартни класификации (P (патогенен), LP (вероятно патогенен), VUS, LB (вероятно доброкачествен), B (доброкачествен)) с изрично посочване на всеки приложен критерий.
Резултат: Класифицирани варианти с пълна одитна следа на ACMG критериите
Корелация фенотип-генотип
Фенотипът на пациента, описан чрез HPO термини, се сравнява с фенотипните профили на гените с кандидат-варианти. Анализът отчита семантичното сходство между термините - не само точни съвпадения, а и информационната близост в HPO йерархията.
Всеки ген получава нормализирана оценка (0–100) с клинична степен. Например патогенен вариант (P) в BRCA1 няма да бъде отбелязан като клинично значим, ако пациентът е насочен заради епилепсия. Така техническата класификация се свързва с конкретния клиничен контекст.
Резултат: Подреден списък гени, приоритизирани по силата на фенотипно съответствие за пациента
Литературни доказателства
Helena поддържа локална база с генетично филтрирана биомедицинска литература от милиони PubMed публикации. Гените, вариантите и фенотипните асоциации са предварително извлечени, така че търсенето на доказателства за всеки вариант или ген става за по-малко от секунда.
Публикациите се подреждат по клинична полезност за конкретния случай чрез многокомпонентна оценка. Всяко цитиране включва PMID, DOI и извлечен контекст - изцяло проследимо до оригиналната публикация.
Резултат: Подредени литературни доказателства с проследими цитирания за всеки ген и вариант
Клиничен скрининг и приоритизация
След класификацията вариантите се подреждат по клинична значимост чрез многомерен алгоритъм, съобразен с контекста на пациента - възраст, пол, фамилна анамнеза и индикация за изследването.
Поддържат се различни стратегии - неонатална, педиатрична, за възрастни, проактивен скрининг и тестване за носителство. Резултатът е кратък степенуван списък: Ниво 1 за находки, изискващи незабавно внимание, и Ниво 2 за тези с необходимост от допълнителна преценка. Инцидентните находки се обозначават отделно.
Резултат: Фокусиран кратък списък на клинично значими варианти от стотици кандидати
Семеен и трио анализ (при наличие на данни)
Когато са секвенирани и членове на семейството, Helena добавя доказателства за наследяване към класификацията. Три алгоритъма работят последователно: откриване на de novo варианти с нива на достоверност, определяне на фаза за варианти със съставна хетерозиготност с установяване на родителския произход и оценка на сегрегацията по ClinGen SVI 2021. Първо PLINK проверява за размяна на проби, кръвно родство и дубликати.
Не се налага повторно откриване на варианти - анализът използва вече класифицираните бази данни, обединени по хромозома, позиция и алел. Типичен трио анализ при пълногеномно секвениране (WGS) завършва за 30–90 секунди.
Резултат: Варианти с анотация за наследяване - de novo, съставна хетерозиготност и сегрегационни доказателства
Кохортен анализ (при наличие на данни)
За популационни изследвания Helena обединява класифицирани проби в кохортна матрица с дедуплициран каталог на варианти. Върху нея работят шест статистически анализа: тестване на натоварване на ниво ген (Fisher, CMC, SKAT-O с FDR корекция), обогатяване на пътища, анализ на варианти с предполагаема загуба на функция (pLoF), сравнение с gnomAD честоти, репликация на GWAS сигнали и полигенни рискови оценки по каталог PGS.
Резултатите от всички шест анализа се обединяват в подреден списък на кандидат-гени с разбивка по компонент и четими резюмета. За всеки ген се отчита статистическата мощност, така че незначимите резултати при недостатъчна мощност се интерпретират коректно.
Резултат: Подредени кандидат-гени със статистически доказателства и скоринг по компонент
Анализ на митохондриална ДНК
Митохондриалната ДНК се различава съществено от нуклеарната - майчино наследяване, хетероплазмия с ефекти, специфични за тъканите, липса на рекомбинация и хаплогрупова структура. Всичко това изисква различен подход към класификацията. Helena насочва вариантите в мтДНК към специализиран класификатор по McCormick 2020 от ClinGen Mitochondrial Disease Variant Curation Expert Panel.
Прилагат се двадесет ACMG критерия с прагове и инструменти, специфични за мтДНК: APOGEE2 за белтък-кодиращи гени, MitoTIP и HmtVAR за тРНК, MITOMAP и HmtDB за популационна честота. Седем критерия са изключени с биологична обосновка. BA1 е съобразен с хаплогрупата, а откриването на NUMT псевдогени предотвратява най-честите фалшиво положителни резултати.
Резултат: Варианти в мтДНК, класифицирани по методологията на ClinGen Mitochondrial Expert Panel
Клинична интерпретация с изкуствен интелект
Моделът с изкуствен интелект обединява доказателствата от всички предходни етапи - ACMG класификации, фенотипни корелации, литература и скрининг - в структуриран клиничен доклад. Изкуственият интелект не класифицира варианти. Класификацията е изцяло на основата на правила (Стъпка 3). Ролята му е да интегрира и представи доказателствата в готов за преглед формат.
Дълбочината на интерпретация се адаптира динамично според наличните данни: от базово вариантно резюме (само класификация) до изчерпателен диагностичен синтез (класификация, фенотип, литература и скрининг комбинирани). Доклади се генерират в PDF и DOCX формати със структурирани секции и пълно атрибуиране на доказателствата. Цялата обработка с изкуствен интелект се изпълнява на специализирана инфраструктура в ЕС - никакви данни не се изпращат към външни услуги.
Резултат: Готов за изтегляне доклад с клинична интерпретация със структурирани доказателства и препоръки
Изградена за клинично доверие
Всяко решение в Helena е взето в полза на прозрачността, проверимостта и авторитета на генетика - без компромиси с непрозрачни подходи.
Класификация, базирана на правила
Класификацията следва ACMG/AMP критерии по строги правила, не по предсказания на изкуствен интелект. Изкуственият интелект помага за събиране и представяне на доказателствата, но не взема класификационни решения.
Пълна одитна следа
Зад всяка класификация стоят конкретните ACMG критерии, всяко цитиране има PMID, всяка фенотипна оценка - своите HPO термини. Нищо не остава скрито.
Възпроизводими резултати
Един и същ VCF файл с един и същ клиничен профил дава винаги един и същ резултат. Обработката по правила гарантира детерминистични и проверими резултати.
Авторитет на генетика
Helena е инструмент за подкрепа на клиничните решения. Тя събира доказателства, прилага указанията и представя находките. Крайното решение е на генетика.
Вижте процеса в действие
Заявете демонстрация, за да видите как Helena обработва реален геном - от VCF до клиничен доклад.