Оценка на въздействието върху защитата на данните

Последно обновяване: март 2026 г. (v1.1)

Този документ предоставя резюме на Оценката на въздействието върху защитата на данните (DPIA), извършена от Helena Bioinformatics за платформата Helena, в съответствие с член 35 от GDPR. DPIA е задължителна при обработване на генетични данни в голям мащаб, тъй като представлява високорисково обработване на специална категория данни.

1. Описание на обработването

Естество на обработването: автоматизиран анализ на данни за генетични варианти (VCF файлове), качени от клинични генетични лаборатории. Обработването включва анотация на варианти спрямо популационни и клинични бази, автоматизирана ACMG/AMP класификация, фенотип-генотип корелация, извличане от биомедицинска литература, клинично резюмиране с помощта на изкуствен интелект и генериране на отчети за клинична интерпретация. Всички модели на изкуствен интелект работят локално на специализирана самостоятелна инфраструктура и никакви геномни данни не се изпращат към външни услуги или програмни интерфейси на трети страни.

Обхват: платформата обработва данни от whole-exome и whole-genome секвениране, съдържащи хиляди до милиони генетични варианти на пациентска проба. Свързаните фенотипни данни (HPO термини) и клиничният контекст също се обработват.

Контекст: платформата служи като инструмент за подкрепа на клинично решение за квалифицирани генетици. Тя не взема автономни клинични решения. Всички изходни данни, включително резюмета, генерирани от изкуствения интелект, изискват професионален преглед и валидиране.

Цел: да се намали времето за интерпретация на варианти от дни до минути, подобрявайки лабораторната пропускливост и последователност, при запазване на клиничната точност.

2. Необходимост и пропорционалност

Необходимост: обработването на данни за генетични варианти е съществено за основната функция на платформата. Услугата не може да бъде предоставяна без обработване на VCF файлове. Фенотипните данни са необходими за клинична корелация и приоритизация на вариантите.

Пропорционалност: обработваме само минимума необходими данни. VCF файловете се получават в псевдонимизирана форма (само идентификатори на пробите, без имена на пациенти). Не изискваме и не съхраняваме директно идентифицираща пациентска информация. Фенотипните данни са ограничени до стандартизирани HPO кодове, релевантни към клиничния въпрос. Запазването на данните е ограничено във времето с автоматично изтриване.

Правно основание: Helena Bioinformatics действа в двойна роля в зависимост от дейността по обработване. При обработване на геномни данни от името на лаборатория за клинична интерпретация на варианти, Helena действа като Обработващ лични данни въз основа на Споразумение за обработване на лични данни (член 28 от GDPR). Администраторът на лични данни (лабораторията) се позовава на изрично съгласие (член 9, параграф 2, буква "а") или изключението за предоставяне на здравни услуги (член 9, параграф 2, буква "з") като правно основание за обработване на специална категория данни. При обработване на де-идентифицирани данни за вътрешни цели на R&D, включително валидиране на алгоритми и подобрение на платформата, Helena действа като самостоятелен Администратор на лични данни с легитимен интерес (член 6, параграф 1, буква "е") като правно основание, в съответствие с приложимото Data Use Agreement. Във всички случаи се прилагат по-стриктните условия на регулиращите споразумения.

3. Оценка на рисковете

Риск 1: Неоторизиран достъп до генетични данни

Сериозност: Висока. Генетичните данни са неизменни и уникално идентифициращи. Вероятност: Ниска. Смекчен чрез специализирани самостоятелни сървъри (не споделена многоклиентска облачна инфраструктура), TLS 1.3 криптиране при предаване, AES-128 симетрично криптиране на ниво приложение (Fernet с HMAC-SHA256 проверка на интегритета), пълно дисково криптиране на инфраструктурно ниво, контрол на достъпа на базата на роли, правила на защитна стена и цялостно одитно логване. Остатъчен риск: Нисък.

Риск 2: Нарушение на данните при предаване

Сериозност: Висока. Вероятност: Много ниска. Цялото предаване на данни използва TLS 1.3 криптиране. VCF файловете се качват директно на нашите ЕС сървъри. Никакви геномни данни не преминават през не-ЕС юрисдикции. Остатъчен риск: Много нисък.

Риск 3: Ре-идентификация на псевдонимизирани данни

Сериозност: Висока. Генетичните данни са по природа идентифициращи. Вероятност: Много ниска. Получаваме само идентификатори на пробите, не пациентски идентификатори. Нашият персонал не може да свърже идентификаторите на пробите с индивиди. Достъпът е ограничен до автоматизирани процедури за обработване. Остатъчен риск: Много нисък.

Риск 4: Неправилна класификация на варианти, водеща до клинична вреда

Сериозност: Висока. Неправилна класификация би могла да повлияе на грижата за пациента. Вероятност: Ниска. Платформата е изрично позиционирана като инструмент за подкрепа на решение, не диагностично устройство. Всички изходни данни трябва да се преглеждат от квалифицирани генетици. Платформата следва утвърдените насоки на ACMG/AMP и препраща към валидирани бази данни (ClinVar, gnomAD). Редовна валидация спрямо клинични сравнителни показатели. Остатъчен риск: Нисък (смекчен от задължителен човешки преглед).

Риск 5: Прекомерно запазване на данни

Сериозност: Средна. Вероятност: Много ниска. Автоматично изтриване след конфигурируем срок на запазване (стандартно 90 дни). Администраторите на лични данни могат да поискат незабавно изтриване. Процесите на изтриване се логват и са одитируеми. Остатъчен риск: Много нисък.

Риск 6: Несъответствие на подизпълнители

Сериозност: Средна. Вероятност: Много ниска. Hetzner Online GmbH (доставчик на инфраструктура) поддържа сертификация по ISO 27001 и предоставя само физическо съхранение и поддръжка на сървърите, без логически достъп до данните. Налично DPA с Hetzner. Vercel Inc. (хостинг на потребителския интерфейс) обработва само ресурси за доставка на уебсайта; никакви геномни данни, пациентски идентификатори или клинична информация не се обработват от Vercel и не са достъпни за тях. Стандартни договорни клаузи се прилагат за всякакви прехвърляния на данни извън ЕС. Никакви подизпълнители извън ЕС не обработват геномни данни. Остатъчен риск: Много нисък.

Риск 7: Злоупотреба с AI модели или изтичане на данни чрез AI обработване

Сериозност: Висока. Вероятност: Много ниска. Всички модели на изкуствен интелект работят изключително на специализирана самостоятелна локална GPU инфраструктура, притежавана и управлявана от Helena Bioinformatics в същия център за данни в ЕС. Никакви геномни или клинични данни не се предават към външни услуги за изкуствен интелект, облачни езикови модели или програмни интерфейси на трети страни. Обработването от изкуствения интелект е обект на същите контроли на достъпа, одитно логване и криптиране, както всички други операции на платформата. Остатъчен риск: Много нисък.

4. Мерки за справяне с рисковете

Прилагат се следните технически и организационни мерки:

Технически мерки: специализирани самостоятелни сървъри в ЕС (Хелзинки, Финландия) без многоклиентско споделяне; TLS 1.3 криптиране при предаване; AES-128 симетрично криптиране на ниво приложение с HMAC-SHA256 проверка на интегритета, плюс пълно дисково криптиране на инфраструктурно ниво; контрол на достъпа на базата на роли с принцип на най-малко привилегии и изолация на данните на ниво организация; JWT удостоверяване с автоматично изтичане на сесията; цялостни одитни записи за всички операции с данни; автоматизирано изтриване на данни на базата на конфигурируеми политики за запазване; мрежова изолация със защитна стена, ограничаваща второстепенен трафик; bcrypt хеширане на пароли (коефициент на трудоемкост 12); управление на ключове за програмни интерфейси с SHA-256 хеширане и сравнение с постоянно време на изпълнение; изпълнение на модели за изкуствен интелект само локално, без външни повиквания; и редовни оценки на уязвимостите.

Организационни мерки: Споразумения за обработване на лични данни (DPA) с всички лабораторни партньори; задължения за конфиденциалност за целия персонал; документирани процедури за реакция при инцидент със сигурността с 24-часово уведомяване на Администраторите на лични данни; редовен преглед и актуализация на мерките за сигурност; управление на подизпълнители с уведомяване на Администратора на лични данни; обучение на персонала по задълженията за защита на данните; и определено лице за контакт по защита на данните.

5. Регулаторно съответствие

Платформата Helena е проектирана и управлявана в съответствие с приложимите европейски и национални регулации за защита на данните и киберсигурност. В допълнение към GDPR (Регламент (ЕС) 2016/679), архитектурата за сигурност на платформата адресира изискванията на Директивата NIS2 (Директива (ЕС) 2022/2555), транспонирана в българското национално законодателство чрез измененията на Закона за киберсигурност (Държавен вестник бр. 17, 13 февруари 2026 г.). Макар Helena Bioinformatics сама по себе си да не може да бъде класифицирана като съществено или важно лице по NIS2, нейната инфраструктура и мерки за сигурност са проектирани да подкрепят лабораторните партньори, които притежават такъв статус. Мерките, описани в това DPIA, включително криптиране при съхранение и предаване, контрол на достъпа, одитно логване, процедури за реакция при инцидент и управление на подизпълнители, са съгласувани със задълженията за управление на риска, изложени в член 21 от NIS2.

6. Заключение

Това DPIA заключава, че платформата Helena може да обработва генетични данни с приемливо ниво на остатъчен риск, при условие че всички идентифицирани мерки се поддържат и преглеждат редовно. Ключовите фактори, подкрепящи това заключение, са: данните се получават само в псевдонимизирана форма; цялото обработване се осъществява в рамките на ЕС на специализирана самостоятелна инфраструктура; криптирането се прилага както при предаване, така и при съхранение; моделите на изкуствен интелект работят изключително на локална инфраструктура без външно предаване на данни; платформата функционира като подкрепа на решение, изискваща задължителен човешки преглед; и запазването на данните е ограничено във времето с автоматично изтриване.

Това DPIA ще се преглежда годишно или при значителни промени в дейностите по обработване, инфраструктурата или регулаторната среда.

За въпроси относно тази оценка, свържете се с нас на privacy@helena.bio.

История на версиите

v1.1 - март 2026 г.: изяснено двойно правно основание (роли на Обработващ и Администратор); коригирана спецификация на криптирането (AES-128 Fernet на ниво приложение, пълно дисково криптиране на инфраструктурно ниво); добавен Риск 7, покриващ обработването от изкуствен интелект и локалното изпълнение на моделите; добавен Vercel като подизпълнител с изясняване на обхвата; добавен Раздел 5 относно регулаторно съответствие с NIS2; обновена референцията към длъжностното лице по защита на данните до определено лице за контакт по защита на данните; общи редакторски подобрения.

v1.0 - февруари 2026 г.: първоначална публикация.