← Back to blog

Как разработать биомаркер для редкого заболевания

June 30, 2026
Как разработать биомаркер для редкого заболевания

Биомаркер для редкого заболевания — это измеримый молекулярный или биохимический показатель, который отражает патологический процесс и служит основой для диагностики или оценки терапии. Разработать биомаркер для редкого заболевания сложнее, чем для распространённых болезней: когорты пациентов малы, данные гетерогенны, а клинические проявления нередко маскируют истинную причину. По стандартам FDA и EMA, биомаркер должен пройти аналитическую и клиническую валидацию, прежде чем его примут в практику. Именно поэтому исследователи всё чаще объединяют мультиомные технологии, высокочувствительные аналитические платформы и методы искусственного интеллекта в единый рабочий процесс.

Какие данные и технологии нужны для создания биомаркера при редком заболевании

Разработка биомаркеров начинается с формирования качественной доказательной базы. При редких заболеваниях это означает работу с мультиомными данными: геномикой, транскриптомикой и протеомикой одновременно. Каждый из этих уровней добавляет слой информации, который невозможно получить из одного источника.

Геномика выявляет патогенные варианты и мутации. Транскриптомика показывает, какие гены активны в конкретной ткани при конкретном состоянии. Протеомика переводит эту активность в измеримые белковые концентрации, которые можно обнаружить в крови или ликворе. Совместный анализ трёх уровней резко повышает шанс найти специфичный маркер там, где один метод даёт лишь шум.

Ключевые технологические платформы для детекции биомаркеров:

  • Секвенирование нового поколения (NGS) — позволяет охватить весь экзом или геном за один эксперимент.
  • Масс-спектрометрия — количественно определяет белки и метаболиты в малых объёмах биоматериала.
  • Микрофлюидика — обрабатывает нанолитровые объёмы жидкости, снижая расход редкого биоматериала.
  • Цифровая ПЦР (ddPCR) — обнаруживает единичные копии нуклеиновых кислот с абсолютной количественной точностью.

Не менее критична база данных пациентов. Специализированные регистры, такие как Orphanet или национальные реестры редких болезней, дают доступ к аннотированным образцам и клиническим фенотипам. Без структурированного регистра исследователь работает вслепую: невозможно отделить патологический сигнал от физиологической вариабельности.

Редкие биомаркеры присутствуют в следовых концентрациях и требуют высокочувствительного оборудования и биоинформатики. Традиционные методы не распознают их на ранних стадиях. Это означает, что выбор аналитической платформы определяет не только точность, но и саму возможность обнаружить маркер.

Геномные прятки: маскирующиеся гены и скрытые участки затрудняют поиск перспективных биомаркеров

ТехнологияТип данныхМинимальный объём пробы
NGS (полный экзом)Геномные варианты1–5 мкг ДНК
Масс-спектрометрияБелки, метаболиты10–50 мкл плазмы
Микрофлюидный чипНуклеиновые кислоты, белкименее 1 мкл
Цифровая ПЦРРНК, ДНК1–20 нг

Как применить ИИ и машинное обучение для анализа данных редкого заболевания

Машинное обучение при редких заболеваниях сталкивается с фундаментальной проблемой: данных мало, а классы сильно несбалансированы. Стандартные алгоритмы, обученные на таких данных, систематически игнорируют редкий класс и выдают ложноотрицательные результаты именно там, где цена ошибки наиболее высока.

Решение этой проблемы требует специализированных подходов. Ниже приведены методы, которые доказали эффективность именно в контексте редких заболеваний.

  1. Few-shot learning. Модели обучаются распознавать новый класс по 5–20 примерам. Это критично, когда когорта пациентов насчитывает десятки, а не тысячи человек.
  2. Transfer learning. Предобученная модель на данных распространённых заболеваний адаптируется к редкому фенотипу. Нейронная сеть уже «знает» базовую биологию и дообучается на малой выборке.
  3. Федеративное обучение. Несколько медицинских центров обучают общую модель, не передавая сырые данные пациентов. Федеративное обучение позволяет объединять данные из разных центров без нарушения конфиденциальности. Это особенно ценно в Европе, где GDPR жёстко ограничивает трансграничный обмен медицинскими данными.
  4. Аугментация in silico. Синтетические образцы, созданные методами SMOTE или генеративных состязательных сетей (GAN), расширяют обучающую выборку без привлечения новых пациентов.
  5. Специализированные функции потерь. Focal loss и cost-sensitive learning штрафуют модель сильнее за пропуск редкого класса, чем за ложноположительный результат.

При работе с редкими заболеваниями классические метрики машинного обучения дают ложноположительные результаты из-за дисбаланса классов. Рекомендуется использовать AUPRC, Recall и NPV вместо Accuracy. Метрика Accuracy покажет 99% правильных ответов, если модель просто всегда предсказывает «здоров», а больных в выборке 1%. Это не диагностика, это статистический артефакт.

Профессиональный совет: Перед обучением модели всегда стратифицируйте разбивку на обучающую и тестовую выборки по клиническому центру, а не случайно. Иначе модель запомнит особенности конкретной лаборатории, а не биологический сигнал болезни.

Использование специализированных методов ИИ позволяет на малых выборках выявлять скрытые паттерны в генетических данных. Это меняет саму логику поиска биомаркеров: вместо проверки одной гипотезы исследователь получает инструмент для генерации гипотез из данных.

Чьи-то руки набирают данные на клавиатуре, анализируя биомаркеры.

Этапы валидации биомаркера для клинического применения

Валидация биомаркера — это не одноразовый эксперимент, а многоступенчатый протокол. Пропуск любого этапа ведёт к тому, что маркер не пройдёт регуляторную проверку и останется лабораторным артефактом.

Наглядная вертикальная схема основных этапов проверки биомаркеров

Формирование когорты и регистра

Первый шаг — создать проспективный регистр пациентов с чётко определёнными критериями включения. Для редкого заболевания это означает международное сотрудничество: одна клиника редко набирает достаточную когорту. Регистр должен содержать биобанк образцов, стандартизованные клинические данные и информацию о лечении. Комплексная валидация биомаркеров включает создание регистров, полногеномный анализ, микроскопию и иммунодетекцию. Многоступенчатый подход выявляет скрытые формы болезни, которые рутинные тесты пропускают.

Аналитическая и клиническая валидация

Аналитическая валидация проверяет, что метод измерения воспроизводим, специфичен и чувствителен в заданном диапазоне концентраций. Клиническая валидация отвечает на вопрос: действительно ли уровень маркера коррелирует с наличием или тяжестью заболевания? Эти два этапа нельзя объединять.

Этап валидацииКлючевые методыТипичные ошибки
АналитическаяИФА, масс-спектрометрия, ПЦРОтсутствие контрольных образцов, вариабельность между партиями
КлиническаяКогортное исследование, ROC-анализСмешение когорт из разных центров без стандартизации
БиоинформатическаяGWAS, дифференциальная экспрессияПереобучение модели на малой выборке
РегуляторнаяСоответствие FDA Biomarker Qualification ProgramНеполная документация аналитических характеристик

Профессиональный совет: Включайте в когорту пациентов с похожими, но другими диагнозами — это единственный способ проверить специфичность маркера в реальных клинических условиях, а не только в сравнении с полностью здоровыми донорами.

Биохимические маркеры, например повышение КФК при мышечной дистрофии Дюшенна, предшествуют клиническим симптомам и помогают раннему скринингу. Это классический пример того, как правильно валидированный биомаркер меняет клиническую практику задолго до появления симптомов. Подробнее о том, почему диагностика редких болезней остаётся сложной задачей даже при наличии маркеров, можно узнать в отдельном материале.

Какие платформы позволяют выявлять биомаркеры в малых образцах

Дефицит биоматериала — хроническая проблема при редких заболеваниях. Пациентов мало, повторные биопсии этически сложны, а объём крови у детей ограничен. Именно поэтому технологии, работающие с микролитровыми объёмами, стали приоритетом для исследователей.

Технология «лаборатория-на-чипе» объединяет несколько аналитических шагов на одной миниатюрной платформе. В России создан прототип «лаборатории-на-чипе» для сверхчувствительного обнаружения биомаркеров из малых объёмов биологических жидкостей. Чип выявляет молекулы по низким концентрациям без сложного лабораторного оборудования, снижая стоимость и время диагностики. Это принципиально важно для клиник, которые не располагают дорогостоящей инфраструктурой.

Ещё один класс решений — наноразмерные биосенсоры на основе аптамеров. Аптамеры — это короткие одноцепочечные нуклеиновые кислоты, которые связываются с мишенью с высокой специфичностью, сопоставимой с антителами. Использование плазмонных наночастиц с антителами позволяет усиливать сигнал биомаркера в миллионы раз за считанные минуты. Время реакции после нанесения нанозондов составляет около 10 минут. Для клинической лаборатории это означает возможность получить результат в рамках одного визита пациента.

Среди актуальных платформ для работы с малыми образцами выделяются следующие направления:

  • Микрофлюидные чипы с электрохимической детекцией. Прототип микрофлюидного чипа с трёхслойной электродной структурой из меди, никеля и золота выявляет биомаркеры на ранних стадиях с высокой чувствительностью. Система не требует сложного оборудования и рассчитана на массовое применение.
  • Цифровой иммуноанализ (Simoa). Позволяет измерять белки в концентрациях на три порядка ниже, чем стандартный ИФА.
  • Нанопоровое секвенирование. Обрабатывает единичные молекулы ДНК или РНК в режиме реального времени без предварительной амплификации.

Перспектива масштабирования этих технологий реальна. Микрофлюидные платформы уже переходят от исследовательских прототипов к сертифицированным медицинским изделиям. Для исследователей это означает, что результаты, полученные на чипе в лаборатории, в ближайшие годы можно будет воспроизвести в клинике без потери чувствительности. Подробнее о типах редких генетических заболеваний и соответствующих биомаркерах можно прочитать в отдельном руководстве.

Ключевые выводы

Эффективная разработка биомаркеров для редких заболеваний требует одновременной интеграции мультиомных данных, специализированных методов ИИ и многоступенчатой клинической валидации.

ПунктПодробности
Мультиомный подходГеномика, транскриптомика и протеомика вместе дают специфичность, недостижимую одним методом.
Специализированные метрики ИИИспользуйте AUPRC, Recall и NPV вместо Accuracy при несбалансированных классах.
Федеративное обучениеОбъединяйте данные из разных центров без передачи сырых записей пациентов.
Многоступенчатая валидацияАналитическая, клиническая и биоинформатическая валидация — три отдельных этапа, не один.
Микрофлюидные платформыЧипы с нанолитровым объёмом пробы решают проблему дефицита биоматериала при редких болезнях.

Почему я считаю, что главная ошибка исследователей — недооценка регистра

За годы работы с редкими заболеваниями я убедился в одном: большинство провальных проектов по разработке биомаркеров рушатся не из-за плохой технологии, а из-за плохого регистра. Исследователи тратят месяцы на выбор аналитической платформы и недели на формирование когорты. Это неправильный порядок приоритетов.

Регистр — это фундамент. Без стандартизованных клинических фенотипов, без аннотированных образцов и без чёткого определения случая любой биомаркер, который вы найдёте, будет отражать особенности вашей выборки, а не биологию болезни. Я видел, как перспективные кандидаты в биомаркеры исчезали при попытке воспроизвести результат в другом центре именно по этой причине.

Второй недооценённый фактор — роль ИИ как инструмента генерации гипотез, а не подтверждения. Многие команды приходят к машинному обучению с уже сформированной гипотезой и используют модель как дорогой статистический тест. Это расточительство. Правильная стратегия: сначала дать модели найти паттерны в данных, затем проверять биологически осмысленные кандидаты мокрыми методами.

Третье: не бойтесь федеративного обучения. Да, настройка инфраструктуры требует времени. Но это единственный реалистичный способ набрать достаточную выборку для редкого заболевания, не нарушая законодательство о защите данных. Команды, которые освоили этот подход, получают конкурентное преимущество, которое невозможно купить за деньги.

Будущее разработки биомаркеров для редких болезней — за консорциумами, которые объединяют данные, а не за лабораториями, которые работают в изоляции.

— John

Hopeatrarelabs: поддержка исследователей на каждом этапе

Hopeatrarelabs специализируется на создании персонализированных моделей болезней для ультраредких и недиагностированных генетических заболеваний. Платформа использует индуцированные плюрипотентные стволовые клетки (iPSC) и редактирование генома CRISPR для построения клеточных моделей непосредственно из клеток пациента.

https://hopeatrarelabs.com

Для исследователей, которые работают над идентификацией и валидацией биомаркеров, Hopeatrarelabs предлагает доступ к базе знаний RareLabs с протоколами, аналитическими ресурсами и экспертной поддержкой. Параллельный скрининг тысяч одобренных FDA препаратов и оценка вариантов генной терапии ускоряют переход от биомаркера к терапевтической гипотезе. Узнайте подробнее о платформе прецизионной медицины и о том, как Hopeatrarelabs может поддержать вашу программу исследований.

Часто задаваемые вопросы

Что такое биомаркер редкого заболевания?

Биомаркер редкого заболевания — это измеримый молекулярный показатель, который отражает наличие, стадию или ответ на лечение конкретной болезни. Он может быть генетическим, белковым, метаболическим или клеточным.

Почему разработка биомаркеров при редких болезнях сложнее?

Когорты пациентов малы, данные гетерогенны, а клинические проявления часто неспецифичны. Это делает статистическую валидацию и воспроизводимость результатов принципиально сложнее, чем при распространённых заболеваниях.

Какие метрики ИИ подходят для диагностики редких заболеваний?

При несбалансированных классах используйте AUPRC, Recall и NPV вместо Accuracy. Метрика Accuracy вводит в заблуждение, когда больных в выборке значительно меньше, чем здоровых.

Как решить проблему нехватки данных при редком заболевании?

Федеративное обучение, аугментация in silico и transfer learning позволяют повысить качество моделей без увеличения числа реальных пациентов. Эти методы особенно эффективны в сочетании с международными регистрами.

Какие технологии позволяют анализировать биомаркеры из малых образцов?

Микрофлюидные чипы, цифровой иммуноанализ и нанопоровое секвенирование работают с объёмами менее одного микролитра. Российский прототип микрофлюидного чипа с трёхслойной электродной структурой уже демонстрирует высокую чувствительность при минимальном объёме пробы.

Рекомендуемые