Застосування Big Data у медицині

4

Аспірант МДУ, науковий журналіст Микола Козин розібрався, як працюють великі дані (Big Data) в медицині.

Вперше термін «великі дані» (Big Data) вжив у 2008 році британський журнал Nature, присвятив спеціальний номер феномену вибухового зростання обсягу і різноманітності оброблюваних даних.

У наступні роки великі дані стали одним з домінуючих напрямків в розвитку інформаційних технологій. Передбачається, що робота з колосальними обсягами неструктурованих даних найбільше вплине на виробництво, держуправління, торгівлю і медицину.

Перша біомедична революція була пов’язана з появою мікроскопії і з впровадженням наукового підходу в клінічні дослідження. Експерти пророкують, що великі дані здійснять «другу революцію», і приведуть у величезному якісного стрибка в системі охорони здоров’я.

Що ж великі дані можуть дати медицині? Стануть вони панацеєю або не виправдають надій, як універсальні аналізатори крові від Theranos?

Наскільки великі великі дані

Масив інформації оцінюють як великі дані, тільки якщо він настільки об’ємний, що його стає важко зберігати, обробляти та аналізувати.

Виробничі потужності комп’ютерів і раніше ростуть, але не так стрімко, як ще десять років тому. А ось кількість цифрової інформації зростає загрозливими темпами.

За прогнозами корпорації ЕМС, обсяг згенерованих людством даних до 2020 року складе 40 зеттабайт. Скільки це?

Кількість піщинок на всіх пляжах Землі становить 700 500 000 000 000 000 000 (чи сім квинтильонов п’ять квадрильйонів). 40 зеттабайт — це в 57 разів більше даних, ніж кількість піщинок на всіх пляжах планети.

Насправді, під терміном Big Data фахівці мають на увазі не якийсь конкретний величезний обсяг даних, а методи їх обробки.

Існують десятки, якщо не сотні різноманітних методик аналізу даних, в основі яких лежить інструментарій, запозичений з інформатики (наприклад, машинне навчання), маркетингових досліджень (A/B-тестування), статистики (регресійний аналіз).

Не вдаючись у нетрі визначень і схем, детальніше розберемо практичні результати Big Data у медицині.

Навіщо лікарям і фармацевтам великі дані

У майбутньому історія всіх медичних «маніпуляцій» з народження людини буде зберігатися в електронній базі.

Алгоритми машинного навчання, які вміють знаходити статистичні кореляції у величезному світовому масиві медичних даних, будуть оперативно видавати прогнози і рекомендації для пацієнта і його лікуючого лікаря.

Основні стратегії застосування великих даних в медицині

  • Створення реєстрів медичних даних, в яких можна обмінюватися інформацією.
  • Використання накопиченої інформації для прогнозування можливих «хвиль» захворювань.
  • Впровадження електронної картки пацієнта, яка буде доступна кожному лікареві, який його лікує.
  • Big Data і медичні прогнози

    Аналіз всіх відомих історій хвороби і діагностики дозволить ввести в практику лікарів системи підтримки прийняття лікарських рішень. Доктора отримають доступ до досвіду десятків тисяч колег по всьому світу.

    1. Прогнозування розвитку хвороб

    Дані електронних медкарт вже дозволили лікарям встановити зв’язок між, здавалося б, принципово різними захворюваннями. Розроблена в 2013 році консорціумом Kaiser Permanente система оцінки ризику дозволяє зробити прогноз про розвиток слабоумства у пацієнтів з цукровим діабетом.

    Використовуючи таку ж модель, американські військові намагаються зменшити кількість самогубств серед ветеранів воєн.

    2. Виявлення генетичних маркерів в онкології

    Вчені з Університету Кейптауна UCT, проаналізувавши найбільш поширені види онкологічних захворювань, прийшли до висновку, що кожен з цих видів раку характеризується чітко вираженою комбінацією генів.

    Виявилося, що раку грудей, кишечника, легенів, яєчників і мозку є чіткі генетичні маркери. За словами керівника дослідження, команда не змогла б зробити відкриття, якби у неї не було доступу до великих масивів даних.

    3. Прогнозування стану здоров’я немовлят

    Дитяча лікарня Торонто впровадила проект Project, Artemis. Лікарняна інформаційна система збирає і аналізує дані по немовлятам в реальному часі. Система може щомиті відстежувати 1260 показників стану кожної дитини, дозволяє прогнозувати нестабільний стан, і вчасно почати профілактику захворювань у дітей.

    4. Прогнозування факторів ризику в хірургії

    Лікарі Головного Массачусетського госпіталю використовують аналітичну систему QPID, щоб контролювати важливу інформацію про пацієнта протягом курсу лікування. Інше застосування системи QPID в охороні здоров’я — прогнозування хірургічного ризику.

    «Навіть відомі на весь світ хірурги без великого ентузіазму будуть оперувати пацієнта, який з високою часткою ймовірності може померти на столі», — прокоментував можливість робити хірургічні прогнози доктор Девід Тинг, заступник директора з інформаційних систем Масачусетського головного госпіталю.

    Система QPID виконує автоматичний пошук протоколів лікування, після чого виводить на екран результати з розрахованим червоним, жовтим або зеленим індикатором ризику.

    Big Data і обробка медичних даних

    Петабайты медичної інформації формують масиви великих даних. Всю цю інформацію можна «згодувати» суперкомп’ютера IMB Watson. Проаналізувавши дані про лікування великої кількості пацієнтів, суперкомп’ютер допомагає лікарю підібрати найкраще лікування для конкретної людини.

    Навесні 2015 року Apple і IBM анонсували спільний проект з використання великих даних в сфері охорони здоров’я. Дві корпорації працюють на єдиній платформі, яка дозволяє власникам iPhone і Apple Watch надсилати зібрані в ході використання відомості Watson Health — сервіс IBM з медичної аналітиці.

    Big Data і фармація

    Великі дані і штучний інтелект уже зараз широко застосовуються у фармацевтичному виробництві та маркетингу лекрств. Як правило, говорять про чертырех основних сферах застосування Big Data у фармації.

    1. Створення нових лікарських препаратів

    Найбільший ефект від Big Data очікується в моделюванні нових лікарських препаратів. Сьогодні в цьому напрямку працює IT-компанія Semantic Hub, яка займається розробкою сервісів для оцінки перспектив розвитку нових препаратів.

    2. Збір клінічних даних про пацієнтів

    Фармвиробники прагнуть отримати доступ до медичних даних пацієнтів і наввипередки укладають угоди з технологічними компаніями, обізнаними в галузі аналізу великих даних.

    Свіжий приклад — оголошена в лютому 2018 року угода фармхолдинга Roche. В рамках цієї угоди компанія за $2 млрд набуває все акції стартапу Flatiron Health, яка спеціалізується на зборі клінічних даних онкологічних пацієнтів.

    3. Поліпшення якості клінічних випробувань

    Використовуючи технології Big Data, компанії можуть зробити клінічні випробування більш ефективними. З декількох баз даних аналітичні системи можуть відбирати пацієнтів, які найбільш повно відповідають попереднім вимогам випробування препарату.

    Завдяки досягненням телемедицини — гаджетів і носимым пристроїв — дослідники зможуть здійснювати моніторинг добровольців в режимі реального часу.

    4. Виявлення побічних ефектів від ліків

    Великі дані також застосовуються в прогнозуванні побічних ефектів для конкретних сполук і компонентів ще до початку клінічних випробувань. Адже, коли почнуться випробування на людях, може бути занадто пізно.

    Використовуючи аналітичний метод, який включає перевірку десятків різних характеристик лікарських препаратів, що компанії можуть заощадити час, гроші і зберегти життя пацієнтів.

    Дані про реальну практику застосування препаратів збираються поза рамками традиційних рандомізованих клінічних випробувань, які сьогодні є основою тестування ліків, і інтерес до цієї сфери стрімко зростає.

    Число випробувань з аналізом великих даних за 2017-й рік перевищила 300, повідомляє агентство Reuters (з посиланням на сайт міжнародних клінічних досліджень clinicaltrials.gov).

    Критика концепції великих даних

    Буде неправильно стверджувати, що великі дані — ключ до абсолютно всім корисних знань. При витяганні з величезного масиву даних потрібної інформації виникають кілька чотири істотних труднощів.

    1. Неструктуровані дані

    Для текстової інформації можна використовувати давно розроблені алгоритми пошуку. Але як бути, якщо це запис промови чи відео? Якщо розв’язувати задачу «в лоб» — розпізнавати мову і перетворювати її в текст, обсяги даних вийдуть занадто великими.

    Як у такій лавині даних знайти корисну інформацію? Приблизно 78% медичних даних не структуровані, фільтрувати та аналізувати такі обсяги інформації занадто дорого.

    2. Велика кількість зайвої інформації

    Експерти в області великих даних вважають, що багато проектів по використанню Big Data, не тільки в медицині, закінчуються невдачею саме з-за того, що серед даних дуже багато «шуму».

    Сам збір інформації сьогодні нічого не варто: зберігання даних обходиться дешевше, ніж знищення. Але велика кількість несуттєвих інформації може призвести аналітичні системи до помилкових висновків. Наприклад, про неправдивої залежності між виникненням захворювання і зовнішніми факторами.

    3. Відсутність єдиного стандарту ведення історії хвороби

    Інформаційним компаніям необхідно створити єдиний протокол обміну медичними даними, якого поки немає. Чим більше буде доступною і стандартизованої медичної інформації з самих різних країн світу, тим точніше буде аналітичне опис хвороб і прогнози.

    4. Високий ризик викривлення інформації

    Деякі критики навіть вважають, що Big Data — один великий обман. Шквал обурення обрушився на великі дані після гучного провалу Google Flu Trends.

    Проект від Google пропустив епідемію 2013 року в США і спотворив інформацію про неї на 140%. Тоді вчені з декількох американських університетів виявили, що за останні два роки роботи аналіз частіше показував неправильні результати.

    Одна з причин появи помилок — зміна самого пошукового інструменту Google, що призвело до збирання розрізнених даних.

    Перспективи розвитку великих даних за кордоном

    Незважаючи на критику, впровадження великих даних в медичну практику в західних країнах йде прискореними темпами. Головним технологічним промотором цього процесу є повсюдний перехід на електронні медичні картки.

    Згідно з дослідженням HITECH, у США понад 94% лікарень використовує електронні медкарти. Країни Європи трохи відстають від заокеанських партнерів, але Єврокомісія випустила директиву, яка покликана докорінно змінити ситуацію.

    Передбачається, що до 2020 року європейська централізована система медичних записів стане реальністю.

    Консультанти Deloitte Centre вважають, що вже до 2020 року великі дані повністю змінять медицину: завдяки гаджетів пацієнти будуть знати про своє здоров’я практично всі, і зможуть особисто брати участь у виборі оптимального лікування.

    З допомогою великих даних і машинного навчання буде розроблена навчається, система охорони здоров’я, прогнозирующая, наприклад, реакцію конкретного пацієнта на променеву терапію.

    Перспективи розвитку великих даних в Росії

    Про успішне просування Big Data у російському охороні здоров’я говорити поки не доводиться. На минулій у вересні 2017 року конференції «Доступна медицина: час змін. Інновації, тенденції, перспективи» IT-підприємці висловлювали песимізм щодо розвитку технології.

    Учасники ринку говорили про відсутність у законодавстві РФ мотивації для приватних інвесторів вкладати кошти в обробку медичних даних.

    Заступник директора Фонду розвитку інтернет-ініціатив Іскандер Нурбеков вважає, що в підсумку вітчизняний ринок займуть іноземні IT-сервіси.

    Інші спікери звертали увагу, що можливі ризики для пацієнтів від не прораховані, і необхідно вирішити дуже багато юридичних питань. Наприклад, до цих пір не ясно, кому пред’являти претензії, якщо використання Big Data призвело до негативних для здоров’я наслідками.

    І тим не менше: існує позитивна динаміка в застосуванні Big Data в медицині як у нашій країні, і у всьому світі. Просто продовжуємо спостерігати.