Статья опубликована в рамках: Научного журнала «Студенческий» № 15(101)
Рубрика журнала: Технические науки
Секция: Моделирование
Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3
НЕЙРОСЕТЕВАЯ ДИАГНОСТИКА ОНКОЛОГИЧЕСКИХ ЗАБОЛЕВАНИЙ С ИСПОЛЬЗОВАНИЕМ НЕЙРОННЫХ СЕТЕЙ
В эпоху изобилия высокопроизводительных биологических технологий биомедицинские исследователи исследуют более всеобъемлющие аспекты заболеваний с все более тонким разрешением. Это приводит не только к большому объему данных, но и к данным с сотнями, если не тысячами измерений. Многомерный анализ является основой статистических инструментов в анализе биомедицинских данных. Это касается связывания матриц данных из n строк по P столбцам со строками, представляющими образцы или пациентов и атрибуты столбцов, с определенными переменными ответа или результата. Объединяющей целью различных типов многомерных данных, получаемых в последние годы, является понимание биологических процессов, особенно процессов, связанных с возникновением заболеваний или управлением ими.
Некоторые заболевания полностью обратимы и могут быть эффективно излечены. Более того, некоторые заболевания, требующие надлежащего лечения, были практически уничтожены. Рак, однако, по сей день остается самым непредсказуемым и трудноизлечимым заболеванием. По самой своей природе у рака только одна цель: размножаться. Ведь рак – это нерегулируемый рост клеток, которые не в состоянии позаботиться о том, чтобы остановить рост. Мы называем «рак» потому, что все они обладают фундаментальным общим свойством: аномальным делением клеток [1]. Нормальные клетки проходят через цикл деления, старения, а затем отбора для смерти. Раковые клетки способны обойти этот нормальный цикл и избежать распознавания, которое должно быть устранено. При наличии достаточного времени и нашей неспособности обнаружить заболевание, группы клеток могут вырасти до размеров, которые вызовут дискомфорт или другие симптомы.
Наследственная генетика, очевидно, не единственный источник аномалий в клетках. Люди не живут в стерильном мире, лишенном воздействия окружающей среды или патогенов. Люди должны работать, а рабочая среда может быть опасной. Опасность может прийти в виде радиации, химических веществ. Наконец, человек социален. Он нашел определенные привычки, которые ему нравятся, потому что они либо расслабляют его, либо освобождают от запретов. Такие привычки, включая курение и употребление алкоголя, могут оказывать огромное влияние на генетический состав клеток.
Каждый третий человек при жизни заболевает раком, а каждый пятый умирает от этой болезни. Некоторые виды рака остро проявляются в чрезвычайной ситуациях с такими осложнениями, как повышение внутричерепное давление и компрессия спинного мозга [2]. Важно, чтобы лечение было надлежащим и оперативным, чтобы спасти жизнь.
Лечение рака находится в поиске "умных" вариантов [3]. Успешное лечение рака требует создания методов лечения, которые могут выполнять три основные задачи: искать рак, распознавать и убивать его. С помощью Deductor по предоставленным данным можно смоделировать онкологические заболевания.
Для анализа выбраны данные, предоставленные Республиканским онкологическим научным центром и социальной защитой населения республики Таджикистан за 2010-2014 года. Набор данных содержит следующие переменные:
- вид рака;
- пол пациента;
- симптомы;
- причина заболевания;
- возраст пациента;
- анализ крови при заболевании;
- диагностика;
- класс;
- стадия;
- лечение;
- семья;
- место жительства;
- помогло ли лечение?
Исходные данные кодировались заранее и представляют собой текстовый файл. Для решения задачи в Deductor cначала необходимо импортировать файл с исходными данными. Загруженные данные необходимо подготовить к решению задачи путем предобработки. В отчете обнаружены три типа проблем качества: пропуски (1поле), выбросы и экстремальные значения в одном поле. В программе предусмотрен специальный узел для обработки пропусков (который может, как читать настройки, сделанные в узле «Качество данных», так и быть самостоятельным со своими настройками), содержащий несколько методов для обработки полей.
С помощью нейронной сети был получен один из лучших результатов, так как таблица сопряженности показало 95% верно классифицированных данных и всего 5% неверно классифицированных.
Рисунок 1. Таблица сопряженности
С помощью кластеризации решалась задача разбиения на группы видов рака. В результате алгоритм разбил Виды рака на пять кластеров с разной поддержкой и разной значимостью свойств. Четвертый кластер собрал в себя максимальное количество людей, которым не помогло лечение. Наиболее ярко выраженными кластерами по заданным свойствам являются нулевой и первый кластеры. Они максимально отличаются от остальных рассматриваемых групп значениями свойств, и минимальной поддержкой.
Для того чтобы определить в каких областях больше всего больных раком воспользовались картами Кохонена. Анализ проводили по карте Место жительство, чтобы увидеть, в каких областях больше всего прогрессирует рак.
Рисунок 2. Карты Кохонена
Из рисунка (2) можно сделать вывод, что на первом месте стоит Горно – Бадахшанская область (420 - заболевших раком), на втором месте Согдийская область (312 – заболевших раком), третье место Хатлонская область (245 - заболевших раком), а на четвертом месте Центральная область (123 - заболевших раком).
Развитие онкологических заболеваний невозможно без постановки экспериментов, проведение которых на человеке недопустимо. Это можно реализовать с помощью моделирования, где каждая модель адекватна опухолям человека. Учитывая особенности моделей, полученные на них данные, можно переносить в клинику, где они подвергаются корректировке или отвергаются.
Список литературы:
- Сиддхартха Мукерджи. Царь всех болезней. Биография рака: Москва, 2013.
- ВершининаС.Ф., Потявина Е.В. Онкологические заболевания. –– СПб.: Питер, 2001.
- П.В. Глыбочко, Т.Н. Попова и др. Учебное пособие. Онкология: Москва, издательский центр «Академия», 2008. ––400 с.
Оставить комментарий