Телефон: 8-800-350-22-65
WhatsApp: 8-800-350-22-65
Telegram: sibac
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)

Статья опубликована в рамках: Научного журнала «Студенческий» № 27(155)

Рубрика журнала: Биология

Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2

Библиографическое описание:
Косицкий С.С., Кожевникова Д.В. ДНК: ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ ДЛЯ ХРАНЕНИЯ ДАННЫХ // Студенческий: электрон. научн. журн. 2021. № 27(155). URL: https://sibac.info/journal/student/155/222631 (дата обращения: 30.11.2024).

ДНК: ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ ДЛЯ ХРАНЕНИЯ ДАННЫХ

Косицкий Сергей Сергеевич

студент, Ульяновского государственного Технического университета,

РФ, г. Ульяновск

Кожевникова Дарья Валериевна

студент, Ульяновского государственного Технического университета,

РФ, г. Ульяновск

В мире, наводненном данными, выяснение того, где и как хранить их эффективно и недорого, становится все большей проблемой с каждым днем. Одно из самых экзотических решений может оказаться одним из лучших: архивирование информации в молекулах ДНК.

Преобладающий метод длительного холодного хранения, который датируется 1950-ми годами, записывает данные на катушки магнитной ленты размером с пиццу. Для сравнения, хранение ДНК потенциально менее затратно, более энергоэффективно и долговечно. Исследования показывают, что ДНК, правильно инкапсулированная солью, остается стабильной в течение десятилетий при комнатной температуре и должна прослужить гораздо дольше в контролируемом окружении центра обработки данных. ДНК не требует обслуживания, а файлы, хранящиеся в ней, легко копируются за ничтожные деньги.

Более того, ДНК может архивировать ошеломляющее количество информации в почти немыслимо малом объеме. Подумайте вот о чем: человечество будет генерировать примерно 33 зеттабайта данных к 2025 году—это 3,3 с последующим 22 нулями. Хранилище ДНК может сжать всю эту информацию в шарик для пинг-понга, с запасом места. 74 миллиона миллионов байт информации в Библиотеке Конгресса можно было бы втиснуть в архив ДНК размером с маковое зернышко—в 6000 раз больше. Разделите семя пополам, и вы сможете хранить все данные Facebook.

Научная фантастика? Едва. Технология хранения ДНК существует и сегодня, но для того, чтобы сделать ее жизнеспособной, исследователи должны устранить несколько сложных технологических препятствий вокруг интеграции различных технологий. В рамках крупного сотрудничества для выполнения этой работы наша команда в Лос-Аламосской национальной лаборатории разработала ключевую технологию для молекулярного хранения.  ADS Codex является ключевой частью программы Intelligence Advanced Research Projects Activity (IARPA) Molecular Information Storage (MIST). MIST стремится обеспечить более дешевое, крупное и долговечное хранилище для операций с большими данными в государственном и частном секторах с краткосрочной целью записать один терабайт-триллион байт-и прочитать 10 терабайт в течение 24 часов по цене 1000 долларов.

ОТ КОМПЬЮТЕРНОГО КОДА К ГЕНЕТИЧЕСКОМУ

Когда большинство людей думает о ДНК, они думают о жизни, а не о компьютерах. Но сама ДНК-это четырехбуквенный код для передачи информации об организме. Молекулы ДНК состоят из четырех типов оснований, или нуклеотидов, каждый из которых обозначается буквой: аденин (А), тимин (Т), гуанин (Г) и цитозин (С). Они являются основой всего кода ДНК, обеспечивая руководство по созданию каждого живого существа на земле.

Синтез ДНК-достаточно хорошо изученная технология, широко используемая в медицине, фармацевтике и разработке биотоплива. Эта техника организует основания в различные последовательности, обозначаемые специфическими последовательностями А, С, G и Т. Эти основания оборачиваются в скрученную цепь друг вокруг друга—знакомую двойную спираль—и образуют молекулу. Расположение этих букв в последовательности создает код, который говорит организму, как образоваться.

Полный набор молекул ДНК составляет геном—схему вашего тела. Синтезируя молекулы ДНК—делая их с нуля—исследователи обнаружили, что они могут определять или писать длинные строки букв A, C, G и T, а затем считывать эти последовательности обратно. Процесс аналогичен тому, как компьютер хранит двоичную информацию. Отсюда был короткий концептуальный шаг к кодированию двоичного компьютерного файла в молекулу

Было доказано, что этот метод работает, но чтение и запись закодированных в ДНК файлов в настоящее время занимает много времени. Добавление одного основания к ДНК занимает примерно одну секунду. Написание архивного файла с такой скоростью может занять десятилетия, но исследования развивают более быстрые методы, в том числе массово параллельные операции, которые записывают на многие молекулы одновременно.

ПРИ ПЕРЕВОДЕ НИЧЕГО НЕ ТЕРЯЕТСЯ

ADS Codex точно рассказывает, как перевести нули и единицы в последовательности из четырех буквенных комбинаций A, C, G и T. Кодекс также обрабатывает декодирование обратно в двоичный код. ДНК можно синтезировать несколькими способами, и ADS Codex может вместить их все.

К сожалению, по сравнению с традиционными цифровыми системами частота ошибок при записи в молекулярное хранилище с синтезом ДНК очень высока. Эти ошибки возникают из другого источника, чем в цифровом мире, что делает их более сложными для исправления. На цифровом жестком диске двоичные ошибки возникают, когда ноль превращается в единицу или наоборот. С ДНК проблемы возникают из-за ошибок вставки и удаления. Например, вы можете писать A-C-G-T, но иногда вы пытаетесь написать A, и ничего не появляется, поэтому последовательность букв сдвигается влево или набирает AAA.

ИНТЕЛЛЕКТУАЛЬНОЕ МАСШТАБИРОВАНИЕ

Мы завершили версию 1.0 ADS Codex, и в конце этого года мы планируем использовать ее для оценки систем хранения и поиска, разработанных другими командами MIST. Эта работа хорошо вписывается в историю Лос-Аламоса как пионера новых разработок в области вычислительной техники в рамках нашей миссии национальной безопасности. С 1940-х годов в результате этих вычислительных достижений мы накопили некоторые из самых старых и крупнейших хранилищ цифровых данных. Она все еще имеет огромную ценность. Поскольку мы храним данные вечно, мы долгое время были на острие копья, когда дело доходит до поиска решения для холодного хранения, но мы не одни.

Все мировые данные все ваши цифровые фотографии и твиты; все записи мирового финансового сектора; все эти спутниковые снимки пахотных земель, передвижения войск и таяния ледников; все симуляции, лежащие в основе столь значительной части современной науки; и многое другое—должны куда-то идти. “Облако” - это вовсе не облако. Это цифровые центры обработки данных на огромных складах, потребляющие огромное количество электроэнергии для хранения (и сохранения прохлады) триллионов миллионов байт. Затратив миллиарды долларов на строительство, питание и эксплуатацию, эти центры обработки данных могут бороться за то, чтобы оставаться жизнеспособными, поскольку потребность в хранении данных продолжает расти экспоненциально.

ДНК показывает большие перспективы для удовлетворения ненасытного аппетита мира к хранению данных. Технология требует новых инструментов и новых способов применения привычных. Но не удивляйтесь, если однажды самые ценные архивы мира найдут новый дом в коллекции молекул размером с маковое семя.

 

Список литературы:

  1. Дубинин, Н.П. Генетика, сегодня и завтра / Н.П. Дубинин. -М.: Советская Россия, 2000 г.

Оставить комментарий

Форма обратной связи о взаимодействии с сайтом
CAPTCHA
Этот вопрос задается для того, чтобы выяснить, являетесь ли Вы человеком или представляете из себя автоматическую спам-рассылку.