Microsoft записала 200 МБ данных в молекулу ДНК размером с крупинку соли
Команда Microsoft записала 200 МБ данных в ДНК размером с крупинку соли. Исследования в этой области крайне перспективны, так как информация, записанная таким способом, занимает очень мало места и может храниться тысячи лет.
200 ГБ в песчинке
Исследовательская группа Microsoft при участии ученых из Вашингтонского университета поместила в цепочку ДНК в цифровом виде видеоклип This Too Shall Pass группы OK Go, Всеобщую декларацию прав человека на более 100 языках, 100 книг из общественной библиотеки «Гутенберг» и генетический банк семян Svalbard Global Seed Vault — всего около 200 МБ данных.
Указанные данные были записаны посредством процесса под названием синтезирование ДНК.
ДНК (дезоксирибонуклеиновая кислота) — это длинная молекула, которая содержит команды для роста, развития, функционирования и репродукции любого живого организма на Земле.
Дезоксирибонуклеиновая кислоти (ДНК) — макромолекула (одна из трёх основных, две другие — РНК и белки), обеспечивающая хранение, передачу из поколения в поколение и реализацию генетической программы развития и функционирования живых организмов. ДНК содержит информацию о структуре различных видов РНК и белков.
В клетках эукариот (животных, растений и грибов) ДНК находится в ядре клетки в составе хромосом, а также в некоторых клеточных органоидах (митохондриях и пластидах).
В клетках прокариотических организмов (бактерий и архей) кольцевая или линейная молекула ДНК, так называемый нуклеоид, прикреплена изнутри к клеточной мембране. У них и у низших эукариот (например, дрожжей) встречаются также небольшие автономные, преимущественно кольцевые молекулы ДНК, называемые плазмидами. Кроме того, одно- или двухцепочечные молекулы ДНК могут образовывать геном ДНК-содержащих вирусов.
С химической точки зрения ДНК — это длинная полимерная молекула, состоящая из повторяющихся блоков — нуклеотидов. Каждый нуклеотид состоит из азотистого основания, сахара (дезоксирибозы) и фосфатной группы. Связи между нуклеотидами в цепи образуются за счёт дезоксирибозы и фосфатной группы (фосфодиэфирные связи).
В подавляющем большинстве случаев (кроме некоторых вирусов, содержащих одноцепочечную ДНК) макромолекула ДНК состоит из двух цепей, ориентированных азотистыми основаниями друг к другу.
Эта двухцепочечная молекула закручена по винтовой линии. В целом структура молекулы ДНК получила традиционное, но ошибочное название «двойной спирали», на самом же деле она является «двойным винтом». Винтовая линия может быть правой (A- и B- формы ДНК) или левой (Z-форма ДНК).
В ДНК встречается четыре вида азотистых оснований (аденин, гуанин, тимин и цитозин). Азотистые основания одной из цепей соединены с азотистыми основаниями другой цепи водородными связями согласно принципу комплементарности: аденин соединяется только с тимином, гуанин — только с цитозином.
Последовательность нуклеотидов позволяет «кодировать» информацию о различных типах РНК, наиболее важными из которых являются информационные, или матричные (мРНК), рибосомальные (рРНК) и транспортные (тРНК). Все эти типы РНК синтезируются на матрице ДНК за счёт копирования последовательности ДНК в последовательность РНК, синтезируемой в процессе транскрипции, и принимают участие в биосинтезе белков (процессе трансляции). Помимо кодирующих последовательностей, ДНК клеток содержит последовательности, выполняющие регуляторные и структурные функции. Кроме того, в геноме эукариот часто встречаются участки, принадлежащие «генетическим паразитам», например, транспозонам.
Расшифровка структуры ДНК (1953 г.) стала одним из поворотных моментов в истории биологии.
За выдающийся вклад в это открытие Фрэнсису Крику, Джеймсу Уотсону и Морису Уилкинсу была присуждена Нобелевская премия по физиологии или медицине 1962 г. Розалинд Франклин, которая получила рентгенограммы, без которых Уотсон и Крик не имели бы возможность сделать выводы о структуре ДНК, умерла в 1958 г. от рака (Нобелевскую премию не дают посмертно).
«Это потрясающее хранилище данных, в котором хранится все относительно того, как работает живая система, — пояснил руководитель проекта от Вашингтонского университета Луис Энрике Цезе (Luis Henrique Ceze). — Мы просто взяли этот тип хранилища и поместили в него видео, изображения и документы».
Кстати, недавно сообщалось о том, что Учёные разработали наноструктурированные стеклянные 5D-диски, которые смогут хранить цифровые данные в течение миллиардов лет
Принцип записи
Цифровые данные представляют собой последовательность единиц и нулей. Исследователи из Microsoft и Вашингтонского университета придумали, как данные закодировать в молекуле ДНК (в биологии этот процесс называется синтезированием) и как их оттуда затем извлечь (секвенирование).
Для этого они задали, как единицы и нули соответствуют четырем видам азотистых оснований в ДНК. Затем они обратились к компании Twist Bioscience, специализирующейся на генетике и производстве лекарств. Она синтезировала молекулу ДНК с помощью представленного алгоритма.
Помещенная в пробирку, молекула получилась похожей на крупинку соли. Она в разы меньше по сравнению с заточенным концом грифеля карандаша.
Перспективы
Команда Microsoft — далеко не единственная, кто занимается исследованиями в области синтезирования и секвенирования цифровых данных. За последний год ученым удалось в тысячу раз увеличить плотность их записи. Интерес к этой области обусловлен двумя причинами.
Первая причина — эти технологии позволяют создавать хранилища с крайне высокой плотностью записи данных. В молекулу размером с крупицу соли вмещается 200 МБ, в молекулы объемом с кубик сахара-рафинада способны поместиться все данные, которые хранятся в одном дата-центре, а в объем размером с коробку под обувь — все данные, которые находятся в интернете на сегодняшний день.
Вторая причина — данные, записанные в ДНК, можно будет прочесть через тысячи лет. Во-первых, ДНК — это такой тип хранилища, который не меняется. Он будет актуален всегда. Не нужно будет добиваться совместимости стандартов, как это происходит обычными технологиями хранения данных на магнитных, оптических и прочих накопителях. Во-вторых, ДНК очень долго хранится не разрушаясь — тысячи лет.
По материалам: CNews и Википедии
См. также:
Оставить комментарий