Учёные удвоили плотность записи данных на ДНК — более 400 тыс. Тбайт в одном грамме

За миллиарды лет эволюции биологической жизни на Земле в живых организмах выработался механизм записи для передачи генетической информации из одного поколения в последующие. Это формирование нитей ДНК в виде чередования пар комбинаций из четырёх азотистых оснований: аденина (A), гуанина (G), цитозина (C) и тимина (T). Четыре единицы кодирования лучше двух (0 и 1), но это не предел, сказали учёные и синтезировали ещё семь органических соединений.

Источник изображения: Depositphotos

Источник изображения: Depositphotos

 

Расширение «алфавита» для кодирования данных в ДНК с 4 до 11 символов позволит как минимум удвоить и без того невероятную ёмкость подобных методов хранения информации. Такой подход, кстати, также повысит скорость записи данных в последовательности ДНК, что сегодня считается серьёзным тормозом для работ в этом направлении. Также необходимо понимать, что современные методы секвенирования ДНК не смогут определять синтезированные азотистые основания. Для их чтения необходимы новые инструменты и реакции. Но это всё решаемые проблемы, уверены исследователи из Университета Иллинойса в Урбан-Шампейн.

Для расшифровки ДНК её нить проходит через нанопору в специально разработанном белке, который может обнаружить отдельные азотистые основания независимо от того, являются ли они естественными или синтетическими. Затем алгоритмы машинного обучения декодируют хранящуюся внутри информацию. Да, без ИИ в этом вопросе не обойтись, настолько сложные процессы кодирования и дешифровки. В будущем, по мере развития технологии, всё будет намного проще.

Сегодня с учётом использования для кодирования данных только четырёх базовых азотистых оснований в одном грамме ДНК может храниться до 215 Пбайт данных. Одиннадцать оснований удвоят эту плотность, и это не предел.

«Мы попробовали 77 различных комбинаций из 11 азотистых оснований, и наш метод смог отлично различить каждое из них, — сказал Чао Пан (Chao Pan), соавтор исследования— Механизм глубокого обучения, используемый в нашем методе для идентификации различных нуклеотидов, является универсальным, что позволяет распространить наш подход на многие другие приложения».

 

Источник:   NewAtlas

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Переводчик »