Тільки позитивні новини

Молоді вчені не стали змінювати існуючі компоненти ДНК мікроорганізмів. Замість цього вони додали синтезовані. Бактерії не заперечували.
Один грам бактерій може зберігати в собі більше 900 терабайт інформації. У той час як на грам класичного комп'ютерного жорсткого диска припадає лише від одного до чотирьох гігабайт. Цим порівнянням починає розповідь про свій проект група студентів з Гонконгу, що отримала золоту медаль на престижному конкурсі.
Принцип "біошіфрованія за допомогою рекомбінації" молоді люди придумали не без допомоги старших товаришів-науковців, але більшу частину роботи з його втіленню в життя провели все ж самі.
За свій проект хлопці отримали одну із золотих медалей конкурсу з генної інженерії iGEM 2010. Його з 2004 року проводить Массачусетський технологічний інститут (MIT). Учасники змагаються в умінні надавати бактеріям нові потрібні риси, змінюючи їх ДНК.
Хтось із конкурсантів навчив мікроорганізми заращівать тріщини в бетонних конструкціях, інші – шукати нітрати в грунті, треті за допомогою синтетичної біології побороли інфекції, що викликаються як грампозитивними, так і грамнегативними бактеріями. А студенти з Китайського університету в Гонконзі (CUHK) вважали корисною функцією бактерій Escherichia coli можливість зберігання в їх геномі даних, потрібних людині.
"Бактерії не можна зламати. Відмова електрообладнання або крадіжка даних для звичайного комп'ютера – норма. А бактеріям хакерські атаки дарма. Інформація під надійним захистом", – говорить один з кураторів проекту Аллен Юй. На знімку він тримає в руках фотоапарат.
Студенти впровадили в ДНК мікроорганізму короткий текст про свою зацікавленість в конкурсі: "iGEm is very interesting".
Спочатку комп'ютерна програма перетворила вихідний текст в цифрову послідовність, використовуючи таблицю ASCII. Так букви в слові iGEM перетворилися в цифровий код: 105 71 69 77.
Далі цей код перетворили в четверичная. Як неважко здогадатися, перехід до цієї системи числення дозволяє оперувати чотирма символами, кожен з яких відповідає одному з чотирьох основ ланцюга ДНК (0 = A, 1 = T, 2 = C, 3 = G). Разом виходить, що iGEM стає "1221 0113 0111 0131" або "TCCTATTGATTTATGT". А вся фраза "iGEm is very interesting" перетворюється в послідовність з 96 пар основ у ДНК.
Розглянутий приклад – коротке речення. Китайці ж мріють про те, щоб "укладати" в колонії E. coli великі тексти, аудіо-і відеофайли. Звідси ще один щабель: алгоритм стиснення без втрат DEFLATE, який допомагає значно зменшити послідовності кодів до початку синтезу потрібного шматка ДНК.
Алгоритм дозволяє не тільки вмістити в тому ж обсязі більшу кількість інформації, але ізменшити кількість гомополімерів (полімерів з однаковими мономірні ланками) і повторюваних фрагментів коду.

Лабораторія в Гонконзі відповідала всім правилам безпеки, так що змінені бактерії не могли втекти.
Зрозуміло, що теоретично можна взяти потрібну послідовність підстав будь-якої довжини і впровадити її всередину ДНК бактерії. Однак такий підхід поки важко реалізувати. У такому разі логічно розділити отриману послідовність на фрагменти і ці шматки впровадити в геноми декількох клітин.
Для цього потрібен наступний крок – створення великої пам'яті паралельної дії (parallel storage), в якій всі елементи (окремі фрагменти) можуть бути доступні одночасно. У ній можна розташувати інформацію будь-якого розміру (тому що клітин може бути скільки завгодно).
Проблема в тому, що при цьому не отримати абракадабру, не порушити порядок частин тексту. Для цього студенти пропонують супроводити кожен фрагмент заголовком, містить інформацію про місцезнаходження власне "повідомлення", і "контрольної сумою". У результаті ми отримуємо поїзд із трьох вагонів: голова, повідомлення та контрольна сума. У такому вигляді послідовність можна вводити в ДНК мікроорганізмів.
Заголовок складається з восьми підстав, кожна їхня пара підказує, в яких зоні, регіону, області та районі було розташоване дане повідомлення.

Чотири адресні одиниці дозволяють визначити місце розташування шматка інформації в початковому коді точно так само, як і на звичайному жорсткому диску (ілюстрація CUHK).
Контрольна сума дозволяє вирішити проблему малих мутацій, які можуть відбуватися в ході зберігання інформації в клітині, а також допомагає встановити правильну послідовність фрагментів повідомлення при розшифровці (про це трохи пізніше).
Для того щоб впровадити вставку в геном бактерії, студенти скористалися стандартними процедурами. Вони витягли ДНК із клітин, за допомогою ферментів перекроїли їх, після чого повернули геноми на законні місця.

Послідовність "вагонів поїзда" (ілюстрація CUHK).
Щоб позбавити непосвячених можливості прочитати впроваджений код, китайці розробили процес біошіфрованія. Студенти використовували природний механізм сайт-специфічної рекомбінації (site-specific recombination), що здійснює перебудову послідовностей в ДНК E. coli.
Для простоти опису відзначимо лише, що вагон-повідомлення всередині кожного поїзда також поділено на частини повторами (repeated sequences або repeats) – вони показані на малюнку вище. Ці мітки дозволяють ферменту рекомбіназами міняти шматки повідомлення містами в будь-якому порядку. І навіть вчені не знають, в якій послідовності шматки в кінці кінців встануть.
Процес рекомбінації генетики включили, запустивши експресію відповідного гена. У результаті рекомбіназа переплутала частини повідомлень, і в ДНК клітин влаштувався справжнісінький шифр.

Розшифровка збережених даних проводиться в три кроки. Спочатку вчені секвеніруют геноми E. coli. Для цього краще використовувати високопродуктивні технології останнього покоління. З отриманої інформації витягується масив тих самих "потягів", кожен поділяється на "вагони".
Так як програмі-клієнту відомий ключ для підрахунку "контрольної суми", вона може визначати (перебором), в якій послідовності йшли фрагменти повідомлення спочатку, а значить, здатна його прочитати. Потім відбувається збірка всіх повідомлень в єдину послідовність за допомогою адрес.
У результаті всіх перерахованих маніпуляцій Декларація незалежності США, що складається, за підрахунками студентів, з 8074 символів, могла б вміститися всього лише в 18 клітинах E. coli. Враховуючи, що в одному грамі бактерій міститься близько 10 мільйонів мікроорганізмів, кожен фрагмент міг би мати більше 500 тисяч копій.
У ході декількох місяців лабораторних випробувань китайці встановили, що їх прототип біошіфровальной системи цілком працездатний. Вчені визначили, що втрат коду в геномах не відбувалося.
Мали місце дві мутації, але ці "порушення" можна буде обійти. У разі секвенування геномів кількох (ми пам'ятаємо про кількох копіях однієї і тієї ж інформації) незмінений варіант коду можна буде визначити простим "більшістю голосів".
Описаним методом молоді вчені отримали ту саму, заявлену на самому початку щільність упаковки інформації: один грам E. coli відповідає 450 двухтерабайтним дискам.
Ще одна вагома гідність напрацювання – довговічність зберігання будь-якої інформації. Бактерії здатні розмножуватися протягом тисячоліть! Звичайно, для цього їм треба створити хороші умови існування. По-перше, більше клітин виживе, по-друге, знизиться кількість мутацій, а значить, буде менше головного болю при розшифровці.
Комп'ютерне моделювання в іншій роботі показало, що 99% інформації збережеться навіть при зміні 15% ДНК мікроорганізмів, що відбудеться лише через тисячоліття.
Деякі бактерії, такі як Deinococcus radiodurans, наприклад, виживуть і після ядерного удару. Можливо, хтось з людей збереже інформацію в надрах цих мікроорганізмів.
І не варто турбуватися про утилізацію біологічних жорстких дисків. Китайці підкреслюють, що використовували для роботи незаразні штами кишкової палички (DH5-α). Набагато боьшей проблемою було не стільки випустити E. coli в зовнішнє середовище, скільки не внести всередину системи забруднюючі її компоненти.
Нагадаємо, що в колишніх дослідженнях в області зберігання та обробки інформації в живих організмах вченим вдавалося створити прототип біологічної обчислювальної машини і цифрову пам'ять з вірусів. Експериментували розробники і з DVD, покриваючи їх поверхню білками.
Вшивати сторонню інформацію в ДНК бактерій теж намагалися. У 2007 році група дослідників з університету Кейо (Keio University) записала в ДНК грунтової бактерії Bacillus subtilis наступний рядок "E = mc2 1905".
А трохи раніше (у 2001 році) група професора Картера Банкрофт (Carter Bancroft) з медичної школи Нью-Йоркського університету пробувала створити спосіб довгострокового зберігання даних в ДНК. Але ніхто з генетиків не тестував і не доводив початкову ідею до створення більш універсального продукту.
Студенти ж вперше довели, що можливе масове застосування такого процесу, придумали, як стиснути дані, розділити їх на частини, безпечно розподілити між клітинами (що рівносильно подолання ліміту на обсяг збережених даних).

До речі, використовувати таку технологію китайці пропонують не тільки у сфері комп'ютерної пам'яті, але і для створення штрих-кодів всередині ДНК різних організмів. Мовляв, пометим ми такою собі послідовністю генно-модифіковану пшеницю в Європі, а потім у США можна буде точно встановити, звідки привезли ті чи інші насіння.
Між іншим, таким чином можна внести не тільки інформацію про виробника, а й опис властивостей продукту або авторські права (фото CUHK).
Втім, навіть нинішні досягнення китайців не дозволяють сказати, що до створення біологічної комп'ютера рукою подати. Навряд чи в найближчі роки люди почнуть зберігати великі обсяги інформації в коробочці з бактеріями на полиці холодильника. Адже придумати послідовність дій і перевірити дієвість принципу на практиці – лише півсправи. Попереду – створення системи, яка зможе працювати поза стінами лабораторії на звичайному столі.
За матеріалами: membrana.ru
Tweet
РОЗРОБКА ВЕБ-САЙТІВ, ПРОСУВАННЯ В ІНТЕРНЕТІ
Залиште коментар