DNA Ako Flash Disk: Prečo Zapisovať Digitálne údaje Do Genómu - Alternatívny Pohľad

Obsah:

DNA Ako Flash Disk: Prečo Zapisovať Digitálne údaje Do Genómu - Alternatívny Pohľad
DNA Ako Flash Disk: Prečo Zapisovať Digitálne údaje Do Genómu - Alternatívny Pohľad

Video: DNA Ako Flash Disk: Prečo Zapisovať Digitálne údaje Do Genómu - Alternatívny Pohľad

Video: DNA Ako Flash Disk: Prečo Zapisovať Digitálne údaje Do Genómu - Alternatívny Pohľad
Video: Jak si na flash disk stáhnout film 2024, Smieť
Anonim

Nárast objemu digitálnych informácií vedie vedcov k tomu, aby hľadali kompaktnejšie spôsoby ich záznamu a uchovávania. A čo by mohlo byť kompaktnejšie ako DNA? RIA Novosti spolu s odborníkom zistili, ako kódovať slová nukleotidmi a koľko údajov jedna molekula obsahuje.

dôvody kódy

DNA je sekvencia nukleotidov. Existujú iba štyri z nich: adenín, guanín, tymín, cytozín. Na kódovanie informácií je každej z nich pridelený číselný kód. Napríklad tymín - 0, guanín - 1, adenín - 2, cytozín - 3. Kódovanie začína skutočnosťou, že všetky písmená, čísla a obrázky sa prevádzajú na binárny kód, to znamená sekvenciu núl a jednotiek, a už sa prevádzajú na sekvenciu nukleotidov, to znamená kvartérny kód.

Pred zakódovaním údajov do DNA je potrebné ich preložiť do digitálneho kódu / ilustrácie od RIA Novosti. Alina Polyanina
Pred zakódovaním údajov do DNA je potrebné ich preložiť do digitálneho kódu / ilustrácie od RIA Novosti. Alina Polyanina

Pred zakódovaním údajov do DNA je potrebné ich preložiť do digitálneho kódu / ilustrácie od RIA Novosti. Alina Polyanina.

Iba tri nukleotidy sa môžu použiť na zostavenie kódu (ternárny kód) a štvrtým je rozdelenie sekvencií na časti. Existuje možnosť s konštrukciou báz vo forme binárneho kódu, keď dve z nich zodpovedajú nule a dve zodpovedajú jednému.

Na čítanie sa používa niekoľko techník. Jedným z najbežnejších je to, že reťazec molekuly DNA sa kopíruje s použitím báz, z ktorých každá má farebnú značku. Potom veľmi citlivý detektor prečíta údaje a počítač použije farby na rekonštrukciu nukleotidovej sekvencie.

„Molekula DNA je veľmi priestranná. Dokonca aj v baktériách zvyčajne obsahuje asi milión báz a u ľudí až tri miliardy. To znamená, že každá ľudská bunka nesie objem informácií porovnateľný s kapacitou jednotky flash. A máme také bilióny takýchto buniek. V DNA je možné zaznamenať veľké množstvo údajov, ale písanie a čítanie z takéhoto média je stále príliš pomalé a nákladné, “hovorí Alexander Panchin, Ph. D., vedecký pracovník Ústavu pre problémy s prenosom informácií pomenovaný po A. A. Charkevichovi, Ruská akadémia vied.

Propagačné video:

Hustota záznamu rastie

V júni 1999 časopis Nature publikoval článok amerických vedcov, ktorí vyvinuli techniku zasielania tajných správ pomocou DNA. Syntetizovali molekulu začlenením nukleotidovej sekvencie vytvorenej pomocou kvartérneho kódu. Tajná DNA v zmesi bola odoslaná do iného laboratória. Jej zamestnanci pomocou špeciálnych chemických kľúčov našli požadovanú molekulu a extrahovali z nej informácie.

„Vo všeobecnosti existujú dva prístupy k zaznamenávaniu údajov o DNA. Prvý je, keď syntetizujete úplne novú DNA pomocou chemického syntetizátora. Na príkaz počítača sa nukleotidy pridávajú do roztoku v určitom poradí a požadovaný reťazec báz postupne „rastie“. V druhom prípade sú dáta zakódované v už existujúcej DNA organizmu, “vysvetľuje Panchin.

V máji 2010 skupina Craig Venter, ktorá prvýkrát zmapovala ľudský genóm, vydala dokument o vytvorení umelej baktérie. Za základ vzali bakteriálnu bunku purifikovanú z genómu a umiestnili tam vytvorenú sekvenciu báz. Výsledkom je nová, celkom aktívna a živá baktéria, ktorá sa líši od obvyklej iba tým, že jej DNA bola vytvorená ručne. Tím okrem toho demonštroval zmysel pre krásu tak, že napísal svoje mená a citáty od klasikov pomocou kvartérneho kódu v bakteriálnej DNA.

V roku 2012 skupina vedená molekulárnym biológom Georgeom Churchom zaujala zásadnejší prístup a DNA kódovala 52 000-slovnú knihu Regenesis: Ako syntetická biológia znovu objaví prírodu a seba, niekoľko obrázkov a jeden program Java. Používali binárny kód. Celkové množstvo údajov bolo 658 kilobajtov. Zistilo sa, že hustota informácií je takmer 1018 bajtov na gram molekúl. Na porovnanie pevný disk s hmotnosťou 1012 bajtov váži približne sto gramov. Hlavnou nevýhodou tejto metódy je nestabilita zaznamenaných informácií.

„Molekula DNA má tendenciu mutovať, čo znižuje spoľahlivosť ukladania údajov. Najmä ak je nosičom DNA živá bunka schopná delenia: keď sa duplikuje DNA, obzvlášť často sa vyskytujú chyby. Spoľahlivosť ukladania údajov sa zvýši, ak máte tisíce kópií tej istej správy. Alebo len uložte DNA, povedzme, do mrazničky. Pri nízkych teplotách je schopnosť molekuly mutovať významne znížená, “vysvetľuje odborník.

Okrem toho sa informácie pri čítaní niekedy stratia. Chyby môžu byť chemickej povahy, ak je k prvku pripojená nesprávna báza alebo je čisto vypočítaná, to znamená v závislosti od počítača.

Drahé, spoľahlivé

V marci 2017 časopis Science uverejnil článok amerických vedcov, ktorým sa podarilo napísať 2 * 1017 bajtov na gram DNA. Biológovia zdôrazňujú, že nestratili jediný bajt. Jednoducho povedané, to, čo sme zaznamenali, je to, čo sme dostali pri východe.

Pre bežného používateľa ešte nie je k dispozícii „genetická jednotka flash“, pretože ukladanie informácií na nej je veľmi nákladné a rýchlosť čítania a zápisu je nízka. Vedci odhadujú, že čítanie iba jedného megabajtu vyžaduje asi tri a pol tisíc dolárov a niekoľko hodín času.

Medzi nesporné výhody záznamu informácií o DNA patrí obrovská hustota údajov pri ukladaní, ako aj stabilita nosiča - iba pri nízkych teplotách.