Több milliárd éve használjuk a jövő adathordozóit

Több milliárd éve használjuk a jövő adathordozóit

Gyakran hallani, hogy a mai mobiltelefonokban sokszorta erősebb komputer dolgozik, mint az, ami az Apollo-11 űrhajót felvitte a Holdra. A Facebookon emberek milliói osztják meg ismerőseikkel az ötven-hatvan évvel ezelőtti, szekrénnyi adattároló eszközökről készült képeket, amelyeken egy mai mobilos fotó sem férne el. Ha azonban azt hisszük, hogy a mai adattárolási sűrűség a csúcs, készüljünk fel, hogy néhány éven belül leesik az állunk. A DNS-alapú számítástechnika ugyanis mindent megváltoztat majd.

Zettabájt. E kifejezést még az informatikusoknak is tanulniuk kell, mert eddig a gyakorlatban nem találkozhattak vele. A zetta előtag a tíz 21. hatványára utal (tehát ha ki akarnánk írni ezt a számot, akkor az egyest 21 nulla követné). Ennyi bájt volt tavaly a világ internetes adatforgalma, a Samsung mérnökei szerint. A jelenleg emberi pénzért kapható legnagyobb külső merevlemezek általában egy terrabájtosak. Ez ezer gigabájtnak felel meg, tehát rengeteg (természetesen jogtiszta) film, zene, fotók elfér rajta, és egy átlagos felhasználó számára gyakran egy életre elég. Egy zettabájt a terrabájt milliárdszorosa.

Hogy mi a csudára kell ennyi adatot továbbítania az emberiségnek? Nos az internetes sávszélességet általában nem életfontosságú dolgokra fordítjuk. Hatalmas lökést adott az internetes forgalomnak a mobiltelefonok általános elterjedése. Míg korábban általában egy internetezésre alkalmas számítógép volt egy család birtokában, addig ma már mindenkinek van mobilja, sok családban több számítógép, okos tévé, tablet is üzemel. Ezeken gyakran nézünk nagy felbontású filmeket. Az egyik legnépszerűbb (és egy ideje Magyarországról is minden csalafintaság nélkül elérhető) ilyen filmszolgáltató a Netflix. Miközben a Netflixen nézünk filmeket, szórakozásunk a kép- és hangminőségtől függően 0,7-7 gigabájt adatforgalmat generál óránként.

Ezt a mérhetetlenül sok adatot tárolni kell valahol. Emlékszem, úgy tíz-tizenkét évvel ezelőtt volt egy konferencia, ahol az egyik legtekintélyesebb magyar informatikaprofesszor, miután befejezte diavetítéses előadását, áhítattal emelte meg a nyakában lévő pendrive-ot (amelyet csak magyarul hívnak pendrive-nak, valamilyen rejtélyes okból). És elmondta, hogy ha valaki kéri, oda tudja adni a diákat, hiszen azok itt vannak – innentől lassan, egyáltalán nem leplezett dicsekvéssel ejtette ki a szavakat – „ezen az egy gigabájtos pendrive-on”. Ma pedig már kezdenek elérhető árú egy-két terrabájtos (noha kissé bumfordi) pendrive-okat is piacra dobni.

De ha csupán a világ tavalyi adatforgalmát (ami eltörpül a Föld összes, korábban keletkezett adatmennyiségéhez képest), tehát egy zettabájtot akarnánk „egyterrás” pebrive-okon tárolni, még az is 136 ezer tonna súlyú lenne (alapul véve a Kingston 136 grammos súlyú, egy terrabájtos pendrive-ját). E kissé hosszú bevezető ahhoz kellet, hogy reálisan fel tudjuk mérni, hogy mekkora elképzelhetetlen technológiai ugrást jelent a napjainkban valósággá váló DNS-alapú adattárolás. Ha DNS-be kódoljuk ugyanis adatainkat, a néhány napja nyilvánosságra hozott (még korántsem az elképzelhető legjobb) eredmények szerint egyetlen gramm(!) örökítő anyagban 215 petabájt (215 ezer terrabájt) fér el, írja a The Atlantic. Így a világ összes, tavaly továbbított adata kevesebb mint öt kiló DNS-t igényelne.

Ha azt hinnénk, hogy ez csak scifi (mint a Keanu Reeves főszereplésével készült Johnny Mnemonic című film, ahol a főhős afféle adatcsempész, akinek egész könyvtárak állományát töltik föl az agyába épített komputerbe), nagyon tévednénk. A New York-i Genome Center nevű kutatóintézet és a Columbia Egyetem tudósai épp most jelentették a Science folyóiratban, hogy egy rövidke génszakaszban sikerült kódolniuk egy filmet, egy egész operációs rendszert, egy fényképet, egy tudományos szakcikket, egy komputervírust („vicces ötletnek tűnt” – nyilatkozta az egyik kutató) és egy, az Amazon internetes áruházban felhasználható ötven dolláros ajándékutalványt (hiszen mindenki örül az ajándéknak). Utóbbi kódját valaki már meg is fejtette az interneten közzétett szekvencia alapján, és már el is költötte.

Hírdetés

De persze a számítógépes adattárolás nem csupán a fájlok hordozóra mentéséről szól, hiszen mindannyiunk ismeri azt a frusztrációt, amikor egy memóriakártya vagy cédé olvashatatlanná válik. Tehát vissza is kell tudni nyerni a lementett adatokat. Nos a New York-i tudósok tökéletesen, egyetlen hiba nélkül el tudták olvasni a tárolt információt. A szimulációk szerint pedig nem egyszer lehet károsodás nélkül visszanyerni az adatokat, hanem egybilliárdszor (az egyes után 15 nulla következik), lényegében bármennyiszer.

Persze abban semmi új nincs, hogy a dezoxi-ribonukleinsavban adatot lehet tárolni, hiszen ezt csinálja a földön mindenki úgy 3,5 milliárd éve. Az örökítőanyag feladata ugyanis a szülők tulajdonságainak átruházása az utódokra. E jellegeket nem fizikai valójukban tartalmazza a DNS, hanem csak az információ olvasható ki belőle, amelynek alapján az utódsejt le tudja gyártani a szükséges fehérjéket saját anyagainak szintetizálásához. A DNS tehát egy kipróbált és bizonyított adattároló technológia, amelynek előnyei korántsem érnek véget ott, hogy rendkívül kis helyet foglal, mégis hatalmas mennyiségű információt raktározhat. Gondoljunk csak a Szibériában mostanában kiolvadó mamutokra, amelyekből elemezhető örökítőanyagot nyertek ki. Amíg a DNS molekulát hidegben, szárazon és sötétben tartjuk, potenciálisan sok évezredig is megőrzik a bennük tárolt adatokat.

És sosem fog kimenni a divatból. Ki emlékszik már arra, hogy egykoron a Commodore-ra írt játékokat magnókazettára rögzítették. Egyáltalán ki emlékszik a magnókazettákra? A flopira? A VHS-re? A bakelitlemezre? Sőt a CD-re és a DVD-re? Mind elavulttá váltak, még ha ott is porosodnak a szekrény aljában, legtöbbjükhöz már nem lehet lejátszót kapni, magyarul mint adattárolók, használhatatlanná váltak. A DNS-sel ez a veszély nem fenyeget, minthogy az adattárolás most tesztelt technikája alapvetően megegyezik azzal a módszerrel, amellyel a kutatók már jó ideje rutinszerűen elemzik és újraépítik a kettőshélix-alakú molekulát építőegységeiből, az úgynevezett nukleotidokból. Minthogy a mi génjeink vizsgálatához is e technikára van szükség, és az emberi ésszel elképzelhetetlen, hogy a genetikusok egyszer majd felhagynak a gének vizsgálatával, és lehúzzák tanszékeiken a rolót, biztosak lehetünk benne, hogy amíg egyáltalán szükség van bármiféle adat tárolására, addig az ehhez szükséges eszközök és tudás is rendelkezésre fog állni.

Ha most úgy gondolják, hogy mindez túl szép, hogy igaz legyen, akkor némileg igazuk van. Ugyanis a DNS-adattárolásnak vannak buktatói (méghozzá elég nagyok). A molekuláris biológiai laborokban általában úgy határozzák meg (idegen szóval: szekvenálják) a DNS bázissorrendjét, hogy rövid szakaszokra törik, majd felszaporítják a láncokat, hogy sokkal több mintát tudjanak elemezni. Korábban ugyanezzel a technikával igyekeztek adatot tárolni az örökítőanyagban, de ez az adatvesztés nagy veszélyével járt. A most megjelent Science-tanulmány azonban, úgy tűnik, át tudta hidalni ezt a problémát, ezzel áttörést ért el.

És itt kerül elő újra a Netflix, amely a jelenkori netes adatforgalom jelentős részéért felelős. A kutatók ugyanis éppen a filmstreamelő szolgáltatók által használt úgynevezett szökőkút kódolásból vették az ötletet. (A streamelés azt jelenti, hogy a filmeket folyamatosan, kis csomagokban továbbítják, így a lejátszásukat azonnal el lehet kezdeni, még akkor is, ha még nem érkezett meg az egész az ügyfél gépére.) Ez a programozási eljárás biztosítja azt, hogy a film lejátszása akkor is folyamatos legyen (tehát az érkező adatok dekódolása ne szenvedjen csorbát), ha bizonyos részei hiányoznak, vagy csak később érkeznek a többihez képest. E technika segítségével így a korábbi eredményekhez képest sokkal hatékonyabban és megbízhatóbban tudtak adatot raktározni a DNS-be. A New York-i tudósok összesen 72 ezer darabra vagdosták azt a DNS-láncot, amelybe adatot írtak. Ezeket aztán sikeresen szekvenálták, dekódolták, és az adatokat újra összeillesztették. A folyamat közben ugyan elveszítettek vagy kétezer töredéket, de a szökőkút kódolásnak köszönhetően az adatok hiánytalanul kinyerhetők maradtak.

A DNS-kódolásnak van még egy hasonlóan frusztráló hátránya. Ellentétben az elektromos jelek alapján történő adattárolással, itt az információ leolvasása egyúttal az adathordozó elpusztítását is eredményezi (hiszen a szekvenáláshoz először rengeteg rövid darabra kell azt törni). Olyan ez, mint amikor a Mission Impossible-epizódok elején a titkos ügynök megkapja a megbízatást, majd „a diszk öt másodpercen belül megsemmisíti önmagát”. Ezt egyelőre úgy tudják áthidalni, hogy a DNS-láncból mindig megtartanak egy mesterkópiát, és az adatolvasás előtt erről készítenek másolatot, amelyet aztán elemeznek. Szerencsére a DNS másolása manapság már rutineljárás és viszonylag olcsó is. Noha minden replikáció alkalmával történnek hibák (mutációk) – ez a természetes folyamat az evolúció alapja -, a szökőkút kódolás metódusa olyan robusztusnak bizonyult, hogy könnyűszerrel megbirkózik ezzel az akadállyal.


Forrás:mno.hu
Tovább a cikkre »