ANNONSE

DNA som et medium for å lagre store datadata: en realitet veldig snart?

A breakthrough study takes significant step forward in the quest to develop a DNA-based storage system for digital data.

Digitalt dato is growing at an exponential rate today because of our dependency on gadgets and it requires robust long-term storage. Data storage is slowly becoming challenging because current digital technology is not able to provide a solution. An example being that more digital data has been created in the past two years than in all of history of datamaskiner, in fact 2.5 quintillion byte {1 quintillion byte = 2,500,000 Terabytes (TB) = 2,500,000,000 Gigabytes (GB)} of data is being created every day in the world. This includes data on social networking sites, online banking transactions, records of companies and organization, data from satellites, surveillance, research, development etc. This data is huge and unstructured. Therefore, it is now a big challenge to tackle huge storage requirements for data and its exponential growth, especially for organizations and corporations who require robust long-term storage.

Alternativene som er tilgjengelige for øyeblikket er harddisker, optiske disker (CDer), minnepinner, flash-stasjoner og de mer avanserte båndstasjonen eller optiske BluRay-plater som lagrer omtrent 10 terabyte (TB) med data. Selv om slike lagringsenheter brukes ofte har mange ulemper. For det første har de en lav til middels holdbarhet og de må lagres under ideelle temperatur- og fuktighetsforhold for å kunne vare i mange tiår og dermed kreve spesialdesignede fysiske lagringsplasser. Nesten alle disse bruker mye strøm, er klumpete og upraktiske og kan bli skadet ved et enkelt fall. Noen av dem er svært dyre, er ofte plaget med datafeil og er dermed ikke robuste nok. Et alternativ som har blitt universelt akseptert av organisasjonen kalles cloud computing - en ordning der et selskap i utgangspunktet ansetter en "utenfor" server for å håndtere alle sine IT- og datalagringskrav, referert til som "skyen". En av de primære ulempene med cloud computing er sikkerhets- og personvernproblemer og sårbarhet for angrep fra hackere. Det er også andre problemer som høye kostnader involvert, begrenset kontroll fra overordnet organisasjon og plattformavhengighet. Cloud computing anses fortsatt som et godt alternativ for langtidslagring. Det ser imidlertid ut til at den digitale informasjonen som genereres over hele verden overgår vår evne til å lagre den, og enda mer robuste løsninger er nødvendige for å imøtekomme denne datafloden samtidig som den gir skalerbarhet for å ta hensyn til fremtidige lagringsbehov også.

Kan DNA hjelpe til med datalagring?

Vår DNA (Deoxyribonucleic acid) is being considered as an exciting alternative medium for digital data storage. DNA is the self-replicating material present in nearly all living organisms and is what constitutes our genetic information. An artificial or synthetic DNA is a durable material which can be made using commercially available oligonucleotide synthesis machines. The primary benefit of DNA is its longevity as a DNA lasts 1000 times longer than silicon (silicon-chip – the material used for building datamaskiner). Utrolig nok bare en enkelt kubikkmillimeter av DNA can hold a quintillion of bytes of data! DNA is also an ultracompact material which never degrades and can be stored in a cool, dry place for hundreds of centuries. The idea of using DNA for storage has been around for a long time way back to 1994. The main reason is the similar fashion in which information is being stored in a computer and in our DNA – since both store the blueprints of information. A computer stores all data as 0s and 1s and DNA stores all data of a living organism using the four bases – thymine (T), guanine (G), adenine (A) and cytosine (C). Therefore, DNA could be called a standard storage device, just like a computer, if these bases can be represented as 0s (bases A and C) and 1s (bases T and G). DNA is tough and long-lasting, the simplest reflection being that our genetic code – the blueprint of all our information stored in DNA – is efficiently transmitted from one generation to next in a repeated manner. All software and hardware giants are keen on using synthetic DNA for storing vast amounts to achieve their goal of solving long-term archival of data. The idea is to first convert the computer code 0s and 1s into the DNA code (A, C, T, G), the converted DNA code is then used to produce synthetic strands of DNA which can then be put into cold storage. Whenever required, DNA strands can be removed from cold storage and their information decoded using DNA sequencing machine and DNA sequence is finally translated back to binary computer format of 1s and 0s to be read on the computer.

Det har blitt vist1 that just a few grams of DNA can store quintillion byte of data and keep it intact for up to 2000 years. However, this simple understanding has faced some challenges. Firstly, it is quite expensive and also painfully slow to write data to DNA i.e. the actual conversion of 0s and 1s to the DNA bases (A, T, C, G). Secondly, once the data is “written” onto the DNA, it is challenging to find and retrieve files and requires a technique called DNA sequencing – process of determining the precise order of bases within a DNA molecule -after which the data is decoded back to 0s and 1s.

En fersk studie2 av forskere fra Microsoft Research og University of Washington har oppnådd en "tilfeldig tilgang" på DNA-lagring. "Random access"-aspektet er veldig viktig fordi det betyr at informasjon kan overføres til eller fra sted (vanligvis et minne) der hver plassering, uansett hvor i sekvensen, kan nås direkte. Ved å bruke denne teknikken med tilfeldig tilgang, kan filer hentes fra DNA-lagring på en selektiv måte sammenlignet med tidligere, da en slik henting krevde behovet for å sekvensere og dekode et helt DNA-datasett for å finne og trekke ut de få filene man ønsket. Betydningen av "tilfeldig tilgang" økes ytterligere når datamengden øker og blir enorm ettersom det reduserer mengden sekvensering som må gjøres. Det er for første gang noensinne at tilfeldig tilgang har blitt vist i så stor skala. Forskere har også utviklet en algoritme for å dekode og gjenopprette data mer effektivt med mer toleranse for datafeil som gjør sekvenseringsprosedyren også raskere. Mer enn 13 millioner syntetiske DNA-oligonukleotider ble kodet i denne studien som var data på 200 MB størrelse bestående av 35 filer (inneholder video, lyd, bilder og tekst) i størrelse fra 29KB til 44MB. Disse filene ble hentet enkeltvis uten feil. Forfattere har også utviklet nye algoritmer som er mer robuste og feiltolerante når de skriver og leser DNA-sekvensene. Denne studien publisert i Nature Biotechnology i et stort fremskritt som viser et levedyktig, storskala system for DNA-lagring og gjenfinning.

DNA storage system looks very appealing because it is having high data density, high stability and is easy to store but it obviously has many challenges before it can be universally adopted. Few factors are time and labour-intensive decoding of the DNA (the sequencing) and also synthesis of DNA. The technique requires more accuracy and broader coverage. Even though advances have been made in this area the exact format in which data will be stored in the long-term as DNA is still evolving. Microsoft has vowed to improve production of synthetic DNA and address the challenges to design a fully operational DNA lagringssystem innen 2020.

***

{Du kan lese den originale forskningsoppgaven ved å klikke på DOI-lenken nedenfor i listen over siterte kilder}

Source (s)

1. Erlich Y og Zielinski D 2017. DNA Fountain muliggjør en robust og effektiv lagringsarkitektur. Vitenskap. 355 (6328). https://doi.org/10.1126/science.aaj2038

2. Organick L et al. 2018. Tilfeldig tilgang i storskala DNA-datalagring. Natur bioteknologi. 36. https://doi.org/10.1038/nbt.4079

SCIEU-teamet
SCIEU-teamethttps://www.ScientificEuropean.co.uk
Scientific European® | SCIEU.com | Betydelige fremskritt innen vitenskap. Innvirkning på menneskeheten. Inspirerende sinn.

Abonner på vårt nyhetsbrev

For å bli oppdatert med alle de siste nyhetene, tilbudene og spesielle kunngjøringer.

Mest populære artikler

Mindfulness-meditasjon (MM) reduserer pasientens angst ved tannimplantatkirurgi 

Mindfulness-meditasjon (MM) kan være en effektiv beroligende teknikk...

Anti-malariavaksiner: Vil nyfunnet DNA-vaksineteknologi påvirke fremtidens kurs?

Å utvikle vaksine mot malaria har vært blant de største...

Den walisiske ambulansetjenestens bønn om offentlighetens ærlighet under Covid-19-utbruddet

Den walisiske ambulansetjenesten ber publikum om å...
- Annonse -
94,466FansI likhet med
47,680FølgereFølg
1,772FølgereFølg
30abonnenterBli medlem!