DNA sebagai cakera keras: 455 exabait setiap gram dan jangka hayat berjuta-juta tahun

Kemaskini terakhir: 30/09/2025
Pengarang Ishak
  • Ketumpatan DNA membolehkan sehingga 455 exabait setiap gram, dan pemeliharaannya, terkapsul dalam silika dan dalam simpanan sejuk, mencapai skala berjuta-juta tahun.
  • Pengekodan binari dalam A/C/G/T dengan pembetulan Reed-Solomon memungkinkan untuk menyimpan dan mendapatkan semula data dengan tepat dan dengan toleransi ralat.
  • Eksperimen (EBI, ETH Zurich, Microsoft+UW) dan prototaip seperti "pita" DNA menunjukkan automasi dan operasi seperti pemacu keras.
  • Kos masih tinggi, tetapi mereka jatuh dengan genomik; DNA bertujuan untuk pengarkiban besar-besaran dan mampan dalam menghadapi batasan pusat data.

Penyimpanan DNA dan kapasiti data

Dunia digital sentiasa berkembang, dan walaupun kita bercakap tentang "awan", awan itu hidup di atas tanah yang kukuh, di dalam pusat data yang besar. Gudang besar dengan koridor yang tidak berkesudahan, deretan pelayan dan bil elektrik yang besar kini menyimpan foto, video, e-mel dan data sains kami. Dalam senario ini, idea semakin menarik: menggunakan DNA sebagai medium untuk maklumat, molekul kecil dengan kepadatan de penyimpanan luar biasa.

Janji itu berkuasa: mengekod bit ke dalam urutan A, C, G dan T untuk menyimpan segala-galanya daripada dokumen sejarah kepada fail video, dan melakukannya secara stabil selama berabad-abad atau bahkan beberapa dekad. lebih daripada sejuta tahun Jika ia dipelihara dengan baik. Fakta yang mencetuskan imaginasi sudah diketahui umum: secara teori, satu gram DNA boleh menyimpan sehingga 455 exabytes daripada data (455.000 bilion GB), angka yang mengecilkan cakera keras semasa dan memori silikon.

Apakah penyimpanan DNA dan mengapa ia penting

apakah penyimpanan DNA

DNA ialah manual arahan untuk kehidupan, dan bahasanya ditulis dengan empat "huruf": adenine (A), cytosine (C), guanine (G), dan thymine (T). Untuk tujuan pengkomputeran, kita boleh menterjemah sifar dan satu ke dalam gabungan asas ini untuk mencipta urutan sintetik yang, apabila dibaca, mendapatkan semula fail asal. Terjemahan ini telah terbukti berdaya maju sejak 2012, apabila kandungan megabait berjaya dikodkan dan dibaca, membuka pintu kepada paradigma baharu pengarkiban digital.

Sebab asas adalah kepadatan: dengan membungkus maklumat ke dalam molekul, ruang fizikal yang diperlukan runtuh. Dalam nombor, kita bercakap tentang mereka 455 exabait setiap gramUntuk memahaminya tanpa kalkulator: tabung uji kecil boleh memuatkan segala-galanya. Wikipedia bersama dengan Facebook, dan jika kita meluaskan skala, pengetahuan tentang tamadun kita akan menduduki sahaja beberapa meter padu, tiada kaitan dengan pusat data seluas ribuan meter persegi.

Penglihatan ini bukan hanya estetik. Pada tahap praktikal, DNA tidak memerlukan elektrik untuk kekal boleh dibaca: dalam keadaan sejuk, kering dan gelap, data kekal. Kita tahu ini dari arkeologi molekul, yang membolehkan kita membaca bahan genetik daripada tinggalan ratusan ribu tahun. Tingkah laku ini menjadikan DNA calon yang ideal untuk pengarkiban jangka panjang.

Kapasiti, perbandingan dan cabaran pusat data hari ini

Kapasiti DNA berbanding pusat data

Pusat data ialah "cathedrals of bit." Terdapat lebih daripada 2.000 daripadanya di seluruh dunia, dan setiap satu menduduki purata kira-kira 5 hektar (50.000 m²). Jika kita membandingkan jejak itu dengan kekompakan DNA, kesannya jelas. Ia bukan hanya tanah dan bangunan: penyejukan dan penggunaan tenaga juga besar-besaran, dan jejak alam sekitar berkaitan bukan kecil.

Secara selari, data meroket. Google memproses sekitar 4.650 bilion carian setiap hari; YouTube melihat hampir 4.700 bilion video setiap hari; Facebook menerima lebih 350 juta foto setiap 24 jam; dan Twitter menghantar sekitar 600 juta tweet. Tinjauan global menunjukkan bahawa menjelang 2025, sekitar 463 exabait data setiap hari, dengan sebahagian besar manusia masih belum menyambung ke internet. Ini bukan prestasi kecil.

  8 Program ASUS Yang Tidak Berguna

Longsor ini memberi tekanan kepada teknologi semasa sama seperti mereka menghampiri had fizikal. Pengalaman Backblaze, yang memantau 25.000 cakera keras dalam perkhidmatan, memberikan petunjuk: selepas empat tahun, hampir 22% daripada unit menunjukkan haus dan lusuh atau kegagalan. Ada yang bertahan lebih dari satu dekad, yang lain gagal dengan cepat. Kesimpulannya mudah: perkakasan konvensional tidak kekal dan penggantian berterusan mempunyai kos ekonomi dan operasi.

DNA sebagai ingatan, sebaliknya, mengalihkan sebahagian daripada masalah ke tahap kimia dan pemuliharaan. Dengan medium yang stabil dan tanpa memerlukan tenaga untuk "menyimpan" maklumat itu hidup, arkib dalam—yang kita semak sekali-sekala tetapi mesti bertahan—boleh mengubah paradigmanya dan melegakan tekanan pada infrastruktur gergasi.

Cara mengekod, mengekalkan dan membetulkan ralat

bagaimana DNA dikodkan dan dipelihara

Pengekodan data dalam DNA terdiri daripada menterjemah bit ke dalam pangkalan. Skim mudah memetakan A dan C kepada "0" dan G dan T kepada "1." Pemetaan ini menulis serpihan pendek yang, apabila digabungkan, membina semula mana-mana fail digital. Untuk meningkatkan keteguhan, kod pembetulan ralat digunakan. Reed-Solomon, yang menambah lebihan pintar: jika beberapa kepingan rosak, sistem boleh memulihkan maklumat asal.

Lonjakan besar dalam ketahanan dibuat oleh pasukan ETH Zurich, diketuai oleh Robert Grass dan Reinhard Heckel. Diilhamkan oleh cara DNA dipelihara dalam fosil, mereka membungkus molekul DNA sfera silika (kaca).Kenapa kaca? Kerana ia adalah bahan lengai secara kimia dan melindungi daripada unsur-unsur yang paling merosakkan DNA: terutamanya air dan oksigen.

Untuk mempercepatkan "garis masa", mereka meletakkan DNA terkapsul pada suhu 60, 65, dan 70°C, mensimulasikan kemerosotan selama beberapa dekad atau abad dalam beberapa minggu. Kestabilan DNA di dalam kaca adalah luar biasa. Ekstrapolasi, menyimpannya pada -18°C akan membolehkan maklumat disimpan lebih daripada sejuta tahun, angka yang mengubah rangka kerja mental perkara yang kita fahami oleh arkib yang tahan lama.

Perbezaan dengan tiub uji yang terdedah kepada udara terbuka adalah menarik: DNA bertahan hanya dua atau tiga tahun sebelum menjadi tidak boleh dibaca. Dengan membungkusnya dalam kaca dan menyimpannya dalam persekitaran yang sejuk, kering dan gelap, kadar kemandiriannya berganda. Tambahan pula, teknologi sol-gel memudahkan untuk mencipta "cangkang" kaca ini di sekeliling molekul, menjadikan proses lebih mudah. berpatutan secara teknikal daripada makmal.

Percubaan dan keputusan: daripada EBI dan ETH Zurich kepada Microsoft dan UW

Eksperimen dan pencapaian DNA

Buktinya terus bertimbun. Pada tahun 2012, kandungan DNA berjaya dikodkan dan dibaca, dan tidak lama kemudian, Institut Bioinformatik Eropah (EBI) di England meneruskan idea itu: ia menyimpan teks, imej dan audio—termasuk soneta Shakespeare, petikan daripada ucapan Martin Luther King "Saya mempunyai impian", imej institut itu sendiri, dan maklumat penting yang kemudiannya diambil dengan artikel heliks berganda—dan 100% ketepatan.

Metodologi mereka menggabungkan serpihan bertindih, indeks kedudukan, dan redundansi untuk memastikan pembinaan semula walaupun beberapa salinan telah rosak. Jumlah keseluruhan adalah sekitar 760 KB, dan DNA yang setara adalah lebih kecil daripada setitik habuk. Di peringkat biosekuriti, mereka menjelaskan bahawa DNA sintetik ini menggunakan "kod" yang berbeza dan tidak boleh secara tidak sengaja dimasukkan ke dalam genom organisma hidup; jika ia memasuki badan, ia akan merendahkan dan menghapuskan tanpa ruang berfungsi.

Harvard juga menguji idea itu dengan buku lebih daripada 53.000 perkataan dan 11 imej, mensintesis beribu-ribu serpihan pendek pada cip kaca yang kemudiannya dibaca menggunakan teknik penjujukan standard, yang sama yang kami gunakan untuk mengkaji genom purba atau sampel arkeologi. Ini mengukuhkan idea bahawa "perpustakaan molekul" boleh dirujuk dengan peralatan yang tersedia secara meluas. Biologi molekul.

  PCIe 7.0: Standard yang menggandakan kelajuan, merevolusikan sambungan optik dan menandakan masa depan perkakasan profesional

Kembali ke ETH Zurich, Grass dan pasukannya tertakluk kepada dua dokumen sejarah (kira-kira 83 KB kesemuanya, termasuk Perjanjian Persekutuan Switzerland 1291 dan laluan dari Archimedes Palimpsest) kepada tekanan haba. Selepas seminggu pada suhu 60-70°C, teks masih boleh dibaca. Pengiraan mereka meletakkan ketahanan pada kira-kira 2.000 tahun pada 10°C, berlanjutan kepada skala juta tahun jika disimpan pada -18°C. Kos pada masa itu adalah tinggi—sekitar €1.350 hingga $2.000 setiap hanya 83 KB—, tetapi trend kos dalam genomik adalah menggalakkan.

Buktinya ialah penurunan mendadak dalam harga penjujukan genom manusia: dari beberapa juta tahun lalu kepada hanya ratusan hari ini. Di sepanjang garis ini, penyelidik dari Microsoft dan University of Washington membina peranti pertama yang mengautomasikan proses hujung ke hujung untuk menyimpan dan membaca DNA. Dengan itu, mereka mengekod perkataan "hello" dan mendapatkannya, satu pencapaian kejuruteraan yang—walaupun ia mengambil masa 21 jam untuk 5 bait— menggambarkan bahawa automasi sedang dijalankan.

Prototaip yang melihat ke masa hadapan: daripada pita kaset DNA kepada industri

Cadangan baru-baru ini, yang diterbitkan dalam Science Advances oleh pasukan dari Universiti Sains dan Teknologi Selatan, menghidupkan semula format yang sangat biasa: "pita kaset." Peranti mereka menyepadukan membran nilon dan poliester dengan corak kod bar Dicetak laser. Kawasan putih menempatkan petak untuk menyimpan DNA sintetik dengan fail berkod; jalur hitam bertindak sebagai penghalang hidrofobik untuk mengelakkan percampuran.

Setiap partition mempunyai "alamat" yang unik, membenarkan operasi many-to-many, many-to-many (DMRM). Iaitu, kita boleh menyimpan berbilang fail, mendapatkannya semula, memadamkannya, dan menulisnya semula ke kawasan yang sama, meniru tingkah laku disco duro tetapi pada sokongan molekul. Dalam angka, kaset 1.000 meter boleh memuatkan lebih daripada 500.000 partition dan mencapai sehingga 362 petabait setiap kilometer, cukup untuk menyimpan, menurut penulis, beberapa kali ganda kandungan YouTube dalam saiz yang lebih kecil daripada novel kertas.

Barisan ini wujud bersama dengan inisiatif lain. Microsoft juga sedang mengusahakan Project Silica, yang meneroka kuarza sebagai medium arkib: laser mengubah struktur kristal secara kekal, dan kemudian algoritma pembelajaran mesin membaca tanda tersebut. Ia bukan DNA, tetapi ia menggambarkan pencarian media. ultra-stabil dan padat untuk arkib.

Industri bioteknologi juga mendorong. Katalog, sebuah syarikat permulaan Boston, telah membangunkan sistem untuk menyusun semula blok DNA pasang siap dan menulis data tanpa perlu mensintesisnya dari awal, dalam perjalanan ke apa yang mereka panggil "mesin" pertama yang menggunakan DNA seolah-olah ia adalah sistem pengendalian fizikalDi San Diego, Iridia menggabungkan DNA dan nanoteknologi untuk membina pemacu yang mampu beroperasi secara selari, benih "pemacu keras hidup."

Daripada sektor awam, IARPA—agensi projek penyelidikan lanjutan perisikan AS—sedang mempromosikan program MIST, yang matlamatnya adalah untuk menulis satu terabait DNA setiap hari dan membacanya pada kelajuan sepuluh kali lebih pantas. "Kami mahu menggantikan cakera keras semasa dengan media molekul yang lebih padat, selamat dan lebih tahan," jelas mereka, sejajar dengan idea bahawa silikon mencapai had fizikal.

  Jualan PC global dijangka meningkat 6,7% pada 2025, didorong oleh peningkatan dan peralihan rantaian bekalan

Perbandingan ketumpatan memberikan konteks: cakera keras mempunyai sekitar 10^9 bit setiap sentimeter padu, manakala DNA mencapai 10^18. Tidak hairanlah bahawa beberapa laporan—seperti laporan dari Institut Kajian Dasar Potomac—bercakap tentang bagaimana segala-galanya digital di planet ini boleh dimuatkan ke dalam kira-kira satu kilogram DNA. Ini mungkin kedengaran hebat, tetapi asas fizikal (dan biologi) adalah pepejal, dan menawarkan simpanan sejuk dan kering tingkap sementara yang jauh mengatasi teknologi magnetik dan optik konvensional.

Persoalan yang terletak di sebalik mencapai kestabilan dan ketumpatan ialah: apa yang kita simpan? Bagi Robert Grass sendiri, tumpuan harus diberikan pada memilih maklumat "benar-benar penting" yang patut diarkibkan secara neutral untuk masa hadapan. Sama seperti visi kita tentang Zaman Pertengahan bergantung pada apa yang dipelihara, gambar yang setia pada zaman kita akan memerlukan kriteria, kurasi, dan standard terbuka yang akan memudahkan pembacaan berabad-abad dari sekarang.

Cabaran kekal: hari ini, sintesis dan penjujukan berskala besar kekal mahal dan agak perlahan. Walau bagaimanapun, keluk kos dalam genomik berdegil ke bawah, dan automasi sudah menunjukkan kebolehlaksanaan teknikal. Algoritma proofreading, format penyasaran dan seni bina seperti "pita kaset molekul" menghala ke sistem yang membolehkan menulis dan memadam lebih praktikal.

Seolah-olah tidak ada bukti yang mencukupi bahawa DNA adalah medium yang tahan lama, paleogenetik terus menyampaikan rekod: DNA telah disusun daripada beruang kutub sejak kira-kira 110.000 tahun, daripada kuda sejak kira-kira 700.000 tahun dan 400.000 tahun mitokondria manusia DNA telah dipulihkan daripada DNA mitokondria manusia (DNA mitokondria manusia). Walaupun keadaan penting—sejuk membantu—kes di gua yang agak sederhana meluaskan peta pemeliharaan diraja.

Sisi yang kurang glamor, tetapi penting, ialah kimia harian: air dan oksigen adalah musuh terbesar. Oleh itu, membungkusnya dalam kaca dan menyimpannya di dalam bilik sejuk meminimumkan tindak balas dan putus rantai. Pada skala makmal, mencipta sfera silika menggunakan teknik sol-gel telah memudahkan proses, dan eksperimen dengan tegasan haba menunjukkan bahawa kemerosotan mengikut corak. boleh diramal, setanding dengan yang diperhatikan dalam fosil.

Untuk meletakkannya dalam perspektif, adalah wajar mengingati kontras dalam saiz dan kos: set ujian dengan dokumen 83 KB berharga sekitar €1.350/$2.000 beberapa tahun lalu. Ia mahal apabila anda berfikir dari segi terabait dan petabait, tetapi tidak lama dahulu penjujukan genom manusia menelan belanja berjuta-juta, tetapi hari ini ia adalah sekitar ratusan. Jika trend ini berterusan, DNA akan berubah daripada menjadi medium eksperimen kepada medium berdaya saing. pengarkiban massa dan sandaran "sejuk".

Kesatuan biologi dan teknologi bukan lagi fiksyen sains. Daripada "pita" DNA berkod bar kepada perpustakaan molekul yang tidak memerlukan elektrik, dan alternatif seperti kristal kuarza, perlumbaan untuk medium yang tahan lama dan padat sedang dijalankan. Jika satu perkara nampak jelas, DNA itu—dengan ketumpatan yang mustahil dan panggilannya untuk terus hidup—muncul sebagai calon utama untuk menyimpan, dengan cara yang hebat, memori digital spesies kita dengan keteguhan temporal bahawa tiada album semasa boleh menjanjikan.