KONVERSI DATA KE FORMAT DNA DAN PERBANDINGAN HASIL KOMPRESINYA MENGGUNAKAN GENCOMPRESS TERHADAP WINRAR
Abstract
Teknik kompresi data saat ini merupakan hal yang penting dalam menyimpan media dalam bentuk digital. Secara umum, teknik kompresi terbagi menjadi lossy compression dan loseless compression. Penelitian ini mencoba untuk menerapkan konsep kompresi DNA yang bersifat loseless. Karena DNA hanya terdiri dari huruf a, c, g, dan t, maka kompresi ini hanya dapat diaplikasikan pada media teks, padahal, media yang ada saat ini tidak hanya berupa teks saja. Oleh sebab itu penelitian ini bertujuan untuk menemukan cara agar kompresi tersebut dapat diaplikasikan pada media lain serta membandingkan hasil kompresi tersebut dengan aplikasi WinRAR. Untuk dapat dikompresi dengan teknik kompresi DNA, semua file tersebut harus dikonversikan ke dalam bentuk DNA. Proses konversi tersebut dilakukan dengan mengubah kode binary yang ada pada file menjadi untaian rantai DNA. 00 diubah menjadi ‘a’, 01 diubah menjadi ‘c’, 10 diubah menjadi ‘g’ dan 11 diubah menjadi ‘t’. Walaupun pada konversi data ke format DNA ukuran file DNA menjadi lebih besar dari file awal, namun ukuran file hasil kompresi menjadi lebih kecil dari ukuran file awal karena memanfaatkan kelebihan teknik kompresi DNA. Ukuran file hasil kompresi dengan GenCompress menunjukkan hasil yang lebih baik dari WinRAR ketika terdapat pengulangan dengan jumlah yang sama pada isi file.
References
Chen, X., Li, M., Ma, B., & Tromp, J. 2002. DNACompress: fast and effective DNA sequence. Bioinformatics Applications Note.
Cherniavsky, N., & Ladner, R. 2004. Grammar-based Compression of DNA Sequences. University of Washington: Computer Science & Engineering Technical Report.
Church, George M., Yuan Gao, and Sriram Kosuri. 2012. “Next-Generation Digital Information Storage in DNA.” Science 337 (6102) (September 28): 1628–1628. doi:10.1126/science.1226355Grumbach, S., & Tahi, F. 1993. Compression of DNA sequences. Los Alamitos: IEEE Computer Society Press.
Grumbach, S., & Tahi, F. 1994. A New Challenge for Compression Algorithms: Genetic Sequences. J. Information Processing and Management.
Nelson, M., & Gailly, J.-l. 1995. The Data Compression Book (2nd ed.). New York: M&T Books