Identifikasi Singlet dan Evaluasi Algoritma Duplet dalam scRNAseq dengan Kode Batang DNA Sintetis

Kemajuan teknologi Single-cell RNA sequencing (scRNA-seq) telah memungkinkan analisis ekspresi gen dengan resolusi tinggi, tetapi keberadaan duplet dapat mengganggu interpretasi data. Kode batang DNA sintetis telah dikembangkan sebagai metode inovatif untuk mengidentifikasi sel tunggal (singlet) dalam dataset scRNA-seq dan mengevaluasi algoritma deteksi duplet. Penelitian ini memperkenalkan singletCode, sebuah kerangka kerja berbasis kode batang DNA yang memungkinkan ekstraksi singlet secara akurat dan benchmarking metode deteksi duplet. Hasil penelitian menunjukkan bahwa singletCode mampu meningkatkan akurasi deteksi singlet dan memberikan wawasan baru mengenai kinerja algoritma deteksi duplet yang ada.

scRNA-seq merupakan metode utama dalam mengungkap heterogenitas ekspresi gen pada tingkat seluler. Namun, salah satu tantangan utama dalam analisis scRNA-seq adalah munculnya duplet, yaitu kejadian di mana dua atau lebih sel terperangkap dalam satu reaksi, menghasilkan profil ekspresi yang bercampur. Kehadiran duplet dapat menyebabkan kesalahan dalam analisis data, termasuk identifikasi yang keliru terhadap subpopulasi sel dan interpretasi yang salah terhadap jalur biologis.

Sejumlah algoritma telah dikembangkan untuk mengidentifikasi dan mengeliminasi duplet dalam dataset scRNA-seq. Namun, sebagian besar metode ini bergantung pada asumsi perbedaan ekspresi gen yang signifikan antara sel-sel yang dianalisis. Hal ini menyebabkan keterbatasan dalam mendeteksi duplet pada populasi sel yang memiliki kesamaan transkripsi tinggi. Untuk mengatasi permasalahan ini, kode batang DNA sintetis telah digunakan sebagai pendekatan baru dalam menandai dan melacak sel tunggal, sehingga memungkinkan identifikasi singlet dengan kepastian tinggi.

Dalam penelitian ini, kode batang DNA sintetik diperkenalkan ke dalam sel sebelum proses scRNA-seq dilakukan. Selanjutnya, sel-sel tersebut dikapsulkan dalam droplet individual dan diidentifikasi berdasarkan kode batang uniknya. Algoritma singletCode digunakan untuk mengekstrak singlet berdasarkan beberapa kriteria utama, termasuk jumlah kode batang per sel, dominasi ekspresi unik dari satu kode batang, serta keberadaan kombinasi kode batang yang sama di berbagai sampel.

Untuk mengevaluasi efektivitas singletCode, dilakukan benchmarking terhadap beberapa algoritma deteksi duplet yang ada, seperti DoubletFinder, scDblFinder, Scrublet, dan metode hybrid. Kinerja algoritma-algoritma ini dibandingkan dengan dataset yang telah dikurasi menggunakan singletCode untuk menilai sensitivitas dan spesifisitas dalam mengidentifikasi duplet.

Hasil analisis menunjukkan bahwa metode berbasis kode batang DNA mampu meningkatkan akurasi identifikasi singlet dibandingkan dengan metode konvensional. Dari total 564.579 sel yang dianalisis, sebanyak 293.618 (87%) diidentifikasi sebagai singlet setelah dilakukan filtrasi kualitas. Benchmarking terhadap algoritma deteksi duplet menunjukkan bahwa kinerja metode yang diuji sangat bergantung pada heterogenitas sampel dan metode penciptaan duplet.

singletCode menghasilkan peningkatan akurasi rata-rata sebesar 29% dalam mendeteksi singlet dibandingkan dengan pendekatan berbasis ekspresi gen. Hal ini menunjukkan bahwa kode batang DNA sintetis dapat menjadi standar baru dalam pengolahan data scRNA-seq untuk memastikan bahwa analisis hanya didasarkan pada sel tunggal yang sesungguhnya.

Selain itu, penelitian ini mengungkap bahwa algoritma deteksi duplet menunjukkan variasi performa yang signifikan tergantung pada dataset yang digunakan. Beberapa algoritma, seperti Scrublet, cenderung memberikan prediksi lebih akurat pada dataset dengan tingkat heterogenitas tinggi, sementara algoritma lain, seperti scDblFinder, menunjukkan sensitivitas lebih rendah terhadap duplet yang disimulasikan.

Kode batang DNA sintetis menawarkan solusi inovatif dalam mengidentifikasi singlet dan mengevaluasi algoritma deteksi duplet dalam scRNA-seq. Metode singletCode yang dikembangkan dalam penelitian ini telah terbukti dapat meningkatkan akurasi deteksi singlet dan memberikan pemahaman yang lebih dalam terhadap efektivitas algoritma deteksi duplet. Dengan meningkatnya penerapan teknologi kode batang DNA dalam studi scRNA-seq, diharapkan metode ini dapat menjadi standar baru dalam analisis sel tunggal dan meningkatkan ketepatan interpretasi data biologis.

Sumber:

Zhang, Z., Melzer, M. E., Arun, K. M., Sun, H., Eriksson, C. J., Fabian, I., … & Goyal, Y. (2024). Synthetic DNA barcodes identify singlets in scRNA-seq datasets and evaluate doublet algorithms. Cell Genomics4(7).

Comments

Leave a Reply

Your email address will not be published. Required fields are marked *