Jaringan regulasi gen (Gene Regulatory Networks/GRNs) merupakan sistem kompleks yang mengatur ekspresi gen dalam suatu sel dan berperan dalam menentukan identitas seluler. Pemahaman terhadap interaksi molekuler yang mengontrol ekspresi gen sangat penting dalam biologi seluler dan medis, terutama dalam studi tentang perkembangan sel, diferensiasi, serta respons sel terhadap lingkungan eksternal. Seiring berkembangnya teknologi sekuensing sel tunggal (single-cell RNA sequencing/scRNA-seq), para peneliti memiliki kesempatan untuk mengamati ekspresi gen pada tingkat resolusi yang belum pernah ada sebelumnya. Namun, tantangan utama dalam analisis data scRNA-seq adalah adanya kebisingan eksperimental yang dapat menyebabkan bias dalam interpretasi hasil. Untuk mengatasi tantangan ini, pendekatan berbasis pembelajaran mesin, khususnya model deep learning, mulai diterapkan guna menyaring kebisingan dan mengungkap pola interaksi gen yang lebih akurat.
DeepSEM merupakan model generatif berbasis deep learning yang dikembangkan untuk secara simultan menginferensi GRNs serta merepresentasikan data scRNA-seq dengan cara yang lebih bermakna secara biologis. Model ini menggunakan pendekatan berbasis Structural Equation Model (SEM) dalam arsitektur jaringan saraf tiruan untuk memodelkan hubungan regulasi antar gen. Dengan demikian, DeepSEM tidak hanya mampu memprediksi GRN tetapi juga memberikan wawasan tentang mekanisme regulasi gen dalam konteks spesifik seluler. Studi terbaru menunjukkan bahwa DeepSEM memberikan performa yang lebih baik dibandingkan metode lain dalam berbagai tugas komputasi single-cell, seperti inferensi GRN, visualisasi data scRNA-seq, pengelompokan sel, serta simulasi data. Selain itu, regulasi gen yang diprediksi oleh DeepSEM pada gen penanda tipe sel di korteks tikus dapat divalidasi dengan data epigenetik, menunjukkan keakuratan dan efisiensi metode ini.
Dalam analisis jaringan regulasi gen, pendekatan konvensional sering kali bergantung pada data tambahan seperti informasi motif pengikatan faktor transkripsi atau data aksesibilitas kromatin. Namun, metode tersebut membutuhkan desain eksperimen yang lebih kompleks dan rentan terhadap tingkat kebisingan yang tinggi. DeepSEM menawarkan solusi dengan menggunakan pendekatan deep generative modeling yang hanya bergantung pada data ekspresi gen dari scRNA-seq, tanpa memerlukan informasi tambahan dari eksperimen lain. Model ini dibangun menggunakan varian dari autoencoder variational (beta-VAE), di mana bobot pada fungsi encoder dan decoder mewakili matriks adjasi dari GRN.
Salah satu tantangan dalam inferensi GRN adalah membedakan antara korelasi dan hubungan sebab akibat antara ekspresi gen. Banyak algoritma inferensi GRN yang ada saat ini berfokus pada analisis koekspresi daripada hubungan kausal antar gen. DeepSEM mengatasi keterbatasan ini dengan mengadopsi model SEM dalam jaringan saraf tiruan, memungkinkan eksplorasi hubungan kausal antara faktor transkripsi dan gen targetnya. Evaluasi terhadap beberapa kumpulan data benchmark menunjukkan bahwa DeepSEM memiliki performa yang lebih unggul dibandingkan metode state-of-the-art lainnya, seperti GENIE3, GRNBoost2, SCODE, dan SINCERITIES. DeepSEM berhasil mencapai performa prediksi terbaik dalam 81,82% dari keseluruhan pengujian benchmark dengan peningkatan minimal 10% dibandingkan metode terbaik kedua.
Selain inferensi GRN, DeepSEM juga mampu menyimulasikan data scRNA-seq yang realistis. Dengan mengganggu nilai neuron tersembunyi pada model, DeepSEM dapat meniru proses biologis yang mendasari ekspresi gen dalam sel. Hal ini sangat penting dalam studi biologi sel tunggal, karena memungkinkan prediksi respons sel terhadap berbagai kondisi eksperimental, identifikasi gen penanda, serta peningkatan akurasi klasifikasi tipe sel dengan cara memperkaya populasi sel yang jarang ditemukan dalam dataset asli.
Validasi hasil DeepSEM menggunakan data epigenetik dari korteks tikus menunjukkan bahwa prediksi regulasi gen yang dihasilkan memiliki kesesuaian yang tinggi dengan pola metilasi DNA dan data aksesibilitas kromatin. Sebagai contoh, prediksi regulasi gen yang dilakukan oleh DeepSEM terhadap gen Rorb dan Syt6 pada sel kortikal spesifik telah dikonfirmasi melalui data metilasi dan ATAC-seq. Hal ini menunjukkan bahwa pendekatan yang digunakan dalam DeepSEM tidak hanya memberikan hasil yang secara statistik lebih baik tetapi juga memiliki dasar biologis yang kuat.
Dengan adanya pendekatan berbasis deep learning seperti DeepSEM, analisis data scRNA-seq dapat dilakukan dengan lebih akurat dan efisien. Model ini tidak hanya memberikan pemahaman yang lebih dalam tentang jaringan regulasi gen, tetapi juga membuka peluang untuk eksplorasi lebih lanjut dalam bidang biologi sistem dan kedokteran regeneratif. Pengembangan lebih lanjut dari DeepSEM dapat mencakup integrasi dengan data multi-omik, seperti data proteomik dan epigenomik, untuk memberikan gambaran yang lebih komprehensif tentang regulasi gen dalam berbagai kondisi biologis.
Sumber:
Shu, H., Zhou, J., Lian, Q., Li, H., Zhao, D., Zeng, J. and Ma, J., 2021. Modeling gene regulatory networks using neural network architectures. Nature Computational Science, 1(7), pp.491-501.

Leave a Reply