Metagenomik telah merevolusi cara kita memahami ekosistem mikroba di berbagai lingkungan. Dengan pendekatan ini, para peneliti dapat mempelajari mikrobioma tanpa perlu membudidayakan mikroorganisme di laboratorium, memungkinkan analisis langsung terhadap komunitas mikroba di habitat alami mereka. Penelitian yang dilakukan oleh MetaSUB Consortium bertujuan untuk memahami mikrobioma di sistem transportasi umum seperti subway sebagai ruang interaksi manusia yang sangat padat. Data yang dihasilkan dari proyek ini mencakup ratusan sampel metagenomik dari berbagai kota dunia yang kemudian menjadi tantangan besar dalam pengolahan dan analisis data.
Salah satu tantangan utama dalam analisis data metagenomik adalah volume data yang sangat besar. Misalnya proyek Human Microbiome Project (HMP) menghasilkan lebih dari 24 terabasepairs (Tbp) data sekuens pada tahun 2017 yang memerlukan sistem komputasi canggih untuk analisis. Dalam studi ini, pendekatan berbasis pembelajaran mesin digunakan untuk memproses data ini dan memprediksi lokasi geografis asal sampel mikrobioma. Dua metode utama yang diterapkan adalah profil taksonomi berbasis baca (read-based) dan pendekatan berbasis perakitan (assembly-based). Kedua metode ini memiliki keunggulan masing-masing. Pendekatan berbasis baca lebih hemat sumber daya komputasi dan ideal untuk analisis cepat, sedangkan metode berbasis perakitan memungkinkan analisis lebih mendalam namun membutuhkan memori besar.
Hasil penelitian menunjukkan bahwa model Random Forest (RF) memberikan akurasi prediksi tertinggi mencapai 91% pada pendekatan berbasis baca dan 90% pada pendekatan berbasis perakitan. Meski demikian, kedua metode menghadapi tantangan yang sama, yakni kesulitan dalam memprediksi beberapa sampel tertentu. Hal ini kemungkinan disebabkan oleh keragaman mikroba yang tinggi di lokasi tersebut serta pengaruh faktor lingkungan yang kompleks.
Penemuan ini memberikan wawasan baru tentang bagaimana analisis metagenomik dapat dimanfaatkan untuk memahami keanekaragaman hayati mikroba di lingkungan perkotaan. Dengan memanfaatkan algoritma pembelajaran mesin, kita dapat mengidentifikasi pola unik dalam komunitas mikroba yang terkait dengan lokasi geografis, meskipun masih diperlukan pengujian lebih lanjut untuk meningkatkan akurasi prediksi dan menangani kompleksitas data yang lebih besar.
Di masa depan, pengembangan lebih lanjut pada perangkat lunak dan algoritma yang digunakan dalam analisis data besar ini akan semakin mempercepat pemahaman kita terhadap peran mikrobioma di berbagai aspek kehidupan manusia, termasuk kesehatan, ekologi, dan desain lingkungan perkotaan.
Sumber:
Leave a Reply