Analysis of Lifestyle Classification Using a Decision Tree Approach
DOI:
https://doi.org/10.57255/intellect.v4i02.1661Keywords:
Decision Tree, Lifestyle Classification, Diet, Sleep Patterns, Physical Activity, Mental HealthAbstract
Lifestyle related health issues continue to increase, highlighting the need for data-driven approaches that not only classify lifestyle patterns but also provide interpretable insights to support health-related decision making. This study aims to develop an interpretable lifestyle classification model using the Decision Tree algorithm, with a specific analytical focus on identifying dominant behavioral factors and their hierarchical relationships in distinguishing healthy and unhealthy lifestyles. The dataset was collected through a questionnaire survey involving 130 respondents representing diverse lifestyle behaviors. Initially, 23 attributes measured using Likert scales were used to capture multiple aspects of lifestyle. To improve analytical clarity and reduce data complexity, the attributes were transformed by grouping conceptually related items into four main behavioral domains: diet, physical activity, sleep patterns, and mental health. Personal demographic attributes were excluded from the modeling process due to their limited relevance to lifestyle behavior and their potential to introduce classification bias. Within each domain, sub-attributes were aggregated using mean values to generate stable composite scores, a methodologically appropriate approach given the non-parametric and threshold-based characteristics of the Decision Tree algorithm. The applied to reduce overfitting. The results indicate that the proposed model achieved an accuracy of 84.62% and a weighted average F1-score of 0.84, demonstrating balanced classification performance. The model showed strong recall in identifying healthy lifestyles, while limitations related to generalizability remain. Transformed dataset was divided into training and testing sets using a 70:30 hold-out validation strategy. Model construction employed the entropy criterion and information gain for attribute selection, with complexity control.
Abstrak
Masalah kesehatan terkait gaya hidup terus meningkat, menyoroti perlunya pendekatan berbasis data yang tidak hanya mengklasifikasikan pola gaya hidup tetapi juga memberikan wawasan yang dapat ditafsirkan untuk mendukung pengambilan keputusan terkait kesehatan. Penelitian ini bertujuan untuk mengembangkan model klasifikasi gaya hidup yang dapat diinterpretasikan menggunakan algoritma Decision Tree, dengan fokus analitis khusus untuk mengidentifikasi faktor perilaku dominan dan hubungan hierarkisnya dalam membedakan gaya hidup sehat dan tidak sehat. Kumpulan data dikumpulkan melalui survei kuesioner yang melibatkan 130 responden yang mewakili beragam perilaku gaya hidup. Awalnya, 23 atribut yang diukur menggunakan skala Likert digunakan untuk menangkap berbagai aspek gaya hidup. Untuk meningkatkan kejelasan analitis dan mengurangi kompleksitas data, atribut diubah dengan mengelompokkan item yang terkait secara konseptual menjadi empat domain perilaku utama: diet, aktivitas fisik, pola tidur, dan kesehatan mental. Atribut demografis pribadi dikecualikan dari proses pemodelan karena relevansinya yang terbatas dengan perilaku gaya hidup dan potensinya untuk memperkenalkan bias klasifikasi. Dalam setiap domain, sub-atribut dikumpulkan menggunakan nilai rata-rata untuk menghasilkan skor komposit yang stabil, pendekatan yang sesuai secara metodologis mengingat karakteristik non-parametrik dan berbasis ambang batas dari algoritma Pohon Keputusan. Himpunan data yang diubah dibagi menjadi set pelatihan dan pengujian menggunakan strategi validasi penahanan 70:30. Konstruksi model menggunakan kriteria entropi dan perolehan informasi untuk pemilihan atribut, dengan kontrol kompleksitas diterapkan untuk mengurangi overfitting. Hasil menunjukkan bahwa model yang diusulkan mencapai akurasi 84,62% dan skor F1 rata-rata tertimbang 0,84, menunjukkan kinerja klasifikasi yang seimbang. Model ini menunjukkan ingatan yang kuat dalam mengidentifikasi gaya hidup sehat, sementara keterbatasan yang terkait dengan generalisasi tetap ada.
Downloads
References
WHO, “Physical activity,” https://www.who.int/en/news-room/fact-sheets/detail/physical-activity.
N. Sundari, F. S. T. Dewi, and M. R. Ikhsan, “Perilaku gaya hidup dan obesitas sebagai faktor risiko kejadian diabetes melitus tipe 2 di RSUD. Aji Batara Agung Dewa Sakti Samboja Kabupaten Kutai Kartanegara,” Ber. Kedokt. Masy., vol. 32, no. 12, p. 461, Dec. 2016, doi: 10.22146/bkm.8337.
P. Kotler and K. L. Keller, Marketing Management MARKETING MANAGEMENT Marketing Management, Global Edi., vol. 2, no. 1. 2021. [Online]. Available: http://download.garuda.kemdikbud.go.id/article.php?article=2354118%5C&val=22677%5C&title=The The influence of social media marketing on brand awareness and brand image moderating effect of religiosity
M. A. Plow and J. Chang, “Promoting Healthy Behaviors in Stroke Survivors,” in Stroke Rehabilitation, Elsevier, 2019, pp. 279–290. doi: 10.1016/B978-0-323-55381-0.00020-2.
S. J. Russell and P. Norvig, Artificial Intelligence: A Modern Approach, 4th ed. 2021.
S. Jahandideh, G. Ozavci, B. W. Sahle, A. Z. Kouzani, F. Magrabi, and T. Bucknall, “Evaluation of machine learning-based models for prediction of clinical deterioration: A systematic literature review,” Int. J. Med. Inform., vol. 175, p. 105084, Jul. 2023, doi: 10.1016/j.ijmedinf.2023.105084.
A. F. A. Naibaho and A. Zahra, “PREDIKSI KELULUSAN SISWA SEKOLAH MENENGAH PERTAMA MENGGUNAKAN MACHINE LEARNING,” J. Inform. dan Tek. Elektro Terap., vol. 11, no. 3, Jul. 2023, doi: 10.23960/jitet.v11i3.3056.
A. Tursunalieva, D. L. J. Alexander, R. Dunne, J. Li, L. Riera, and Y. Zhao, “Making Sense of Machine Learning: A Review of Interpretation Techniques and Their Applications,” Appl. Sci., vol. 14, no. 2, p. 496, Jan. 2024, doi: 10.3390/app14020496.
L. D. H. Monasari and Nunik Pratiwi, “Klasifikasi Stunting Pada Balita Menggunakan Algoritma Decision Tree Pada Machine Learning,” Decod. J. Pendidik. Teknol. Inf., vol. 5, no. 2, pp. 416–428, Jul. 2025, doi: 10.51454/decode.v5i2.1193.
I. N. Sari, M. K. L. F. Lidimilah, and M. K. A. Lutfi, “Analisis Perbandingan Algoritma Decision Tree, Random Forest, dan Naive Bayes dalam Klasifikasi Gangguan Tidur,” Proc. Natl. Conf. Sinesia, vol. 1, no. 1, pp. 192–209, Jun. 2025, doi: 10.69836/ncrcs-sinesia.v1i1.41.
Imam Nawawi and Zaehol Fatah, “Penerapan Decision Trees dalam Mendeteksi Pola Tidur Sehat Berdasarkan Kebiasaan Gaya Hidup,” J. Ilm. SAINS Teknol. DAN Inf., vol. 2, no. 4, pp. 34–41, Oct. 2024, doi: 10.59024/jiti.v2i4.969.
Lisa Khoirunnisa and Nur Muhammad Soleh, “PENGARUH POLA HIDUP SEHAT TERHADAP KESEHATAN FISIK DAN MENTAL,” Cent. Publ., vol. 2, no. 2, pp. 1686–1691, 2024.
J. S. Santi and W. Septiani, “HUBUNGAN PENERAPAN POLA DIET DAN AKTIFITAS FISIK DENGAN STATUS KADAR GULA DARAH PADA PENDERITA DM TIPE 2 DI RSUD PETALA BUMI PEKANBARU TAHUN 2020,” J. Kesehat. Masy., vol. 9, no. 5, pp. 711–718, Sep. 2021, doi: 10.14710/jkm.v9i5.30816.
Downloads
Submitted
Accepted
Published
How to Cite
Issue
Section
License
Copyright (c) 2025 Afriosa Syawitri

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.












