Fine-Tuning LLM Llama 3 dengan PySpark dan QLoRa pada Data Penelitian Ilmiah

  • Muhammad Arsal Ranjana Utama Institut Teknologi Sumatera
  • Husni Na’fa Mubarok Institut Teknologi Sumatera
  • Lis Nurani Institut Teknologi Sumatera
  • Salwa Amelia Salsabila
  • Nabila Azhari
  • Muhammad Bagas Kurnia
  • Luluk Muthoharoh
  • Ardika Satria
  • Rizty Maulida Badri
Keywords: Fine-Tuning, LLM, Llama, QLoRa, PySpark

Abstract

Studi ini mengeksplorasi penerapan PySpark untuk fine-tuning Llama 3 LLM menggunakan QLoRa pada kumpulan data yang terdiri dari 1,5 juta makalah ilmiah. Praproses data dan pelatihan model terdistribusi dilakukan untuk meningkatkan kinerja model dalam tugas NLP. Model yang disempurnakan menunjukkan kemampuan yang kuat dalam prompting sederhana dan kompleks. Kerugian pelatihan akhir sebesar 2,64857 tercapai, yang menunjukkan efektivitas QLoRa dalam meningkatkan efisiensi memori sekaligus mempertahankan kinerja.

Downloads

Download data is not yet available.
Published
2025-07-25
How to Cite
Utama, M. A. R., Mubarok, H., Nurani, L., Salsabila, S., Azhari, N., Kurnia, M. B., Muthoharoh, L., Satria, A., & Badri, R. (2025, July 25). Fine-Tuning LLM Llama 3 dengan PySpark dan QLoRa pada Data Penelitian Ilmiah. PROSIDING SEMINAR NASIONAL SAINS DATA, 5(1), 142-152. https://doi.org/https://doi.org/10.33005/senada.v5i1.460

Most read articles by the same author(s)