SISTEM IDENTIFIKASI KATEGORI WEBSITE DENGAN METODE PEMBOBOTAN TF-IDF DAN METODE DECISION TREE

Antonius Rachmat C, Ahmad Ashari

Abstract


Makin bertambahnya website yang bermunculan di Internet, membuat pengguna kadang mengalami kesulitanuntuk mencari website yang benar-benar tepat berisi topik dan kategori yang sesuai dengan yang diinginkan. Hal ini seringdihadapi oleh pengguna yang baru saja mengenal dunia Internet. Maka dari itu muncul kebutuhan untuk mengkategorikanwebsite berdasarkan kategori tertentu. Kumpulan kata dalam suatu halaman web dapat dianggap sebagai suatu basis datayang membutuhkan pemrosesan yang cukup kompleks agar dapat mengambil informasi-informasi penting di dalamnya.Pada penelitian ini dikembangkan sebuah aplikasi yang diharapkan mampu mengambil informasi yangtersembunyi di dalam kata-kata yang ada pada suatu halaman website tertentu, sehingga dapat digunakan untukmengkategorikan halaman website tersebut ke dalam kategori-kategori yang sudah ditentukan sebelumnya. Aplikasi inimenggunakan metode-metode text mining untuk menganalisa halaman website tertentu. Tahapan proses pembelajarannyaadalah tahap tokenisasi, penghapusan kata-kata umum dengan menggunakan stop word list, dan stemming. Setelah itudilakukan pembobotan tingkat kepentingan kata-kata dengan metode TF-IDF, dan akhirnya dilakukan klasifikasi denganmetode Decision Tree.Dengan selesainya penelitian ini dihasilkan suatu aplikasi server dan client yang mampu menganalisa halamanwebsite tertentu dan mengkategorikan halaman tersebut sesuai dengan kategori tertentu berdasarkan data pembelajaran yangsudah dilakukan sebelumnya.

Refbacks

  • There are currently no refbacks.