Yazılım geliştirme taleplerinin metin madenciliği ile sınıflandırılması ve önceliklendirilmesi
Yükleniyor...
Tarih
2018-06
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Maltepe Üniversitesi, Fen Bilimleri Enstitüsü
Erişim Hakkı
Attribution-NonCommercial-ShareAlike 3.0 United States
info:eu-repo/semantics/openAccess
info:eu-repo/semantics/openAccess
Özet
Kurumsal şirketlerde, yazılımlardaki hatalar ve değişiklik talepleri genellikle bir talep yönetim sistemi üzerinden BT birimine iletilir. Bu sistemde yer alan öncelik ve aciliyet bilgisi BT birimi için kritik öneme sahiptir. Ancak, talebi giren kişilerin inisiyatifine bırakılan öncelik kararı her zaman gerçekçi olmamaktadır. Örneğin, kritik olmayan ve düşük öncelikli bir değişiklik talebi yüksek öncelikli olarak girilebilmekte, bu da hatalı planlama ve müşteri memnuniyetsizliği ile sonuçlanabilmektedir. Bu çalışmada, iç müşteri talepleri metin madenciliği yöntemleriyle sınıflandırılarak taleplerin önem derecesi tahmin edilmeye çalışılmıştır. Sistemin eğitimi ve testi için kurumsal bir şirketin talep yönetim sisteminden alınan kayıtlar kullanılmıştır. Ham metin formundaki talep verisi üzerinde temizlik ve önişleme işlemlerinin ardından, doküman-terim matrisinin oluşturulmasında TFIDF ağırlıklandırma yönteminden yararlanılmıştır. Elde edilen veri seti üzerinde çeşitli sınıflandırma algoritmaları test edilmiş ve en yüksek başarıma %74,5 F-Skoru değeri ile Rasgele Orman algoritmasıyla ulaşılmıştır.
In corporations, issues encountered in software and change demands are forwarded to the IT unit via a demand management system. The priority and severity information in this system has critical importance to the IT unit. However, the priority decision that is left to the individuals who create the demand records may not always be realistic. For instance, a non-critical and low-priority demand may be created with the highest priority, and this may lead to faulty planning and eventually to customer dissatisfaction. In this work, internal customer demands were classified using text mining techniques and their priorities were predicted. The system was trained and tested with the records extracted from the demand management system of a corporation. After cleaning and preprocessing the raw textual demand data, TFIDF weighting scheme was used when creating the document-term matrix. Several classification algorithms were tested on the data set obtained, and the highest performance was achieved by Random Forest algorithm with 74.5% F-Score.
In corporations, issues encountered in software and change demands are forwarded to the IT unit via a demand management system. The priority and severity information in this system has critical importance to the IT unit. However, the priority decision that is left to the individuals who create the demand records may not always be realistic. For instance, a non-critical and low-priority demand may be created with the highest priority, and this may lead to faulty planning and eventually to customer dissatisfaction. In this work, internal customer demands were classified using text mining techniques and their priorities were predicted. The system was trained and tested with the records extracted from the demand management system of a corporation. After cleaning and preprocessing the raw textual demand data, TFIDF weighting scheme was used when creating the document-term matrix. Several classification algorithms were tested on the data set obtained, and the highest performance was achieved by Random Forest algorithm with 74.5% F-Score.
Açıklama
Anahtar Kelimeler
talep önceliklendirme, yapay öğrenme, metin sınıflandırma, rasgele orman, demand prioritization, machine learning, text classification, random forest
Kaynak
WoS Q Değeri
Scopus Q Değeri
Cilt
Sayı
Künye
Tekin, Murat Can