Vekil sunucu verisi üzerinde veri madenciliği ile kullanıcı sorguları kümelemesi

dc.contributor.advisorBilgin, Turgay Tugan
dc.contributor.authorAytekin, Mustafa Koray
dc.date.accessioned2024-07-12T22:19:22Z
dc.date.available2024-07-12T22:19:22Z
dc.date.issued2012en_US
dc.date.submitted2012en_US
dc.departmentEnstitüler, Lisansüstü Eğitim Enstitüsü, Bilgisayar Mühendisliği Ana Bilim Dalıen_US
dc.description.abstractBu tez çalışmasında Maltepe Üniversitesi vekil sunucusu üzerinden derlenen günlük dosyası önişlemeye tabi tutularak bölümleme tabanlı ve graf tabanlı kümeleme algoritmaları ile kümelenmiş ve sonuçlar CLUSION adlı yöntem ile görselleştirilmiştir. Kullanıcıların arama motorlarında yaptıkları sorgular, günlük dosyasından önişleme ile elde edilmiş ve kümeleme amacı ile kullanılmıştır. Toplam 5 bölümden oluşan tezin birinci bölümünde genel kavramlardan bahsedilmiştir. İkinci bölümde veri madenciliğinin genel tanımından, güncel sorunlarından, WWW ile olan ilişkisinden, üçüncü bölümde web madenciliği bileşenleri ve alt süreçlerinden, web madenciliğinde kullanılabilecek veri ve web madenciliğinin kullanım alanlarından bahsedilmiştir. Dördüncü bölümde benzerlik ölçümleri ile k-means ve graf tabanlı kümeleme algortimaları ele alınmıştır. Beşinci bölümde uygulamanın geliştirilme aşamaları, kullanılan araçlar ve geliştirme ortamı başlığı altında Zemberek doğal dil işleme kütüphanesi ve graf tabanlı kümeleme yöntemleri içeren Strehl küme analizi kütüphanesi anlatılmıştır. Bu bölümde ayrıca çalışmada kullanılan veri kümesi ve önişleme süreci açıklanmış, elde edilen sonuçlar irdelenmiştir. Bu tez 2012 yılında tamamlanmıştır ve 97 sayfadan oluşmaktadır.en_US
dc.description.abstractIn this master thesis, log files from web proxy server of Maltepe University have been preprocessed and clustered using partitioning and graph-based clustering algorithms. Results have been illustrated by using CLUSION algorithm. Queries performed by users on search engines have been compiled by processing proxy log files and are used for clustering. General concepts about data mining have been presented in first section of the thesis which actually has 5 sections. In second section general definition of Data Mining has been given with contemporary problems in the field. In this section also the points which WWW and Data Mining have in common are mentioned. In third section web mining components and sub processes, data that can be used in web mining and usage of web mining in industry have been discussed. In fourth section similarity measures, k-means and graph based clustering have been presented to be basis in the following section. In fifth section which is the last one, the phases of the application have been discussed while Zemberek NLP library and Strehl cluster analysis library have been presented under tools and environments heading. In this section also the data set which has been used in the study and preprocessing task has been discussed and the results are investigated. This thesis has been completed in 2012 and consists of 97 pages.en_US
dc.identifier.citationAytekin, M. K. (2012). Vekil sunucu verisi üzerinde veri madenciliği ile kullanıcı sorguları kümelemesi / Mining proxy log data for clustering user queries (Yayımlanmamış Yüksek Lisans Tezi). Maltepe Üniversitesi, Fen Bilimleri Enstitüsü, İstanbul.en_US
dc.identifier.urihttps://hdl.handle.net/20.500.12415/10641
dc.institutionauthorAytekin, Mustafa Korayen_US
dc.language.isotren_US
dc.publisherMaltepe Üniversitesi, Fen Bilimleri Enstitüsüen_US
dc.relation.publicationcategoryTezen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.snmzKT0668en_US
dc.subjectWeb kullanım madenciliğien_US
dc.subjectVeri madenciliğien_US
dc.subjectKullanıcı kümelemeen_US
dc.subjectVekil sunucu günlüklerien_US
dc.subjectArama günlükleri sorgusuen_US
dc.subjectWeb usage miningen_US
dc.subjectData miningen_US
dc.subjectUser clusteringen_US
dc.subjectProxy logsen_US
dc.subjectQuery search logsen_US
dc.titleVekil sunucu verisi üzerinde veri madenciliği ile kullanıcı sorguları kümelemesien_US
dc.title.alternativeMining proxy log data for clustering user queriesen_US
dc.typeMaster Thesisen_US
dspace.entity.typePublication

Dosyalar

Orijinal paket
Listeleniyor 1 - 1 / 1
Yükleniyor...
Küçük Resim
İsim:
Mustafa_Koray_Aytekin_Vekil_Sunucu_Verisi.pdf
Boyut:
1.71 MB
Biçim:
Adobe Portable Document Format
Açıklama:
Tam Metin / Full Text