Sentiment Analysis research for Arabic dialects / Arapça lehçeleri için duygu analizi araştırması
Yükleniyor...
Tarih
2019
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Maltepe Üniversitesi
Erişim Hakkı
CC0 1.0 Universal
info:eu-repo/semantics/openAccess
info:eu-repo/semantics/openAccess
Özet
Sentiment analysis is an application of natural language processing which has recently gotten extensive attention. However, sentiment analysis research has mainly been focused on English. Although Arabic is a major language largely spoken in the world, only a few studies have been focused on Arabic sentiment analysis. The rapid growth of Arabic texts amounts on the Internet as well as the recent political changes in the Arabic countries which had affected the entire world, make a transcendent need to support Arabic sentiment extraction. The main challenges related to Arabic are the lack of sentiment resources and the varieties of Arabic dialects. Most Arabic commentary in social media is made using dialects. Dialects are unstructured, non-grammatical, and have not standard rules. They present complex challenges for sentiment analysis of online commentary. Previous works alter between two methods namely monolingual and bilingual. While the monolingual method is based on Arabic sentiment resources to classify sentiment polarity, the bilingual method is based on English resources and translation techniques. Most monolingual works are limited to the standard Arabic as they proceeded by filtering out dialects and transliterated texts. In the other hand, the bilingual works had brought English sentiment resources in Arabic context through translation techniques. They are also limited to the standard Arabic. After a detailed study of Arabic Sentiment Analysis researches, we find that the majority of the built sentiment resources cannot perform in the context of social media due to the dialectical content. It was revealed that the performance of sentiment analysis systems strongly depends on pre-processing techniques. We propose that future works should change pre-processing techniques in order to save dialectical texts. Furthermore, we propose to shift from simplistic word level sentiment analysis to concept-based sentiment analysis. The objective is to capture frequently used multi-word expressions in the Arabic space.
Duygu analizi, son zamanlarda yoğun bir şekilde dikkat çeken bir doğal dil işleme uygulamasıdır. Bununla birlikte, duygu analizi araştırmaları çoğunlukla İngilizceye odaklanmıştır. Arapça, dünyada yaygın olarak konuşulan önemli bir dil olmasına rağmen, çok az çalışmada Arapça duygu analizi üzerine odaklanılmıştır. Internet üzerindeki Arapça metinlerin hızla artması ve yanı sıra, Arap ülkelerindeki tüm dünyayı etkileyen son siyasi değişiklikler, Arapça duygu çıkarımını desteklemekte açık bir gereksinim olduğunu göstermektedir. Arapça ile ilgili ana zorluklar, duygu analizi kaynaklarının eksikliği ve Arapça lehçelerin çeşitleridir. Sosyal medyadaki çoğu Arapça yorum lehçeler kullanılarak yapılır. Lehçeler, yapılandırılmamıştır, gramer dışıdır, ve standart kurallara sahip değildir. Bunlar, çevrimiçi yorumların duygu analizi için karmaşık zorluklar doğurmaktadır. Önceki çalışmalar tek dilli ve iki dilli olmak üzere iki yönteme ayrılmaktadır. Tek dilli yöntem, duygu derecesini sınıflandırmak için Arapça duygu kaynaklarına dayanırken, iki dilli yöntem İngilizce kaynaklarına ve çeviri tekniklerine dayanmaktadır. Tek dilli çalışmaların çoğu, lehçeleri ve çevrilmiş metinleri filtrelemekte ve standart Arapça ile sınırlı kalmaktadır. Öte yandan, iki dilli çalışmaları, çeviri teknikleriyle, İngilizce bağlamındaki duygu kaynaklarını Arapça bağlamında kullanmaktadır, ve ayrıca standart Arapça ile sınırlıdırlar. Arapça Duygu Analizi araştırmalarının detaylı bir incelemesinden sonra, mevcut duygu kaynaklarının çoğunluğunun lehçeler nedeniyle sosyal medya bağlamında yeterli olmadığını tespit ettik. Duygu analizi sistemlerinin başarımının kuvvetli bir şekilde ön işleme tekniklerine bağlı olduğu ortaya çıktı. Gelecekteki çalışmaların çok lehçeli metinleri işleyebilmek için ön işleme tekniklerini değiştirmesi gerektiğini öneriyoruz. Ayrıca, basit kelime düzeyi duygu analizinden kavram-temelli duygu analizine geçmeyi öneriyoruz. Bundaki amaç Arapça’da sık kullanılan çok kelimeli ifadeleri yakalamaktır.
Duygu analizi, son zamanlarda yoğun bir şekilde dikkat çeken bir doğal dil işleme uygulamasıdır. Bununla birlikte, duygu analizi araştırmaları çoğunlukla İngilizceye odaklanmıştır. Arapça, dünyada yaygın olarak konuşulan önemli bir dil olmasına rağmen, çok az çalışmada Arapça duygu analizi üzerine odaklanılmıştır. Internet üzerindeki Arapça metinlerin hızla artması ve yanı sıra, Arap ülkelerindeki tüm dünyayı etkileyen son siyasi değişiklikler, Arapça duygu çıkarımını desteklemekte açık bir gereksinim olduğunu göstermektedir. Arapça ile ilgili ana zorluklar, duygu analizi kaynaklarının eksikliği ve Arapça lehçelerin çeşitleridir. Sosyal medyadaki çoğu Arapça yorum lehçeler kullanılarak yapılır. Lehçeler, yapılandırılmamıştır, gramer dışıdır, ve standart kurallara sahip değildir. Bunlar, çevrimiçi yorumların duygu analizi için karmaşık zorluklar doğurmaktadır. Önceki çalışmalar tek dilli ve iki dilli olmak üzere iki yönteme ayrılmaktadır. Tek dilli yöntem, duygu derecesini sınıflandırmak için Arapça duygu kaynaklarına dayanırken, iki dilli yöntem İngilizce kaynaklarına ve çeviri tekniklerine dayanmaktadır. Tek dilli çalışmaların çoğu, lehçeleri ve çevrilmiş metinleri filtrelemekte ve standart Arapça ile sınırlı kalmaktadır. Öte yandan, iki dilli çalışmaları, çeviri teknikleriyle, İngilizce bağlamındaki duygu kaynaklarını Arapça bağlamında kullanmaktadır, ve ayrıca standart Arapça ile sınırlıdırlar. Arapça Duygu Analizi araştırmalarının detaylı bir incelemesinden sonra, mevcut duygu kaynaklarının çoğunluğunun lehçeler nedeniyle sosyal medya bağlamında yeterli olmadığını tespit ettik. Duygu analizi sistemlerinin başarımının kuvvetli bir şekilde ön işleme tekniklerine bağlı olduğu ortaya çıktı. Gelecekteki çalışmaların çok lehçeli metinleri işleyebilmek için ön işleme tekniklerini değiştirmesi gerektiğini öneriyoruz. Ayrıca, basit kelime düzeyi duygu analizinden kavram-temelli duygu analizine geçmeyi öneriyoruz. Bundaki amaç Arapça’da sık kullanılan çok kelimeli ifadeleri yakalamaktır.
Açıklama
Anahtar Kelimeler
NLP, Multilingual Sentiment Analysis, Arabic Dialects, Arabic Sentiment Analysis Challenges, Arabic Sentiment Resources, DDİ, Çok Dilli Duygu Analizi, Arapça Lehçeleri, Arapça Duygu Analizi Zorlukları, Arapça Duygu Kaynakları
Kaynak
Maltepe Üniversitesi Uluslararası Öğrenci Kongresi
WoS Q Değeri
Scopus Q Değeri
Cilt
Sayı
Künye
Oueslatı, O. (2019). Sentiment Analysis research for Arabic dialects / Arapça lehçeleri için duygu analizi araştırması. Maltepe Üniversitesi Uluslararası Öğrenci Kongresi.