Sentiment Analysis research for Arabic dialects / Arapça lehçeleri için duygu analizi araştırması

Yükleniyor...
Küçük Resim

Tarih

2019

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

Maltepe Üniversitesi

Erişim Hakkı

CC0 1.0 Universal
info:eu-repo/semantics/openAccess

Araştırma projeleri

Organizasyon Birimleri

Dergi sayısı

Özet

Sentiment analysis is an application of natural language processing which has recently gotten extensive attention. However, sentiment analysis research has mainly been focused on English. Although Arabic is a major language largely spoken in the world, only a few studies have been focused on Arabic sentiment analysis. The rapid growth of Arabic texts amounts on the Internet as well as the recent political changes in the Arabic countries which had affected the entire world, make a transcendent need to support Arabic sentiment extraction. The main challenges related to Arabic are the lack of sentiment resources and the varieties of Arabic dialects. Most Arabic commentary in social media is made using dialects. Dialects are unstructured, non-grammatical, and have not standard rules. They present complex challenges for sentiment analysis of online commentary. Previous works alter between two methods namely monolingual and bilingual. While the monolingual method is based on Arabic sentiment resources to classify sentiment polarity, the bilingual method is based on English resources and translation techniques. Most monolingual works are limited to the standard Arabic as they proceeded by filtering out dialects and transliterated texts. In the other hand, the bilingual works had brought English sentiment resources in Arabic context through translation techniques. They are also limited to the standard Arabic. After a detailed study of Arabic Sentiment Analysis researches, we find that the majority of the built sentiment resources cannot perform in the context of social media due to the dialectical content. It was revealed that the performance of sentiment analysis systems strongly depends on pre-processing techniques. We propose that future works should change pre-processing techniques in order to save dialectical texts. Furthermore, we propose to shift from simplistic word level sentiment analysis to concept-based sentiment analysis. The objective is to capture frequently used multi-word expressions in the Arabic space.
Duygu analizi, son zamanlarda yoğun bir şekilde dikkat çeken bir doğal dil işleme uygulamasıdır. Bununla birlikte, duygu analizi araştırmaları çoğunlukla İngilizceye odaklanmıştır. Arapça, dünyada yaygın olarak konuşulan önemli bir dil olmasına rağmen, çok az çalışmada Arapça duygu analizi üzerine odaklanılmıştır. Internet üzerindeki Arapça metinlerin hızla artması ve yanı sıra, Arap ülkelerindeki tüm dünyayı etkileyen son siyasi değişiklikler, Arapça duygu çıkarımını desteklemekte açık bir gereksinim olduğunu göstermektedir. Arapça ile ilgili ana zorluklar, duygu analizi kaynaklarının eksikliği ve Arapça lehçelerin çeşitleridir. Sosyal medyadaki çoğu Arapça yorum lehçeler kullanılarak yapılır. Lehçeler, yapılandırılmamıştır, gramer dışıdır, ve standart kurallara sahip değildir. Bunlar, çevrimiçi yorumların duygu analizi için karmaşık zorluklar doğurmaktadır. Önceki çalışmalar tek dilli ve iki dilli olmak üzere iki yönteme ayrılmaktadır. Tek dilli yöntem, duygu derecesini sınıflandırmak için Arapça duygu kaynaklarına dayanırken, iki dilli yöntem İngilizce kaynaklarına ve çeviri tekniklerine dayanmaktadır. Tek dilli çalışmaların çoğu, lehçeleri ve çevrilmiş metinleri filtrelemekte ve standart Arapça ile sınırlı kalmaktadır. Öte yandan, iki dilli çalışmaları, çeviri teknikleriyle, İngilizce bağlamındaki duygu kaynaklarını Arapça bağlamında kullanmaktadır, ve ayrıca standart Arapça ile sınırlıdırlar. Arapça Duygu Analizi araştırmalarının detaylı bir incelemesinden sonra, mevcut duygu kaynaklarının çoğunluğunun lehçeler nedeniyle sosyal medya bağlamında yeterli olmadığını tespit ettik. Duygu analizi sistemlerinin başarımının kuvvetli bir şekilde ön işleme tekniklerine bağlı olduğu ortaya çıktı. Gelecekteki çalışmaların çok lehçeli metinleri işleyebilmek için ön işleme tekniklerini değiştirmesi gerektiğini öneriyoruz. Ayrıca, basit kelime düzeyi duygu analizinden kavram-temelli duygu analizine geçmeyi öneriyoruz. Bundaki amaç Arapça’da sık kullanılan çok kelimeli ifadeleri yakalamaktır.

Açıklama

Anahtar Kelimeler

NLP, Multilingual Sentiment Analysis, Arabic Dialects, Arabic Sentiment Analysis Challenges, Arabic Sentiment Resources, DDİ, Çok Dilli Duygu Analizi, Arapça Lehçeleri, Arapça Duygu Analizi Zorlukları, Arapça Duygu Kaynakları

Kaynak

Maltepe Üniversitesi Uluslararası Öğrenci Kongresi

WoS Q Değeri

Scopus Q Değeri

Cilt

Sayı

Künye

Oueslatı, O. (2019). Sentiment Analysis research for Arabic dialects / Arapça lehçeleri için duygu analizi araştırması. Maltepe Üniversitesi Uluslararası Öğrenci Kongresi.