به کارگیری یادگیری عمیق برای بهبود نتایج تحلیل احساسات نظرات فارسی فروشگاههای خردهفروشی آنلاین
محورهای موضوعی : فناوری اطلاعات و ارتباطاتفائزه فروتن 1 * , محمد ربیعی 2
1 - کاندیدای دکتری
2 - استادیار
کلید واژه: تحلیل احساسات, زبان فارسی, CNN-BiLSTM, BERT, بازارخردهفروشی,
چکیده مقاله :
صنعت بازار خردهفروشی از جمله صنایع اثرگذار بر اقتصاد کشورها است که حیات آن وابسته به میزان رضایت و اعتماد مشتریان برای خرید از این بازارها میباشد. در چنین شرایطی صنعت بازار خردهفروشی در تلاش است تا بر اساس صفحات وب و پلتفرمهای آنلاین شرایطی را برای ثبت نظرات و تعامل مشتریان با خردهفروشان فراهم آورد. زیرا تحلیل نظرات منتشر شده نه تنها در تعیین میزان رضایت مشتریان بلکه در بهبود و ارتقا محصولات نقش دارند. ازاینرو در سالهای اخیر تکنیکهای تحلیل احساسات به منظور تحلیل و خلاصهسازی نظرات، مورد توجه پژوهشگران در حوزههای مختلف بهویژه صنعت بازار خردهفروشی قرار گرفته است. ازاینرو در این پژوهش با هدف بهبود در نتایج استخراج ویژگیها از متن نظرات فارسی و افزایش دقت تحلیل احساسات فارسی، یک چارچوب جدید برای تحلیل احساسات در سطح جمله، بر اساس BERT، مدل استخراج ویژگی CNN-BiLSTM و مدل طبقهبندی XGBoost پیشنهاد شده است. در نهایت نتایج پژوهش دقت 93.74% را برای طبقهبندی احساسات متن نظرات فارسی؛ بر اساس چارچوب پیشنهادی نشان میدهد که بر اساس آن میتوان اذعان داشت، CNN-BiLSTM از جمله روشهای قدرتمند در استخراج ویژگیها از متن فارسی است که ضمن استخراج دقیق ویژگیها، باعث افزایش دقت تحلیل احساسات فارسی نیز میگردد.
چكيده انگليسيThe retail market industry is one of the industries that affects the economies of countries, the life of which depends on the level of satisfaction and trust of customers to buy from these markets. In such a situation, the retail market industry is trying to provide conditions for customer feedback and interaction with retailers based on web pages and online platforms. Because the analysis of published opinions play a role not only in determining customer satisfaction but also in improving products. Therefore, in recent years, sentiment analysis techniques in order to analyze and summarize opinions, has been considered by researchers in various fields, especially the retail market industry.
]“2020-21 Annual Report | Digikala newsroom.” https://www.digikala.com/mag/lp/report-2020-21/ (accessed Apr. 13, 2022).
[2] S. T K and J. Shetty, “Sentiment Analysis of Product Reviews,” Encycl. Data Warehous. Mining, 2nd Ed., no. Icicct, pp. 1794–1799, 2017, doi: 10.5281/zenodo.264151.
[3] Q. Shen, Z. Wang, and Y. Sun, “Sentiment analysis of movie reviews based on machine learning,” Int. Conf. Intell. Sci. (pp. 164-171). Springer, Cham., 2017, doi: 10.1145/3447490.3447491.
[4] M. Rhanoui, M. Mikram, S. Yousfi, and S. Barzali, “A CNN-BiLSTM Model for Document-Level Sentiment Analysis,” Mach. Learn. Knowl. Extr., vol. 1, no. 3, pp. 832–847, 2019, doi: 10.3390/make1030048.
[5] A. H. Ombabi, W. Ouarda, and A. M. Alimi, “Deep learning CNN–LSTM framework for Arabic sentiment analysis using textual information shared in social networks,” Soc. Netw. Anal. Min., vol. 10, no. 1, pp. 1–13, 2020.
[6] J. P. R. Sharami, P. A. Sarabestani, and S. A. Mirroshandel, “DeepSentiPers: Novel Deep Learning Models Trained Over Proposed Augmented Persian Sentiment Corpus,” 2020, [Online]. Available: http://arxiv.org/abs/2004.05328.
[7] K. Dashtipour, M. Gogate, E. Cambria, and A. Hussain, “A novel context-aware multimodal framework for persian sentiment analysis,” Neurocomputing, vol. 457, pp. 377–388, 2021, doi: 10.1016/j.neucom.2021.02.020.
[8] “All about Persian Language (Farsi) | ASPIRANTUM.” https://aspirantum.com/blog/all-you-need-to-know-about-persian-language (accessed Apr. 13, 2022).
[9] S. Sarmady and E. Rahmani, “Word representation or word embedding in Persian texts,” arXiv, 2017.
[10] E. Asgarian, M. Kahani, and S. Sharifi, “The Impact of Sentiment Features on the Sentiment Polarity Classification in Persian Reviews,” Cognit. Comput., vol. 10, no. 1, pp. 117–135, 2018, doi: 10.1007/s12559-017-9513-1.
[11] R. Ahuja, A. Chug, S. Kohli, S. Gupta, and P. Ahuja, “The impact of features extraction on the sentiment analysis,” Procedia Comput. Sci., vol. 152, pp. 341–348, 2019, doi: 10.1016/j.procs.2019.05.008.
[12] H. Saif, M. Fernandez, Y. He, and H. Alani, “On stopwords, filtering and data sparsity for sentiment analysis of twitter,” Proc. 9th Int. Conf. Lang. Resour. Eval. Lr. 2014, pp. 810–817, 2014.
[13] J. Devlin, M. W. Chang, K. Lee, and K. Toutanova, “BERT: Pre-training of deep bidirectional transformers for language understanding,” NAACL HLT 2019 - 2019 Conf. North Am. Chapter Assoc. Comput. Linguist. Hum. Lang. Technol. - Proc. Conf., vol. 1, no. Mlm, pp. 4171–4186, 2019.
[14] H. Liang, X. Sun, Y. Sun, and Y. Gao, “Text feature extraction based on deep learning: a review,” Eurasip J. Wirel. Commun. Netw., vol. 2017, no. 1, pp. 1–12, 2017, doi: 10.1186/s13638-017-0993-1.
[15] Y. Cheng, L. Yao, G. Xiang, G. Zhang, T. Tang, and L. Zhong, “Text Sentiment Orientation Analysis Based on Multi-Channel CNN and Bidirectional GRU with Attention Mechanism,” IEEE Access, vol. 8, pp. 134964–134975, 2020, doi: 10.1109/ACCESS.2020.3005823.
[16] B. Liu, “Sentiment Analysis and Opinion Mining,” Lang. Arts Discip., no. May, p. 167, 2012.
[17] F. I. Rustam et al., “A performance comparison of supervised machine learning models for Covid-19 tweets sentiment analysis,” 2021, doi: 10.1371/journal.pone.0245909.