پیش بینی ریسک نقدینگی با استفاده از تحلیل تمایلات خبری
محورهای موضوعی : فناوری اطلاعات و ارتباطاتحامد میرشک 1 , امیر البدوی 2 * , مهرداد کارگری 3 , محمد علی رستگار 4 , محمد طالبی 5
1 - دانشجو
2 - دانشگاه تربیت مدرس
3 - استاد دانشگاه
4 - استاد دانشگاه
5 - دانشگاه امام صادق
کلید واژه: پيشبيني ریسک نقدینگي, یادگيري ماشين, تحليل تمایل, تحليل سناریو, روششناسي علم طراحي,
چکیده مقاله :
یکي از م شکلات ا سا س ي بانکهاي ایراني نبود فرآیند مدیریت ری سک با رویکردي آیندهنگر ا ست . از مهمترین این ری سک ها در بانک، ميتوان به ری سک نقدینگي ا شاره کرد ؛ بنابراین پيشبيني ری سک نقدینگي به مو ضوع ي مهم براي بانکها تبدیل شده ا س ت. روشهاي مرسوم اندازه گيري ریسک نقدینگي پيچيده، زمانبر و پرهزینه هستند که پيشبيني آن را نيز غير قابل دسترس نموده اس ت. پيشبيني ریسک نقدینگي در زمان مناسب ميتواند از بروز مشکلات یا بحرانهاي جدي در بانک جلوگيري نماید. در این مطالعه سعي شده است تا راهحلي نوآورانه براي پيشبيني ریسک نقدینگي بانک و سناریوهاي پيشرو با استفاده از رویکرد تحليل تمایلات خبري ارائه شود . از رویکرد تحليل تمایل اخبار پيرامون یکي از بانکهاي ایراني در را ستاي شنا سایي متغيرهاي کيفي پ ویا و مؤثر در ریسککک نقدینگي بهره برده شده تا روشي سادهتر و با کارایي بالاتر براي پيشبيني روند ریسک نقدینگي ارائه نماید. روش پيشنهادي سناریوهاي عملي را براي تص ميمگيرندگان ریسک بانکي در دنياي واقعي فراهم ميکند. س کناریوهاي ریسک نقدینگي به د ست آمده در مقای سه با سنار یوهاي رخ داده در بانک طبق د ستورالعمل کم يته بازل و نظر کار شنا سان بانک ي ارزیابي مي شوند تا از صحت پ يشبينيها و همسو یي آن اطمينان حاصل شود. نتيجه ارزیابي سنار یوهاي موردمطالعه بهصورت دورهاي حاکي از دقت نسبتاً بالا است. معيار دقت 1 پيشبيني در سککناریوهاي محتمل اسککتاراش شده از کميته بازل، 95.5 % و در سککناریوهاي برگرفته از نظرات خبرگان، 75 % است
One of the main problems of Iranian banks is the lack of risk management process with a forward-looking approach, and one of the most important risks in banks is liquidity risk. Therefore, predicting liquidity risk has become an important issue for banks. Conventional methods of measuring liquidity risk are complex, time-consuming and expensive, which makes its prediction far from possible. Predicting liquidity risk at the right time can prevent serious problems or crises in the bank. In this study, it has been tried to provide an innovative solution for predicting bank liquidity risk and leading scenarios by using the approach of news sentiment analysis. The news sentiment analysis approach about one of the Iranian banks has been used in order to identify dynamic and effective qualitative factors in liquidity risk to provide a simpler and more efficient method for predicting the liquidity risk trend. The proposed method provides practical scenarios for real-world banking risk decision makers. The obtained liquidity risk scenarios are evaluated in comparison with the scenarios occurring in the bank according to the guidelines of the Basel Committee and the opinion of banking experts to ensure the correctness of the predictions and its alignment. The result of periodically evaluating the studied scenarios indicates a relatively high accuracy. The accuracy of prediction in possible scenarios derived from the Basel Committee is 95.5% and in scenarios derived from experts' opinions, 75%.
] اصغر ب. استادی, پ. ت. پژو و ه. اشعری, “ارزيابي و ارايه الگوي مناسب براي شناسايي، اندازه گيري و كنترل ريسكهاي مالي در مؤسسات مالي و اعتباري با استفاده از روش ضریب تغییرات (CV),” تیر 95.
[2] F. T. Musakwa, "On measuring bank funding liquidity risk," Actuarial Society of South Africa’s 2013 Convention, pp. 227-247, 2013.
[3] P. G. G.A. Vento, "Bank Liquidity Risk Management and Supervision: Which Lessons from Recent Market Turmoil?," Journal of Money, Investment and Banking, no. 10, pp. 78-125, 2009.
[4] A. A. D. D. C. M. P. M. Tavanaa, "An Artificial Neural Network and Bayesian Network model for liquidity risk assessment in banking," Neurocomputing, vol. 275, pp. 2525-2554, 2018.
[5] L. Matz, "Scenario analysis and stress testing," in Liquidity Risk Measurement and Management, New Jersey, John Wiley & Sons. Inc, 2007, pp. 37-64.
[6] P. G. R. Calabrese, "Estimating bank default with generalised extreme value regression models," The Journal of the Operational Research Society, vol. 66, no. 11, pp. 1783-1792, 2015.
[7] J. M. H. &. Z. X. Bollen, "The Review of Financial Studies," Horizon effects in average returns: The role of slow information diffusion, vol. 29, pp. 2241-2281, 2016.
[8] R. S. J.Y. Campbell, "Cointegration and tests of present value models," Journal of Political Economy, vol. 95, pp. 1062-1088, 1987.
[9] M. L. M. &. N. D. Hagenau, "Automated news reading: Stock price prediction based on financial news using context-capturing features.," Decision Support Systems, vol. 55, pp. 685-697, 2013.
[10] H. C. R.P. Schumaker, "Textual analysis of stock market prediction using breaking financial news: the AZFin text system," ACM Transactions on Information Systems, vol. 27, no. 2, 2009.
[11] K. &. S. N. Nam, "Financial news-based stock movement prediction using causality analysis of influence in the Korean stock market," Decision Support Systems, vol. 117, pp. 100-112, 2019.
[12] T. H. S. K. &. V. J. Nguyen, "Sentiment analysis on social media for stock movement," Expert Systems with Applications, vol. 42, pp. 9603-9611, 2015.
[13] M. &. F. S. Kraus, "Decision support from financial disclosures with deep neural networks and transfer learning," Decision Support Systems, vol. 104, pp. 38-48, 2017.
[14] M.-A. Mittermayr, "Forecasting intraday stock price trends with text mining techniques," Proceedings of the 37th Annual Hawaii International Conference on System Sciences, 2004.
[15] H. C. R.P. Schumaker, "Textual analysis of stock market prediction using breaking: the AZFin text system," ACM Transactions on Information Systems, vol. 2, p. 27, 2009.
[16] D. R. D. Robert A.Jarrowab, "The arbitrage-free valuation and hedging of demand deposits and credit card loans," Journal of Banking and Finance, vol. 22, no. 3, pp. 249-272, 1998.
[17] M. Kumar and G. C. Yadav, "Liquidity Risk Management in Bank ,A Conceptual Framework," AIMA Journal of Management & Research, 2013.
[18] B. C. o. B. Supervision, "Basel III: International framework for liquidity risk measurement, standards and monitoring," BIS.org, Switzerland, 2014.
[19] F. Musakwa, "Measuring Bank Funding Liquidity Risk," 2013. [Online]. Available: https://www.actuaries.org/lyon2013/papers/AFIR_Musakwa.pdf.
[20] B. C. O. B. Supervision, "Principles for Sound Liquidity Risk Management and Supervision," Bank for International Settlements, 2008.
[21] Neurocomputing, "Neural networks: An overview of early research, current frameworks and new challenges," Alberto Prieto,Beatriz Prieto, Eva Martinez, Ortigosa Eduardo, Ros Francisco, Pelayo Julio,OrtegaIgnacio Rojas, vol. 214, pp. 242-268, 2016.
[22] L. H. Z. G. Lian Duan, "Global robust dissipativity of interval recurrent neural networks with time-varying delay and discontinuous activations," Chaos: An Interdisciplinary Journal of Nonlinear Science, vol. 26, no. 7, pp. 073101-12, 2016.
[23] J. C. X. A. A. T. H. Chengdai Huang, "Bifurcations in a delayed fractional complex-valued neural network," Applied Mathematics and Computation, vol. 292, pp. 210-227, 2017.
[24] Z. W. X. L. N. Z. Y. L. F. E. Weibo Liu, "A survey of deep neural network architectures and their applications," Neurocomputing, vol. 234, pp. 11-26, 2017.
[25] K. Akyol, "Comparing of deep neural networks and extreme learning machines based on growing and pruning approach," Expert Systems with Applications, vol. 140, p. 112875, 2020.
[26] X. L. Yihao Zhang, "Learning attention embeddings based on memory networks for neural collaborative recommendation," Expert Systems with Applications , vol. 183, 2021.
[27] I. S. Sara Kavian, "Application of complex systems topologies in artificial neural networks optimization: An overview," Expert Systems with Applications, vol. 180, p. 115073, 2021.
[28] K. C. Ankit Thakkar, "A comprehensive survey on deep neural networks for stock market: The need, challenges, and future directions," Expert Systems With Applications , vol. 177, no. 114800, 2021.
[29] D. V. Shayanfar Nima, "An Intelligent News Based Decision Support System for Trading Stocks in Tehran Stock Exchange," Journal of Soft Computing and Information Technology, vol. 4, no. 3, pp. 55-61, 2014.
[30] A. H. Clemens Nopp, "Detecting Risks in the Banking System by Sentiment Analysis," in Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing, Association for Computational Linguistics, 2015.
[31] P. P. A. M. A. A. Hai Ha Do, "DEEP LEARNING FOR ASPECT-BASED SENTIMENT ANALYSIS: A COMPARATIVE REVIEW," Expert Systems With Applications, vol. 118, pp. 272-299, 2019.
[32] A. Paraboni, M. RighX, K. Vieira and V. da Silveira, "The Relationship between Sentiment and Risk in Financial Markets," BAR- Brazilian Administration Review, 2018.
[33] D. Chong, L. Li, H. Wu, J. Park, H. Shi and G. Yan, "Social Media Sentiment and Bank Loan," Journal of Industrial Integration and Management, 2018.
[34] W. He, S. Zha and L. Li, "Social media competitive analysis and text mining: A case study," International Journal of Information Management, p. 464–472, 2013.
[35] E. Altman, "Financial ratios, discriminant analysis and the prediction of corporate bankruptcy," The journal of finance, p. 589–609, 1968.
[36] R. Nyman, "Measuring Financial Sentiment to Predict Financial Instability: A New Approach based on Text Analysis," Centre for the Study of Decision Making Uncertainty, University College, London, 2015.
[37] C. E.-S. Yu, "Sentiment Analysis for Credit Risk and Portfolio Construction," 2020.
[38] M. &. Y. G. C. Kumar, "Liquidity Risk Management in Bank,A Conceptual Framework," AIMA Journal of Management & Research, 2013.
[39] C. Erlwein-Sayer, "Macroeconomic News Sentiment: Enhanced Risk Assessment for Sovereign Bonds," MDPI RISK, p. 141, 2018.
[40] A. H. A. M. Jan vom Brocke, "Introduction to Design Science Research," Springer International Publishing, pp. 1-13, 2020.
[41] A. M. S. P. J. &. R. S. Hevner, " Design Science in Information Systems," MIS Quarterly, vol. 28, no. 1, pp. 75-105, 2004.
دو فصلنامه علمي فناوري اطلاعات و ارتباطات ایران | سال پانزدهم، شماره 55 و56 ، بهار و تابستان 1402 صفحات: 258 الی273 |
|
Liquidity Risk Prediction Using News Sentiment Analysis
Hamed Mirashk*, Amir Albadvi**, Mehrdad Kargari***, Mohammad Ali Rastegar****, Mohammad Talebi*****
* PhD student, Faculty of Industrial and Systems Engineering, Information Technology Engineering Department, Tarbiat Modares University, Tehran, Iran
** Professor, Faculty of Industrial and Systems Engineering, Information Technology Engineering Department, Tarbiat Modares University, Tehran, Iran
*** Associate Professor, Faculty of Industrial and Systems Engineering, Information Technology Engineering Department, Tarbiat Modares University, Tehran, Iran
**** Assistant Professor, Faculty of Industrial and Systems Engineering, Information Technology Engineering Department, Tarbiat Modares University, Tehran, Iran
*****Professor, Faculty of Management, Imam Sadegh University, Tehran, Iran
Abstract
One of the main problems of Iranian banks is the lack of risk management process with a forward-looking approach, and one of the most important risks in banks is liquidity risk. Therefore, predicting liquidity risk has become an important issue for banks. Conventional methods of measuring liquidity risk are complex, time-consuming and expensive, which makes its prediction far from possible. Predicting liquidity risk at the right time can prevent serious problems or crises in the bank.
In this study, it has been tried to provide an innovative solution for predicting bank liquidity risk and leading scenarios by using the approach of news sentiment analysis. The news sentiment analysis approach about one of the Iranian banks has been used in order to identify dynamic and effective qualitative factors in liquidity risk to provide a simpler and more efficient method for predicting the liquidity risk trend. The proposed method provides practical scenarios for real-world banking risk decision makers. The obtained liquidity risk scenarios are evaluated in comparison with the scenarios occurring in the bank according to the guidelines of the Basel Committee and the opinion of banking experts to ensure the correctness of the predictions and its alignment. The result of periodically evaluating the studied scenarios indicates a relatively high accuracy. The accuracy of prediction in possible scenarios derived from the Basel Committee is 95.5% and in scenarios derived from experts' opinions, 75%.
Keywords: Liquidity risk prediction, machine learning, sentiment analysis, scenario analysis, design science rese
پیشبینی ریسک نقدینگی با استفاده از تحلیل تمایلات خبری
حامد میرشک*، امیر البدوی**1، مهرداد کارگری***، محمد علی رستگار****، محمد طالبی*****
*دانشجوی دکترا، دانشکده مهندسی صنایع و سیستمها، گروه مهندسی فناوری اطلاعات، دانشگاه تربیت مدرس، تهران، ایران
**استاد، دانشکده مهندسی صنایع و سیستمها، گروه مهندسی فناوری اطلاعات، دانشگاه تربیت مدرس،تهران، ایران
***دانشیار، دانشکده مهندسی صنایع و سیستمها، گروه مهندسی فناوری اطلاعات، دانشگاه تربیت مدرس،تهران، ایران
****استادیار، دانشکده مهندسی صنایع و سیستمها، گروه مهندسی فناوری اطلاعات، دانشگاه تربیت مدرس،تهران، ایران
***** استاد، دانشکده مدیریت، دانشگاه امام صادق، تهران، ایران
تاریخ دریافت: 22/05/1401 تاریخ پذیرش: 09/09/1401
نوع مقاله: پژوهشی
چكیده
یکی از مشکلات اساسی بانکهای ایرانی نبود فرآیند مدیریت ریسک با رویکردی آیندهنگر است. از مهمترین این ریسکها در بانک، میتوان به ریسک نقدینگی اشاره کرد؛ بنابراین پیشبینی ریسک نقدینگی به موضوعی مهم برای بانکها تبدیلشده است. روشهای مرسوم اندازهگیری ریسک نقدینگی پیچیده، زمانبر و پرهزینه هستند که پیشبینی آن را نیز غیر قابل دسترس نموده است. پیشبینی ریسک نقدینگی در زمان مناسب میتواند از بروز مشکلات یا بحرانهای جدی در بانک جلوگیری نماید.
در این مطالعه سعی شده است تا راهحلی نوآورانه برای پیشبینی ریسک نقدینگی بانک و سناریوهای پیشرو با استفاده از رویکرد تحلیل تمایلات خبری ارائه شود. از رویکرد تحلیل تمایل اخبار پیرامون یکی از بانکهای ایرانی در راستای شناسایی متغیرهای کیفی پویا و مؤثر در ریسک نقدینگی بهره برده شده تا روشی سادهتر و با کارایی بالاتر برای پیشبینی روند ریسک نقدینگی ارائه نماید. روش پیشنهادی سناریوهای عملی را برای تصمیمگیرندگان ریسک بانکی در دنیای واقعی فراهم میکند. سناریوهای ریسک نقدینگی بهدستآمده در مقایسه با سناریوهای رخ داده در بانک طبق دستورالعمل کمیته بازل و نظر کارشناسان بانکی ارزیابی میشوند تا از صحت پیشبینیها و همسویی آن اطمینان حاصل شود. نتیجه ارزیابی سناریوهای موردمطالعه بهصورت دورهای حاکی از دقت نسبتاً بالا است. معیار دقت1 پیشبینی در سناریوهای محتمل استخراج شده از کمیته بازل، 95.5% و در سناریوهای برگرفته از نظرات خبرگان، 75% است.
[1] نویسنده مسئول:امیرالبدوی albadvi@modares.ac.ir
واژگان کلیدی: پیشبینی ریسک نقدینگی، یادگیری ماشین، تحلیل تمایل، تحلیل سناریو، روششناسی علم طراحی
1. مقدمه
بانکها و مؤسسات مالی بدون پذیرش ریسک قادر به بقا، رشد و سودآوری نیستند. پذیرش ریسک در فعالیتهای اقتصادی یکی از الزامات غیرقابلانکار است و با سودآوری رابطه مستقیمی دارد. نظام بانکی با ریسکهای مختلفی مانند ریسک نقدینگی، ریسک اعتباری، ریسک بازار، ریسک عملیاتی، ریسک نرخ بهره، ریسک سودآوری و انواع دیگر ریسک مواجه است. لذا امروزه شناسایی، اندازهگیری، کنترل و کاهش انواع ریسکها و تهدیدات برای بانکها اهمیت ویژهای دارد و این مؤسسات باید ریسکهایی را که میپذیرند، مدیریت کنند. ]1[
یکی از ریسکهای مهم در حوزه بانکی ریسک نقدینگی است. درواقع اجماع نظر در خصوص تعریف ریسک نقدینگی به دلیل ماهیت مبهم و غیرقطعی آن وجود ندارد. ماهیت غیرقطعی آن از تعاریف گوناگون بر اساس زمینه استفاده نشأت میگیرد و به دلیل کاربرد اصطلاح ریسک نقدینگی در حوزههای مختلف ابهامبرانگیز است مثلاً ریسک
نقدینگی بازار یا ریسک نقدینگی سیستماتیک.]2[ بهعنوانمثال ریسک نقدینگی میتواند مرتبط با توانایی نقدشوندگی داراییها بدون زیان در سرمایه و در کمترین زمان ممکن و یا در بازارهای مالی عمدهفروشی مرتبط با ناتوانی در افزایش تأمین مالی موردنیاز تعریف نمود ]3[
ریسک نقدینگی دارای یک تناقض ذاتی در ایفای تعهدات به سهامداران و سرمایهگذاران (سپردهگذاران) بانک است. این مشکل درواقع بانکها را در ایجاد موازنه بین سودآوری (سهامداران) در سرمایهگذاریهای بلندمدت و ریسک ناشی از تعهدات کوتاهمدت (سرمایهگذاران) دچار مشکل میکند. درواقع مدیریت فعالیتهای بانکها زمانی که برداشت یا بستن سپردهها زودتر از موعد صورت میپذیرد، پراهمیت و پیچیده میشود. ]4[
بهصورت کلی وامهایی که بانکها پرداخت میکنند، داراییهایی با نقد شوندگی کم محسوب میشوند. از طرفی بیشتر منابع بانکها را، سپردههای کوتاهمدت شامل میشوند. ازاینرو ریسک نقدینگی در بانکها پدیدهایست که غالباً اتفاق میافتد. نقدینگی زیاد، موجب استفاده غیر مؤثر از منابع بانک و نقدینگی کم نیز سبب کاهش نرخ سود سپردهها، از دست دادن مشتریان، خدشه به اعتبار بانک و بالا رفتن بدهیها و نهایتاً ورشکستگی بانک میشود. بهعبارتدیگر؛ نقدینگی کم بهیکباره و نقدینگی زیاد بهآرامی سبب ورشکستگی بانک میشود.]5[
ریسک نقدینگی با عوامل متعددی مانند ریسک عملیاتی، کیفیت اعتبارات، تکیه بیشازحد به وامهای کوتاهمدت، تکیه بیشازحد به سپردهگذاران حساس به شهرت بانک، ریسک بازار و موارد دیگر در ارتباط است.]6[ ازآنجاکه وضعیت نقدینگی آینده یک بانک عموماً تحت تأثیر عواملی قرار میگیرد که همیشه نمیتوان آن را بهطور دقیق پیشبینی کرد، میبایست از روشهایی برای تخمین این عوامل و تأثیر آن بر ریسک نقدینگی استفاده نمود.
بهعلاوه، بازارهای مالی غالباً توسط اطلاعات ناهمگن و مسائل رفتاری مانند احساسات بازار و رفتارهای سوداگرانه/غیرمنطقی و نه عوامل اساسی هدایت میشوند. ازاینرو با توجه به تأثیر ریسک بازار و تغییرات آن، بررسی و تحلیل تغییرات، احساسات و رفتارهای مالی در بازارهای مالی میتواند در پیشبینی ریسک نقدینگی نقش بسزایی داشته باشد. تحلیل این اطلاعات از رسانههای ارتباطی متنوع مانند اخبار و دادههای سری زمانی از منابع رسمی، نقش بسزایی در پیشبینی دارد.]7[ اگر اخبار مالی اطلاعاتی جدید ارائه دهد که منجر به تعدیل انتظارات در مورد جریانهای نقدی بانک یا نرخ تنزیل سرمایهگذاران شود، بر بازده سهام تأثیر میگذارد]8[. نمودارهای مالی و ویژگیهای کیفی مستخرج از اخبار تأثیر بر قیمت بازار دارد. ]9[
تحلیل روزانه اخبار برای پیشبینی روند بهصورت دستی، کاری طاقتفرسا است، به همین دلیل از روشهای متنکاوی میتوان جهت تحلیل خبر استفاده نمود. روشهای متنکاوی جهت تحلیل و پیشبینی سهام از اخبار یکی از مؤثرترین روشهای موجود است.
یکی از مسائل مهم در متنکاوی، مسئله بازنمایی ویژگی2 است. این مسئله کماکان جز موضوعات تحقیقاتی باز است. بازنمایی ویژگیهای متنی مرتبط با نحوه مواجه و استفاده از متون میباشد.]10[ بهعنوانمثال روش کوله کلمات3]11[، انگرام4]9[، مدلسازی موضوع5]12[ و تعبیهسازی کلمات6]13[ کاربردهای زیادی در این حوزه دارند. یکی از تکنیکهای مورداستفاده در بازنمایی متون، روش کوله کلمات است که متن را مجموعهای از کلمات تکی بدون ترتیب میداند. هر کلمه بهعنوان یک ویژگی، بازنمایی متن را تشکیل میدهد. دو روش دیگر در بازنمایی متن، TFIDF ]14[ و تکرار یا فرکانس کلمات7]15[ است که در پیشبینی قیمت سهام بکار گرفتهشدهاند.
تأثیر عوامل داخلی در بسیاری از مطالعات قبلی بررسیشده است. ولی در این مطالعه، هدف بررسی تأثیر عوامل کیفی پویا در مدل یادگیری بهمنظور پیشبینی روند ریسک نقدینگی است. منشأ عوامل پویا میتواند از تغییرات سیاسی، قوانین، تغییرات بازار منجمله بازار سهام، کالا یا سایر بازارها باشد. مهمترین منبع در بررسی این دسته از عوامل محیطی، اخبار یا تمایلات جامعه است. همچنین تأثیر اخبار بهعنوان یک عامل مهم در ریسک نقدینگی نیز مشهود است به آن معنی که شرایط سیاسی، اقتصادی بر تمایلات افراد بر سپردهگذاری سرمایهگذاران، نکول یا عدم نکول وامگیرندگان تأثیر بسزایی دارد. لذا با توجه به اهمیت این موضوع و عدم بررسی تأثیر عوامل کیفی در مطالعات قبلی، خلأ تحقیقاتی این حوزه شناساییشده و در این مقاله سعی شده است تا روشی برای تأثیر عوامل کیفی (اخبار) بر مدل کمی ریسک نقدینگی پیشنهاد شود.
مسئله اصلی این مطالعه پیشبینی ریسک نقدینگی بانک، با بهکارگیری روشی نوآورانه به جهت تخمین و تحلیل سناریوهای ریسک نقدینگی بانک و انجام اقدامات متناسب با وضعیت ریسک بانک است. پیشبینی سناریوهای احتمالی ریسک نقدینگی در بانکها به یک امر حیاتی مبدل شده است، بهطوریکه کمیته بال بهعنوان کمیته پیشرو در حوزه تبیین رهنمودها و الزامات ریسکهای مالی در بانکها، تحلیل سناریوها و برنامهریزی برای اقدامات مناسب را راهکاری الزامی برای بانکها دانسته است. همچنین روشهای مرسوم جهت پیشبینی ریسک نقدینگی امکان ارائه نتایج را در زمان قابلقبول ندارند، ازاینرو بهکارگیری روش نوآورانه برای حل مسئله حائز اهمیت است.
در ادامه در بخش دوم بهمرور پیشینه پژوهش و مطالعات قبلی در حوزه پیشبینی ریسک پرداخته میشود. سپس در بخش سوم روش پیشنهادی برای پیشبینی ریسک نقدینگی مبتنی بر DSR8 تشریح میگردد. در بخش بعد نتایج مطالعه ارائهشده و نهایتاً جمعبندی میگردد.
2. پیشینه پژوهش
2. 1 پیشبینی ریسک نقدینگی با رویکرد تحلیل تمایل و یادگیری ماشین
در این مطالعه، از روشهای یادگیری ماشین یا روشهای پردازش متن جهت بررسی تأثیر عوامل کیفی بر ریسک نقدینگی و پیشبینی ریسک نقدینگی استفاده شده است. در ادامه بهمرور ادبیات و مطالعات انجامشده در این خصوص میپردازیم.
تحلیل تمایل بهعنوان یک رویکرد در حوزه پردازش زبان طبیعی به بررسی احساسات و شناسایی تمایلات از دادههای متنی و بصری (عکس) میپردازد. هدف نظرکاوی (تحلیل تمایل) اين است که حجم انبوهي از نظرات پيرامون يک موضوع توسط ماشين بررسی و گزارش خلاصهای از احساسات بیانشده، به کاربر ارائه گردد. براي دستيابي به اين هدف تکنیکهای آماري، دادهکاوی و پردازش زبان طبيعي مورداستفاده قرار میگیرند.
در مطالعه مروری که توسط هالها و همکاران صورت پذیرفت، روشهای مختلف استخراج اطلاعات و تحلیل تمایل مبتنی بر ویژگی9 بررسیشده است. هدف از این مطالعه، شناسایی ویژگیها یا موضوعات و قطبیت یا تمایل حول ویژگی یا موضوع در متن است. نمونه این موضوعات میتواند محصول، خدمت، مسئله، اشکال، فرد، سازمان و وقایع باشد. این مطالعه به بررسی الگوریتمهای متنوعی همچون DNN، RNN، CNN ،RecNN پرداختهاست.]31 [در مطالعه انجام شده توسط تاکان و همکاران از 9 الگوریتم شبکه یادگیری عمیق برای پیشبینی سهام در بازار استفاده شد.]28[ همچنین در مطالعهای توسط شایان فر و همکاران تأثیر خبر بر پیشبینی سهام توسط الگوریتم SVM بررسی شد.]29[
در مطالعه صورت گرفته توسط پارابونی و همکاران برای محاسبه تمایلات بازار از پروکسی مبتنی بر فعالیت سرمایهگذار در شبکههای اجتماعی استفاده شده است. در این پروکسی از فناوری سایک سیگنال10 با لحاظ کردن دادهی پیامها در شبکههای اجتماعی، استفاده شد. این شاخص درواقع احساسات افراد را منعکس میکند.]32[
چونگ و همکاران به تحلیل چگونگی تأثیر شبکههای اجتماعی بر انعقاد قرارداد وام بانکی میپردازد. بدین منظور با استفاده از 642 نمونه قرارداد وام بانکی در ایالاتمتحده فرض میکند که شبکههای اجتماعی میتوانند انتشار اطلاعات را تقویت کرده و نابرابری اطلاعات بین وامگیرندگان و وامدهندگان را کاهش دهند.]33[ شبکههای اجتماعی بهعنوان یک فناوری جدید به بنگاهها اجازه میدهند تا اطلاعات بهصورت دوسوبه بین کاربران و بنگاههای مالی از طریق ارسال نامهها، پیام مستقیم و غیره به سرمایهگذاران یا مشتریان جریان یابد].34[
در مطالعه دیگری که در حوزه بررسی سلامت و مشکلات مالی بانکها انجامشده است، با استفاده از رویکرد تحلیل تمایل و کاربرد شبکه یادگیری عمیق، روشی برای ارزیابی مشکلات مالی شرکت ارائهشده است. در این مطالعه پتانسیل استخراج تمایلات از بخشهای متنی گزارشهای مدیریتی موردبررسی قرارگرفته و شناسایی سیگنالهای مشکلات مالی صورت گرفته است. ]35[
سی شی و همکاران به بررسی روشهای مختلفی برای ارزیابی ریسک اعتباری با استفاده از الگوریتمهای یادگیری ماشین پرداختهاند. این بررسی نشان میدهد که الگوریتمهای یادگیری عمیق از سایر الگوریتمهای یادگیری ماشین یا روشهای آماری بهتر عمل میکنند.]44 [در مطالعه دیگری، اریک گایسلز و همکاران از مدلهای بهینهسازی ریاضی و تفاوت عرضه و تقاضا استفاده و مدلی برای ایجاد توازن بین ریسک نقدینگی و بازدهی در بازار سهام ارائه نمودند.]46[
در ادامه در جدول 1 به دستهبندی مقالات مروری این مطالعه پرداخته میشود. موضوع مقالات و شرح روش هرکدام به تفکیک حوزه یا طبقهبندی مقالات اشارهشده است. بهصورت کلی مقالات در 6 حوزه کلی طبقهبندی شدهاند که شامل تحلیل ریسک نقدینگی، تحلیل تمایل در مدیریت ریسک، تحلیل تمایل در ریسک اعتباری و بازار، تحلیل تمایل در مدیریت ریسک شرکت و روشهای تحلیل تمایل مبتنی بر یادگیری عمیق است. بررسی مقالات و روشهای استفاده شده حاکی از آن است که روشهای مرسوم برای پیشبینی ریسک نقدینگی پیچیده و زمانبر است و همچنین استفاده از تحلیل تمایل در ارزیابی انواع ریسکهای بانکی با روشهای متنوع اگرچه قدیمی ولی مؤثر است. در مطالعه مروری توسط سوانکی در حوزه کاربرد هوش مصنوعی در مدیریت ریسک، خلأ تحقیقاتی در استفاده از هوش مصنوعی برای پیشبینی سطح ریسک نقدینگی شناسایی شدهاست.]42[ تأثیر پارامترهای مؤثر کیفی از اخبار در پیشبینی ریسک نقدینگی با توجه به پیچیدگی محاسباتی آن مشهود است که در این مطالعه تلاش شده است از این منظر ریسک نقدینگی بانک بررسی شود.
جدول 1: دستهبندی مقالات مروری پژوهش
حوزه | موضوع مقاله | روش | سال |
تحلیل ریسک نقدینگی
| مدل شبکه عصبی مصنوعی و شبکه بیزی برای ارزیابی ریسک نقدینگی در بانک | پیش بینی ریسک نقدینگی مبتنی بر عوام مؤثر خرد و کلان در بانک]4[ | 2018 |
مطالعه برآورد مدل پیش بینی ریسک نقدینگی مالی با استفاده از تحلیل مالی | بررسی نسبت های مالی مؤثر در پیش بینی ریسک نقدینگی با استفاده از ANOVA و تحلیل رگرسیون]21[ | 2017 | |
یادگیری ماشین برای مدلسازی ریسک نقدینگی: دیدگاه نظارتی | ارائه مدلی برای ارزیابی ریسک نقدینگی بانک با استفاده از روشهای یادگیری ماشین در سناریوهای بحرانی]43[ | 2022 | |
شاخص هشدار اولیه ریسک نقدینگی برای بانک های ایتالیایی: رویکرد یادگیری ماشینی | سیستم هشدار اولیه برای شناسایی ریسک نقدینگی قبل از بحران با استفاده از الگوریتم های مختلف پیش بینی LASSO، جنگل تصادفی، XGBOOST و ترکیب آنها]45[ | 2021 | |
تحلیل تمایل در مدیریت ریسک
| شناسایی ریسک ها در بانک با استفاده از تحلیل تمایل | استفاده از رویکرد تحلیل احساسات برای شناسایی ریسک در بانک]30[ | 2015 |
متن کاوی و گزارش کیفت در بانک های آلمان: یک تحلیل همزمان و تمایل | بررسی کیفیت گزارش های مالی با استفاده از تحلیل احساسات در بانک های آلمانی]22[ | 2018 | |
گزارش ریسک بانک های آلمانی: بررسی استاندارد صنعت | بررسی گزارش های مالی توسط بانک های مالی: با استفاده از روش های استاندارد]23[ | 2014 | |
شناسایی عوامل ریسک بانکی از صورت های مالی | شناسایی عوامل ریسک از صورت های مالی با استفاده از روش های متن کاوی]24[ | 2019 | |
تحلیل تمایل در ریسک اعتباری و مدیریت وام | تحلیل تمایل برای ریسک اعتباری و ساخت پرتفوی | طراحی سیستم پشتیبان تصمیمگیری جهت ارزیابی ریسک اعتباری با استفاده از تحلیل تمایل گزارشات، شبکه اجتماعی و عوامل کمی]37[ | 2020 |
تصمیم گیری مبتنی بر داده در مدیریت ریسک اعتباری: ارزش اطلاعاتی گزارشهای تحلیلی | استفاده از تحلیل تمایل جهت بررسی گزارش های تحلیلی مالی و شناسایی ارتباط معنا دار بین شاخص ریسک اعتباری، اخبار و گزارش های تحلیلی]26[ | 2020 | |
تمایلات در شبکههای اجتماعی و قرارداد وام بانکی | کاهش نابرابری اطلاعاتی بین وام دهنده و وام گیرنده با ایجاد شفافیت و انتشار اطلاعات با استفاده تحلیل امتیاز افراد در شبکه های اجتماعی]33[ | 2018 | |
تحلیل تمایل در مدیریت ریسک بازار
| رابطه بین تمایلات و ریسک در بازارهای مالی | ارتباط بین معیارهای تمایل بازار و ریسک را با استفاده از فناوری Psych Signal که مبتنی بر رفتار سرمایه گذاران در شبکه های اجتماعی است، برآورد می کند.]32[ | 2018 |
سامانه پشتیبانی تصمیم گیری مبتنی بر اخبار برای معاملات سهام در بورس تهران | استفاده از متن کاوی برای استخراج ویژگی از اخبار و انتخاب موثرترین ویژگیها و طبقه بندی با استفاده از ماشین بردار پشتیبان (SVM) بهعنوان روند مثبت یا منفی]29[ | 2015 | |
تحلیل تمایل در مدیریت ریسک شرکت | تأثیر تمایلات رسانهای بر ریسک شرکت، سرمایه گذاری شرکتی و سیاستهای مالی | ارتباط بین تمایلات رسانهای و اقدامات تصمیمگیری شرکتی را بررسی میکند که ریسک شرکت، سرمایهگذاری شرکتی و سیاست مالی را در بر میگیرد.]27[ | 2018 |
روش های تحلیل تمایل مبتنی بر یادگیری عمیق | یادگیری عمیق برای تحلیل تمایل: بررسی مقایسه ای | تحلیل تمایلات، بهبود جزئیات در سطح جنبه است، که دو هدف متمایز را نشان می دهد: استخراج جنبه و طبقه بندی احساسات بررسی های محصول و طبقه بندی احساسات توییت ها.]31[ | 2019 |
2. 3 شناسایی پارامترهای پیشبینی ریسک نقدینگی با استفاده از تحلیل تمایل
در ادامه به بررسی پارامترهایی که برای تحلیل ریسک نقدینگی بانکها با رویکرد تحلیل تمایل استفاده شده است، اشاره میگردد.
· نیمان و همکاران متغیر بحران مالی11 را بررسی کردند. بحرانهای مالی تا حد زیادی از طریق اخبار و شبکههای اجتماعی قابل تخمین هستند، پس میتوان تأثیر نظرات افراد در شبکههای اجتماعی را بر بحران مالی و پیشبینی آن با رویکرد تحلیل تمایلات افراد پیش برد.]36[
· یکی از کاربردهای تحلیل تمایل در ریسک اعتباری است. یور و همکاران تمایلات اخبار اقتصادی کلان و شبکههای اجتماعی را با ساخت سری زمانی تاریخی برای ایجاد یک ابزار ارزیابی ریسک اعتباری ترکیب نمودند. ]37[
· در مطالعه صورت گرفته توسط کومار و همکاران از تحلیل تمایل برای پیشبینی نرخ سود بانکی با استفاده از پارامترهای غیر بانکی استفاده شده است. این رویکرد متکی به طراحی و توسعه یک سیستم بازیابی اطلاعات است که قادر به استخراج دایرکتوری اخبار آنلاین و محاسبه امتیاز تمایلات رویدادهای خبری است. ]38[
· بر اساس نتایج بهدستآمده از مطالعه الروین و همکاران احساسات خبری کلان، بر نوسانات سهام، بر نوسانات انتشار اوراق قرضه بهویژه در اقتصادهای باثبات تأثیر میگذارد. تصمیمات سیاسی، اقتصادی و رویدادهای خبری تأثیر فوری بر اوراق قرضه حاکمیتی دارند.]39[
· از منظر دیگر ریسک بازار یکی دیگر از انواع ریسک است که بهصورت غیرمستقیم بر ریسک نقدینگی تأثیرگذار است. مطالعه انجامشده توسط پارابونی و همکاران نشان داد که یکی از روشهای شناسایی ریسک بازار استفاده از رویکرد تحلیل تمایل از طریق رصد اخبار و رویدادهای تأثیرگذار در بازار است.]32[
3. روششناسی
این مطالعه از روششناسی پژوهشی علم طراحی یا بهاختصار DSR استفاده نموده است. (DSR) یک پارادایم حل مسئله است که به دنبال ارتقای دانش بشر از طریق ایجاد مصنوعات نوآورانه است. به بیان ساده، DSR به دنبال تقویت پایگاههای دانش فناوری و علم از طریق ایجاد مصنوعات بدیع است که مشکلات را حل نماید و محیطی را که در آن نمونهسازی شده است را بهبود بخشد. نتایج DSR هم شامل مصنوعات جدید طراحیشده و هم دانش طراحی (DK12) میشود.]40[
شکل 1 یک چارچوب مفهومی را برای درک، اجرا و ارزیابی روششناسی پژوهش علم طراحی نشان میدهد.]41[
شکل 1: چارچوب روششناسی پژوهش علم طراحی ]41[
3. 1 شمای کلی پژوهش مبتنی بر DSR در فاز طراحی
همانطور که در شکل 2 شمای کلی پژوهش در فاز طراحی DSR نمایش دادهشده است، منابع یا دادههای ورودی شامل اخبار و دادههای تاریخی نسبت شاخص پوشش نقدینگی بانکی است. سپس ویژگیهای کیفی از دادههای خبری متنی با استفاده از روشهای استخراج ویژگی در متنکاوی13 استخراجشده و این ویژگیها برای استفاده در مرحله بعدی موردبررسی قرار میگیرد.
در بخش بعدی دادههای ورودی پالایش و پاکسازی شده، ویژگیهای استخراجشده بررسی و در صورت نیاز با استفاده از روشهای مهندسی ویژگی14، ویژگیها یا ابعاد آن برای ورود به مدل تغییر میکند. همچنین دادههای کمی نسبت پوشش نقدینگی بانک موردمطالعه که بهصورت سری زمانی است، جهت بهکارگیری در مدل پیشبینی روند نیازمند تغییراتی است. قطبیت یا تمایلات اخبار از دادههای کمی سری زمانی که بهنوعی برچسب اخبار ماهانه محسوب میشود، شناسایی میگردد.
پس از استخراج ویژگیها و شناسایی قطبیت اخبار، جهت تحلیل تمایل دادههای خبری، با استفاده از الگوریتم شبکه عصبی طبقهبندی چند کلاسه15 جهت یادگیری روند تغییرات شاخص ریسک نقدینگی با توجه به اخبار ماهقبل، روند شاخص در ماه پیشرو پیشبینی شود. در این مرحله با استفاده از تنظیم و انتخاب هایپرپارامترها در مدل بهترین خروجی یا پیشبینی ارائه میگردد.
همانطور که در شکل 2 دیده میشود، ویژگیهای انتخابشده در الگوریتم یادگیری عمیق برای تولید خروجی مورد انتظار یا پیشبینی شاخص ریسک نقدینگی مورداستفاده قرار میگیرد. این مطالعه در فاز طراحی و نمونهسازی اولیه DSR بهصورت کلی در 7 مرحله بیان میشود. در ادامه به چگونگی یا نحوه جمعآوری، آمادهسازی (پیشپردازش) و ساخت مدل پرداخته میشود. در انتها با ارائه نتایج بهدستآمده ارزیابی مدل موردبررسی قرار میگیرد.
مراحل کلی روش انجام مطالعه:
1. جمعآوری متون خبری
2. پردازش اولیه و پاکسازی متن
3. دستهبندی کلی موضوعی اخبار
4. استخراج کلیدواژههای متن
5. تشخیص قطبیت یا برچسبگذاری
6. تحلیل تمایل مبتنی بر ویژگیهای استخراجی با استفاده از شبکه عصبی و یادگیری عمیق
7. ارزیابی نتایج
این مطالعه از اخبار خبرگزاری کثیرالانتشار الکترونیکی فارس نیور استفاده مینماید. دادههای خبری از نوع متن دیجیتال و به زبان فارسی میباشند. دادهها از خبرگزاری آنلاین با استفاده از روش خراشیدن وب16 جمعآوریشده است. برای این کار از کتابخانه requests و BS4 در پایتون استفاده شد. به شکلی که با استفاده از تابع requests.get() و ارسال URL مربوط به سایت موردنظر، محتوای پیج دریافت شده و سپس با استفاده از کتابخانه BS4 و با استفاده از Beautiful Soap، الگوهای موردنظر برای استخراج عنوان، خلاصه و شرح خبر به همراه زمان خبر استفاده شد. برای خزیدن سایت موردنظر از امکانات سرورهای ابری استفاده شد.
3. 2 متغیرهای پژوهش
در این تحقیق از شاخص نسبت پوشش نقدینگی برای محاسبه ریسک نقدینگی استفاده شده است که کمیته نظارت بانکی بال دو برای محاسبه ریسک نقدینگی آن را معرفی کرده است.
نسبت پوشش نقدینگی: یکی از دو روش استاندارد کمیته نظارتی بال است.]20[ این نسبت نشان میدهد بانک توان پوشش خالص جریانهای خود طی 30 روز آتی را از محل دارائیهای نقد باکیفیت خود دارا است یا خیر و بهصورت ذیل تعریف میشود:
| (1) |
خالص جریانهای خروجی طی 30 روز آتی = جریانهای ورودی طی 30 روز آتی – جریانهای خروجی طی 30 روز آتی
شکل 3: تأثیر متغیرهای کیفی بهعنوان عامل تأثیر گزار پویا در پیشبینی ریسک نقدینگی
سه عامل در محاسبه نسبت پوشش نقدینگی نقش مهمی دارد. 1) ارزش داراییهای نقد (داراییهایی که نقد شوندگی بالا دارند) که صورت کسر را تشکیل میدهد. 2) نرخ مازاد که بین طبقه بدهیها و داراییها شناسایی میشود 3) تقسیم سپردههای درخواستی به بخش اصلی یا فرار و اعمال ضرائب هر بخش]2[ پیچیدگی محاسبات و برآورد پارامترهای این نسبت استفاده از آن را دشوار کرده است.
همانطور که در خالص جریانهای خروجی طی 30 روز آتی = جریانهای ورودی طی 30 روز آتی – جریانهای خروجی طی 30 روز آتی
شکل 3 نشان دادهشده است، برای پیشبینی ریسک نقدینگی عوامل یا پارامترهای داخلی بانک، تحت عنوان عوامل خُرد اقتصادی یا تحت کنترل به عنوان متغیرهای ایستا و عوامل بیرونی، پارامترهای ضمنی یا متأثر از زمان با عنوان متغیرهای پویا در نظر گرفته میشود. این مطالعه با بررسی متغیرهای کیفی، تأثیر این نوع متغیرها بهعنوان یک متغیر پویا و مهم در ریسک نقدینگی که در تحقیقات قبلی بررسی نشده است، لحاظ میکند.
دادههای این مطالعه به دودسته متغیرهای وابسته و مستقل تقسیمشدهاند. متغیر وابسته همان ویژگیهای کیفی اخبار و متغیر مستقل همان شاخص ریسک نقدینگی است؛ در این خصوص ابتدا به نحوه جمعآوری دادههای کیفی و سپس متغیر وابسته یا شاخص ریسک نقدینگی پرداخته میشود. در جدول 2 منابع دادههای تحقیق آورده شده است.
در خصوص دادههای کمی همانطور که در جدول بالا نیز اشارهشده است، شاخص نسبت پوشش نقدینگی بهصورت ماهانه مدنظر است. شاخص ریسک بانکی یک شاخص تاریخی و رو به عقب است به این معنی که وضعیت فعلی یا گذشته بانک را نمایش میدهد.]30[
جدول 2: متغیرها و دادههای مطالعه.
|
دادههای نسبت پوشش نقدینگی برای یکی از بانکهای نیمهخصوصی کشور ایران است. این دادهها از بازه فروردین 1388 تا اسفند 1399 بهصورت ماهانه در اختیار قرارگرفته است.
در مطالعات قبلی در حوزه تحلیل تمایل ریسک بانکی، جهت محاسبه امتیاز تمایل17 یا شناسایی قطبیت دادههای متنی از سه کلاس مثبت، منفی و عدمتغییر استفاده شد.]30[ به همین منوال در این تحقیق به جهت شناسایی قطبیت یا برچسبگذاری دادههای متنی از سهطبقه مثبت، منفی و خنثی استفاده شد. برای محاسبه قطبیت (برچسب) از تحلیل روند شاخص نقدینگی ریسک نسبت به ماه گذشته استفاده شد که در آن کلاس مثبت مرتبط با افزایش این شاخص نسبت به ماه قبل، منفی به معنای کاهش نسبت به ماه قبل و عدم قطعیت (صفر) به معنای عدمتغییر محسوس نسبت به ماه قبل لحاظ شده است.
متغیر وابسته یا شاخص ریسک نقدینگی جهت ایجاد برچسبها در ماشین یادگیری مورداستفاده قرار میگیرد. برچسبها در دوحالت محاسبهشده است: یکبار بهصورت سه کلاس (1 به معنای افزایش شاخص، 0 به معنی ثابت بودن شاخص و 1- به معنی کاهش شاخص) و یکبار نیز در قالب پنج کلاس (2 به معنای افزایش زیاد شاخص، 1 به معنای افزایش کم شاخص، 0 به معنی ثابت بودن شاخص، 1- به معنی کاهش کم شاخص و 2- به معنای کاهش زیاد شاخص).
داده مهم کیفی در این تحقیق شامل اخبار و وقایع سیاسی، اقتصادی و اجتماعی است. این نوع دادهها پس از جمعآوری میبایست بهصورت یک متغیر کیفی جهت بررسی تأثیر آن بر ریسک نقدینگی مورداستفاده قرار گیرد. ازاینرو در این مطالعه دادههای اخبار از وبسایت معتبر خبرگزاری فارس خزیده18 و جمعآوری شد.
به دلیل اینکه دادههای خبری روبهجلو هستند و تأثیرات آنها را در آینده میتوان مشاهده نمود ]30[ میبایست در دورههای زمانی یکسان با شاخص ریسک نقدینگی جمعآوری شوند. ازاینرو، دادههای خبری بهصورت ماهانه از فروردینماه 1388 تا اسفند 1399 جمعآوری شد و در پایگاه دادهای شامل شرح، عنوان، نوع، زمان و خلاصه خبر ذخیره شد.
3. 4 پیشپردازش دادههای جمعآوری شده
پیشپردازش بر دادههای کمی و کیفی انجام شد. دادههای کمی همانطور که در بخش قبل توضیح داده شد به سه کلاس و پنج کلاس کمیسازی19 شد. پس از طبقهبندی متون خبری هرماه و برچسب ریسک نقدینگی آن ماه، غالب دستهها متوازن20 شدهاند. در شکل 4: نمودار توازن درصد برچسبها در حالت 3 کلاس درصد برچسبها در هر دو حالت نمایش داده شده است که نشاندهنده توازن در سهم برچسبها است. پس از پیشپردازش دادهها تعداد نمونهها به حدود 494650 رسید.
در مرحله پیشپردازش دادهها، مراحل زیر بهصورت کلی انجامشده است:
1. پاککردن اعداد از دادههای متنی یا تبدیل اعداد انگلیسی به فارسی
2. پاککردن علائم نقطهگذاری21 از دادههای متنی
3. پاککردن فضاهای خالی22 از دادههای متنی
5. حذف کردن کلمات بیاثر23 از دادههای متنی
6. حذف کردن واژگان اضافه24 و کلمات خاص25
7. ریشهیابی کلمات با استفاده از عملیات ریشهیابی
8. استخراج واژگان کلیدی متن و حذف کلمات پرتکرار
شکل 4: نمودار توازن درصد برچسبها در حالت 3 کلاس و 5 کلاس
3. 5 استخراج و ادغام ویژگیها (کلیدواژهها)
در طبقهبندی با نظارت26، انتخاب ویژگی گام مهمی برای مرحله یادگیری است. در حقیقت، تعداد زیاد ویژگیها در مقایسه با تعداد مشاهدات نشاندهنده یک مشکل عمده برای مدلهای طبقهبندی است (ازدیاد ابعاد27). بهویژه هنگامیکه ویژگیها زائد، ضایع یا غیرقابل استفاده هستند. علاوه بر این، انتخاب ویژگی باعث افزایش کارآیی فرایند آموزش و بهبود قابلیت تعمیمپذیری نتایج میشود.
این مطالعه از یک رویکرد جدید برای ترکیب ویژگیها یا کلیدواژههای استخراجشده از دادههای متنی بهره میبرد. ابتدا برای هر خبر، سه بخش عنوان28، خلاصه29 و متن30 خبر باهم ترکیب میشوند. سپس دادهها به سه بخش دادههای آموزشی (70%)، دادههای اعتبارسنجی (15%) و دادههای تست (15%) تقسیم میشود. هایپرپارامترهای توابع بهگونهای تنظیم میشوند که ویژگیهای استخراجشده نه بسیار عام و پرتکرار باشد و نه بسیار بیربط و نادر. با ترکیب m خبر در یک ماه و ادغام ویژگیهای آن، بهاین جهت که اخبار یک ماه نمیتواند ویژگیهای خوبی برای یادگیری باشد، میتواند ویژگیهای مناسبتری ایجاد نمود. در شکل 5: استخراج، ادغام ویژگیها در ماتریس ویژگیها ترسیمشده است. اخبار هرماه ابتدا برچسب یکسان میگیرند. سپس با انتخاب عدد m که میتواند بین 1 تا تعداد کل اخبار(n آن ماه باشد، m خبر باهم ادغام میشوند. در ادامه الگوریتم TF-IDF و N-Gram بر روی اخبار ادغامشده اجراشده ویژگیهای مهم از متون ادغامشده انتخاب میشود. در TF-IDF از فرا پارامتر min_df برابر 0.04 و df برابر 0.25 استفادهشد. همچنین فراپارمتر ngram_range برابر (1,2) در نظر گرفته شد.
)
با استفاده از TF-IDF و N-Gram استخراج کلمات کلیدی پرتکرار و با اهمیت انجامشده و ضرایب حاصلشده، جهت ایجاد ماتریس ورودی ویژگیها در مدل یادگیری ماشین استفاده میشود. اگرچه این دو روش برای استخراج ویژگیها، نسبتاً قدیمی است ولی با توجه به تحقیقات مشابه توسط باتلر و همکاران یا شومیکر برای استخراج واژگان کلیدی و پرتکرار نتایج نسبتاً خوبی ارائه مینماید. البته از روشهای دیگری همچون کولهکلمات31 نیز میتوان استفاده نمود.]10,11,15[
بر این اساس تعداد ویژگیها به ونه کاهش پیدا میکند و همچنین میتوان پارامتر m را بهعنوان فراپارامتر32 در نظر گرفت که میتوان با تنظیم این پارامتر در مدل یادگیری ماشین، نتایج نهایی را ارزیابی نمود. در این مطالعه بهترین پارامترهای تنظیمشده اعداد 300 و 500 انتخابشده است که در ادامه از آن استفاده میکنیم.
در این مطالعه از روش پوشه برای انتخاب و ارزیابی ویژگیها استفاده میشود. به این معنی که مراحل انتخاب ویژگی و پیشبینی مدل را تنها در فرآیند ساخت مدل انجام میدهد.
بهاینترتیب که با تنظیم پارامتر که در بخش قبلی توضیح داده شد و انتخاب ویژگیها، به بهترین انتخاب حاصل شد.]42[
3. 6 الگوریتم تحلیل تمایل مبتنی بر یادگیری عمیق
پس از آمادهسازی داده، از رویکرد تحلیل تمایل با استفاده از روشهای یادگیری عمیق چندلایه بر اساس برچسبها یا همان تمایلات مثبت، منفی و بیاثر در ماتریس ویژگی به پیشبینی سناریوهای قریب الوقوع ریسک نقدینگی با توجه به تاریخچه روند ریسک نقدینگی میپردازیم.
همانطور که در شکل 6 نشان داده شده است، شبکههای عمیق چندلایه دارای ساختار لایهای هستند و ماتریس ویژگیها جهت پیشبینی برچسبها به این شبکه داده وارد میشود.
شکل 6: مدل طبقه بند یادگیری عمیق چندلایه
معماری شبکه یادگیری عمیق در اشکل 7 وشکل 8 نمایش داده شده است. لایه ورودی شامل 563 ویژگی یا کلیدواژه (ماتریس ویژگی) میباشد. این شبکه دارای 5 لایه بوده و لایه آخر همان طبقهبندی نهایی به برچسبهای مدنظر است. همچنین از دیگر پارامترهای در نظر گرفته شده تعداد ادغام یا پارامتر بوده که در دو حالت 300 و500 تنظیم گردید . این بدین معناست که 4 مدل یادگیری عمیق برای مدل ادغام 300 و 500 و همچنین 3 کلاسه و 5 کلاسه در نظر گرفتهشده است.
برچسب سه کلاسه شامل روند مثبت، منفی و بیاثر است؛ درحالیکه برچسب پنج کلاسه شامل روند خیلی مثبت، مثبت، منفی، خیلی منفی و بیاثر است.
مراحل مرسوم DSR 4 نوع ارزیابی را شامل میشوند: شکل 9: مراحل ارزیابی در فرآیند DSR یک فرآیند متناوب DSR را نشان میدهد که شامل فعالیتهای شناسایی مسئله، طراحی، ساخت و بهکارگیری است. مراحل ارزیابی به شرح زیر است:
ارزیابی مرحله اول: ارزیابی شناسایی مسئله؛ معیارها شامل اهمیت، تازگی و امکانسنجی است. در این مطالعه ارزیابی مسئله تحقیق شامل ضرورت و نوآوری مطالعه است که پیشتر به آن پرداخته شد. همچنین امکانسنجی مطالعه با تکیهبر تجارب قبلی و تحقیقات گذشته پایهگذاری شده است.
شکل 7: معماری لایههای شبکه عصبی در حالت قطبیت 3 کلاسه
شکل 8: معماری لایههای شبکه عصبی در حالت قطبیت 5 کلاسه
ارزیابی مرحله دوم: ارزیابی طراحی راهحل؛ معیارها شامل سادگی، وضوح و ثبات است. در این مطالعه ارزیابی مرحله دوم با توجه بهوضوح و سادگی مدل پیشبینی بررسیشده است. همچنین تجربیات و روشهای مشابه حاکی از پایداری روش پیشنهادی است.
ارزیابی مرحله سوم: ارزیابی نمونه راهحل. معیارها عبارتند از سهولت استفاده، وفاداری به پدیدههای دنیای واقعی و استحکام است. ارزیابی مرحله سوم در مطالعه انجامشده مبتنی بر سهولت کاربری مدل و نتایج به پیشبینی دادههای نمونه دال بر استحکام مدل است. در این راستا نتایج حاصل از پیشبینیها با دادههای واقعی ماههای مختلف انطباق داده میشود تا صحت مدل را بررسی نماید.
شکل 9: مراحل ارزیابی در فرآیند DSR ]41[
در این مرحله در مطالعه از روشهای تصادفی برای انتخاب دادهای آموزش، تست و ارزیابی استفاده شده است. دادههای تحقیق جهت ارزیابی نتایج به سه دسته، دادههای آموزش، اعتبارسنجی و تست تقسیم میشوند. 70% دادهها جهت آموزش اولیه، 15% جهت تنظیم پارامترها در اعتبارسنجی و نهایتاً 15% جهت تست استفاده گردید. مدل طبقهبندی آموزشدیده برای پیشبینی برچسبهای واقعی 3 کلاس یا 5 با دادههای اعتبارسنجی ارزیابیشده و نهایتاً توسط دادههای تست تحلیل میشود. برای ارزیابی نتایج پیشبینی الگوریتم مورداستفاده نیز از معیارهای مرسوم و استاندارد ارزیابی طبقه بندها استفاده شد، ازجمله: (i) ماتریس درهمریختگی33، (ii) Precision، Recall،Accuracy، F-Score. محاسبه این نسبتها در زیر ارائهشده است.]45[
(3)
(4)
(5)
درواقع معیار دقت اثربخشی طبقهبندی را بهصورت کلی نمایش میدهد. معیار صحت بر برچسبهای مثبت ارائهشده توسط طبقهبندی کننده تمرکز میکند و فراخوان براثر بخشی طبقهبندی کننده در شناسایی برچسبهای مثبت تمرکز میکند. علاوه بر معیارهای نامبرده شده، معیار F1-Score نیز میتواند شاخص خوبی برای ارزیابی نتایج باشد. این معیار از ترکیب دو معیار صحت و فراخوان حاصل میشود. فرمول محاسبه این معیار نیز به شرح ذیل است.
(6)
ارزیابی مرحله چهارم: شامل ارزیابی راهکار کاربردی در مرحله کاربردپذیری است. معیارها شامل اثربخشی، کارایی و سازگاری خارجی است. این بخش از ارزیابی در مطالعه با تکیهبر سناریوهای متنوع موجود در بانک بررسی میشود. بدین ترتیب که سناریوهای کاربردی استخراجشده از منابع موثق (کمیته بال و خبرگان بانکی) با نتایج سناریوهای حاصل از پیشبینیهای انجامشده در مدل مقایسه میشوند. معیار یا سنجه ارزیابی این بخش دقت سناریوهای پیشبینیشده است که هرچه روند پیشبینی با سناریوهای اتفاق افتاده همسانی بیشتری داشته باشد، مدل کارایی و اثربخشی بیشتری در دنیای واقع دارد.
4. ارزیابی نتایج
در این بخش نتایج مطالعه انجامشده ارائهشده که جهت ارزیابی مرحله سوم و چهارم روششناسی پژوهش DSR مدنظر خواهد بود. در این راستا، ابتدا نتایج جهت ارزیابی مرحله سوم یا نمونه راهکار اولیه ارائهشده و سپس نتایج توسعهیافته جهت ارزیابی در مرحله کاربردپذیری بررسی میگردد.
4. 1 نتایج و ارزیابی مرحله ایجاد نمونه اولیه
در این بخش به بررسی نتایج مطالعه صورت گرفته بر رویدادههای ریسک نقدینگی بانک و اخبار جمعآوریشده از وبسایت خبرگزاری فارس نیوز میپردازیم. دادههای خبری همانطور که در بخشهای قبلی نیز توضیح داده شد با دو مدل 300 تایی و 500 تایی ادغامشده و مدل نهایی ماتریس ویژگیها دارای برچسب که روند ریسک نقدینگی بانک را نشان میدهد، ایجاد شد. برچسبهای مورداستفاده بهصورت 3 کلاسه و 5 کلاسه ایجادشده است. ازاینرو الگوریتم شبکه یادگیری عمیق دارای 4 حالت است و نتایج آن در این بخش ارزیابی میشود. جدول 3 شامل حالات مختلف با استفاده از روش یادگیری شبکه عمیق جهت تحلیل تمایل است.
در مرحله بعدی با توجه به شرایط مختلف برای الگوریتم یادگیری ماشین، حالتهای متنوعی جهت تنظیم و انتخاب فرا پارامترها با استفاده از داده ارزیابی (15% داده) قابلبررسی است که در جدول پایین پارامترهای موردبررسی برای روش یادگیری عمیق اشارهشده است. نهایتاً پس از بررسی فرا پارامترهای زیادی، دقت داده ارزیابی34 ملاک اصلی برای انتخاب این پارامترها در الگوریتم قرار گرفت.
جدول 3: حالات مختلف در تحلیل شبکه عمیق – تحلیل تمایل.
|