Integrating Data Envelopment Analysis and Decision Tree Models in Order to Evaluate Information Technology-Based Units
Subject Areas :Amir Amini 1 * , ali alinezhad 2 , somaye shafaghizade 3
1 -
2 -
3 -
Keywords: Data envelopment analysis, Data mining, Classification and regression, Decision tree, Undesirable output,
Abstract :
In order to evaluate the performance and desirability of the activities of its units each organization needs an evaluation system to assess this desirability and it is more important for financial institutions, including information technology-based companies. Data envelopment analysis (DEA) is a non-parametric method to measure the effectiveness and efficiency of decision-making units (DMUs). On the other hand, data mining technique allows DMUs to explore and discover meaningful information, which had previously been hidden in large databases. . This paper presents a general framework for combining DEA and regression tree for evaluating the effectiveness and efficiency of the DMUs. Resulting hybrid model is a set of rules that can be used by policy makers to discover reasons behind efficient and inefficient DMUs. Using the proposed method for examining factors related to productivity, a sample of 18 branches of Iran insurance in Tehran was elected as a case study. After modeling based on advanced model the input oriented LVM model with weak disposability in data envelopment analysis was calculated using undesirable output, and by use of decision tree technique deals with extracting and discovering the rules for the cause of increased productivity and reduced productivity.
1. آذر عادل؛ مؤمنی منصور. 1383. اندازه¬گیری بهره¬وری در شرکت¬های تولیدی به وسیله مدل¬های تحلیل پوششی
داده¬ها، دو ماهنامه علمی پژوهشی دانشور رفتار، دانشگاه شاهد، سال یازدهم، شماره 8.
2. امامی میبدی علی. 1384. اصول و اندازه¬گیری کارایی و بهره¬وری (علمی- کاربردی)، مؤسسه مطالعات پژوهش¬های بازرگانی، چاپ دوم، تهران.
3. اسفاندرانی حمید. 1390. طراحی شبکه فروش بیمه¬های عمر (مورد مطالعاتی شرکت سهامی بیمه ایران به روش تحلیل پوششی داده¬ها(DEA)، پایان¬نامه کارشناسی¬ارشد، دانشگاه تربیت مدرس.
4. دعایی حبیب ا..؛ نیکخواه فرخانی زهرا. 1388. ارزیابی عملکرد عملیاتی و منابع انسانی نمایندگی¬های بیمه کارافرین در استان خوزستان با نگرش چندگانه به روش تحلیل پوششی داده¬ها، فصلنامه صنعت بیمه، سال بیست و چهارم، شماره3و4، پاییز و زمستان، شماره مسلسل96-95.
5. سلطان¬پناه هیرش و همکاران. 1386. ارزیابی کارایی شعب بیمه البرز با استفاده از تحلیل پوششی داده¬ها، فصلنامه صنعت بیمه، سال بیست و دوم، شماره4، زمستان، شماره مسلسل88، 151-177.
6. مشیري سعید؛ رضوان مهدی. 1385. اثر به¬کارگیري فناوري ارتباطات و اطلاعات در کارایی صنعت خدمات هوایی ایران، فصلنامه پژوهش هاي اقتصادي ایران، سال هشتم، ش 26.
7. مهرگان محمدرضا. 1383. مدل¬های کمی در ارزیابی عملکرد سازمان¬ها، انتشارات دانشگاه تهران.
8. Babazadeh, R. Razmi, J. Rabbani, M. Pishvaee, M. S. 2015. An integrated data envelopment¬ ¬¬analysis-mathematical programming approach to strategic biodiesel supply chain network design problem, Journal of Cleaner Production (Article in press).
9. Barros, C. P., Nektarios, M. & Assaf, A. 2010. Efficiency in the Greek insurance industry, European Journal of Operational Research DEA technology. Omega ,PP. 315-325.
10. Bretholt A, Pan J. . Evolving the latent variable model as a an environmental 9. Charnes, A, Cooper, WW, Rhodes, E. 1978. Measuring the efficiency of decision making units, European journal of operational research, 2, 429-444.
11. Barr, R., L.M. Siford and T.F. Simes. 1994. Forecasting bank failure: a non-parametric approach, Recherches Economiques de Louvain.
12. Breiman, L., J. Friedman, R. Olshenand C. Stone. 1984. Classification and Regression Trees, Pacific Grove, CA: Wadsworth-Monterey.
13. Charnes A., W. W. Cooper , Rhodes E. 1978. Measuring the Efficiency, European Journal of Operations Research, No 2.
14. Chen, Y., Cook, W.D., Li, N., Zhu, J. 2009. Additive efficiency decomposition in two stage DEA. European Journal of Operational Research.
15. Emrouznejad A., Anouze A. 2010. Data envelopment analysis with classification and regression tree-a case of banking efficiency, Expert Systems.
16. Efron, B. and Tibishirani R. 1993. An Introduction to the Bootstrap, New York: Chapman and Hall.
17. Fakhari A., Eftekhari Moghadam A.M. 2013. Combination of classification and regression in decision tree for multi-labeling image annotation and retrieval, Applied Soft Computing.
18.Fan Ch.K, & Cheng, Sh.W. 2009. Using Analytic Hierarchy Process Method and Technique for Order Preference by Similarity to Ideal Solution to Evaluate Curriculum in Department of Risk Management and Insurance, J. Soc. Sci., 19(1).
19. Farzipoor R. 2007. Suppliers selection in the presence of both cardinal and ordinal data, European Journal of Operational Research.
20. Emroznejad A., DEA Home page ,http://www.deazone.com/tutorial.
21. Han J., Kamber M. . Data Mining Concept and Techniques. nd Edition. San Francisco, Elsvier.
22. Hand D.J., Manilla H., Smyth P. 2001. Principles of Data, Cambridge, MA: MIT Press.
23. Hosseini Bamakan, S. M. Gholami, P. 2014. A Novel Feature Selection Method Based on an Integrated Data Envelopment Analysis and Entropy Model, 2nd International Conference on Information Technology and Quantitative Management, ITQM 2014, Procedia Computer Science 31, 632 – 638.
24. Hwang S., Kao T.L. 2007. Measuring Managerial Efficiency in Non-Life Insurance Companies: An Application of Two-Stage Data Envelopment Analysis, International Journal of a Management, vol. , No. .
25. Jahanshahloo GR. , Alirezaee MR. 1992. Measuring the efficiency of academic units at the Teacher Training University, Procedings of th Annual Iranian math conference.
26. Kim, H. and G.J. Koehler.1995. Theory and practice of decision tree induction, Omega.
27. Lee, S. 2010. Using data envelopment analysis and decision trees for efficiency analysis and recommendation of B2C controls, Decision Support Systems, 49, 486–497.
28. Luhnen, M. 2009. Efficiency and Competition in Insurance Markets, Dissertation no. 3675.
28. Mahlberg,B & Url, Th. 2010. Single Market effects on productivity in the German insurance industry, Journal of Banking & Finance.
28. Malmquist, S. 1953. Index numbers and indifference surfaces. Trabajos de Estatis- tica.
29. Nagurur, N. N. Rajbhanari, B. 2001. Data envelopment analysis for the performance evaluation of air conditioning and refrigeration companies in Thailand, Business Performance Management.
30. Park, J. Lee, D.S. Christakis, N, and Barabasi,A.L.. 2009. The impact of cellular networks on disease comorbidity, Molecular Systems Biology.
31. Pille, P. and Paradi J. 1997. Facets at the frontier and efficiency measurement in DEA, Paper presented at the Fifth European Workshop on Efficiency and Productivity Analysis.
32. Seol, H. Choi, J. Park, G. Park, Y. 2007. A framework for benchmarking service process using data Envelopment analysis and decision tree, Expert Systems with Applications, 32, 432–440.
33. Shahroudi K., Taleghani M., Mohammadi G. 2001. Efficiency Decomposition in Data Envelopment Analysis: An application to Insurance companies in Iran.
34.Sueyoshi T., Goto P. 2009. DEA-discriminate analysis Methodological comparison among eight discriminant analysis approaches, European Journal of Operational Research.
35. Tavana, M., Keramatpour, M., Santos-Arteaga, F.J., Ghorbaniane, E. 2015. A Fuzzy Hybrid Project Portfolio Selection Method Using Data Envelopment Analysis, TOPSIS and Integer Programming, Expert Systems with Applications (Article in press).
36. Torgo L. 1997. Functional models for regression tree leaves, Proceedings of the th International Conference on Machine Learning.
37. Wang, C. H. Chuang, J. J. 2015. Integrating decision tree With back propagation network to conduct business diagnosis and performance simulation For solar companies, Decision Support Systems (Article in press).
38. Xie X. 2010. Are publicly held firms less efficient? Evidence from the US property-liability insurance industry, Journal of Banking & Finance.
39. Yao, Sh., Han,zh.,& Feng, G. 2007. On technical efficiency of China's insurance industry after WTO accession, China Economic Review.
فصلنامه علمي- پژوهشي فناوري اطلاعات و ارتباطات ایران | سال هشتم، شمارههاي 27 و 28، بهار و تابستان 1395 صص: 61 - 80 |
|
تلفیق مدل تحلیل پوششی دادهها و درخت تصمیم به منظور ارزیابی واحدهای مبتنی بر تکنولوژی اطلاعات
*امیر امینی ** علیرضا علینژاد ***سمیه شفقیزاده
*دانشجوی کارشناسیارشد، مهندسی صنایع، دانشکده مهندسی صنایع، دانشگاه صنعتی ارومیه، ارومیه، ایران
**دانشیار دانشگاه آزاد اسلامی، واحد قزوین، دانشکده مهندسی صنایع و مکانیک، قزوین، ایران
***دانشآموخته کارشناسیارشد مهندسی صنایع، دانشکده مهندسی صنایع، دانشگاه آزاد اسلامی، واحد علوم تحقیقات قزوین، قزوین؛ ایران
تاریخ دریافت: 30/08/93 تاریخ پذیرش: 23/08/95
چکيده
هر سازمان به منظور آگاهی از میزان عملکرد و مطلوبیت فعالیت واحدهای خود به یک نظام ارزشیابی جهت سنجش این مطلوبیت نیاز دارد و این موضوع برای مؤسسات مالی از جمله شرکتهای مبتنی بر تکنولوژی اطلاعات اهمیت بیشتری دارد. تحلیل پوششی دادهها1 یک روش غیرپارامتری برای اندازهگیری کارایی و بهرهوری از واحدهای تصمیمگیری2(DMUs)هاست. از طرف دیگر تکنیک دادهکاوی3 به DMUs))ها اجازه کاوش و کشف اطلاعات معنیداری، که قبلاً در پایگاه دادههای بزرگ پنهان بودهاند را میدهد. این مقاله یک چارچوب کلی ترکیب تحلیل پوششی دادهها بادرخت رگرسیون 4را برای ارزیابی کارایی و بهرهوری ازDMUها پیشنهاد میکند. نتیجه مدل ترکیبی مجموعهای از قوانین است که میتواند توسط سیاستگذاران برای کشف دلایلDMUهای کارآمد و ناکارآمد مورد استفاده قرار گیرد. به عنوان مطالعه موردی با استفاده از روش پیشنهادی برای بررسی عوامل مرتبط با بهرهوری نمونهای شامل 18 شعبه از بیمه ایران در شهر تهران انتخاب گردید و پس از مدلسازی بر مبنای مدل پیشرفته LVM5 ورودی محور با دسترسی پذیری ضعیف درتحلیل پوششی دادهها با خروجی نامطلوب6محاسبه گردید و با تکنیک درخت تصمیم، به استخراج قوانین برای کشف دلایل افزایش بهرهوری و پسرفت بهرهوری میپردازد.
واژههای کلیدی: تحلیل پوششی دادهها، دادهکاوی، طبقهبندی و رگرسیون، درخت تصمیم، خروجی نامطلوب
نویسنده عهدهدار مکاتبات : امیر امینی mr62.amini@gmail.com |
[1] Data Envelopment Analysis
[2] Decision Making Units
[3] Data Mining
[4] C&R
[5] Latent Variable Model
[6] Undesirable Output
1- مقدمه
اندازهگیری راندمان یا کارایی، همیشه یکی از مباحث مهم مدیریت بوده است. آنچه پیکره دفاعی یک واحد اقتصادی را استحکام میدهد و بر دیگر رقبا ارتقاء میبخشد، نگاه تیزبینانهای است که برنامهریزان آن واحد با ایجاد بستری مناسب سعی میکنند که ضمن شناسایی نقاط ضعف و قوت موجود، درصدد رفع نقایص و ارتقاء قوت در کل مجموعه برآیند و این میسر نمیشود، مگر با استفاده از روشهایی که در نهایت صحت و به دور از هرگونه اغواگری، موجب شناسایی واحدهای کارا از ناکارا شود.
امروزه صنایع با یک محیط به شدت رقابتی مواجهاند. صنعت بیمه نیز از این محیط به شدت رقابتی بی بهره نبوده و در سالهاي اخیر شاهد رقابت فزایندهاي بین شرکتهاي بیمه بودهایم، در مواجهه با یک محیط رقابتی، تدوین استراتژيهاي رقابتی، تقویت فعالیتهاي شرکت وارتقاي کیفیت خدمات براي بقاء ضروري است، در جهان امروز، بیمه از مهمترین بخشهاي اقتصادي در جامعه است که علاوه بر تسهیل روابط بین الملل در پیشگیري از تحقق ریسک و نیز تأمین آرامش خاطر براي فعالیتهاي مختلف نقش شگرفی را ایفا مینماید. شعب مختلف یک شرکت بیمه بهرغم استفاده از منابع مادي و انسانی مشابه، عملکردهاي متفاوتی دارند. یکی از دلایل، تفاوت در عملکرد شعب و نمایندگیهای بیمه در نحوه
بهکارگیري منابع انسانی و مدیریت میتوان دانست [4].
این تحقیق به دنبال ارزیابی کارایی شعب بیمه ایران است تا واحدهای تصمیمگیرنده بتوانند به کمک نتایج تحقیق یا بسط آن اهداف زیر را پیگیری نمایند:
- ایجاد فضای رقابت سالم بین شعب با توجه به نتایج تحقیق
- استفاده از تجربیات واحدهای کارا و انتقال تجربه و دانش آنها به سایر شعب
- اهداف کاربردی مستتر در این ارزیابی، استفاده از نتایج جهت سیاستگذاری شرکت و استفاده ازآن به عنوان محک مدیران شعب است.
اما این سؤال مطرح میشود که شرکتهای بیمهای موجود در کشور تا چه اندازه از منابع در دسترس خود به صورت کارا استفاده میکنند و نحوه عملکرد شرکتهای بیمهای در استفاده بهینه از منابع در اختیار آنها از دیگر عوامل مؤثر برتوسعه بازارهای بیمه و افزایش کارایی آنها محسوب
میگردد.
امروزه شرکتها سعی میکنند عملکردشان را اندازهگیري کرده و آن را با رقبایشان مقایسه نمایند تا بتوانند جهت حصول به سطح عملکردي که بتواند آنها را در بازار حفظ نماید، اقدام مقتضی را انجام دهند [29].
چارنز و همکاران (1978) به معرفی یک روش غیرپارامتری اندازهگیری کارایی تکنیکی با یک مجموعه از واحدهای تصمیمگیرنده قابل مقیاس با استفاده از روش تحلیل پوششی دادهها پرداختند.
اندازهگیری کارایی واحدهای تصمیمگیرنده DMUs))ها مانند بیمارستانها، بانکها، شرکتهای بیمه و... که با چندین ورودی، چندین خروجی تولید میکنند کار بسیار پیچیدهای است. تحلیل پوششی دادهها از مفهوم ارزیابی کارایی یک گزینه تصمیمگیری بر مبنای عملکردش در ایجاد خروجیها بواسطه مصرف ورودی بسط یافته است [35]. کارایی هر واحد تصمیمگیری در مقایسه با واحد دیگر به عنوان نسبت مجموع وزنی خروجی های آن عضو به مجموع وزنی ورودی ها تعریف میشود [27].
در طول دهه گذشته DEA به عنوان یک ابزار مدیریتی قدرتمند برای ارزیابی عملکرد به طور گسترده، توجه قابل ملاحظهای را به دست آورده است و از طرف دیگر درخت تصمیم یک تکنیک داده کاوی برای طبقهبندی نمونهها یا عملکرد ثابت تکهای در رگرسیون غیرخطی است، این الگوریتم توسط برایمن1و همکاران (1984) ابداع شده است.
براي ارزیابی کارایی شرکتهاي بیمه از مدل تحلیل پوششی دادهها با خروجی نامطلوب استفاده شده به این دلیل که فرآیند تولید صنعت بیمه، در حالت کلی شامل دو فعالیت است؛ یکی فعالیت بازاریابی که مربوط میشود به بازاریابی، بیمهکردن و پرداختن ادعاي خسارتها که به عنوان خروجی که تولید کمتر آنها به صرفهتر است وآن را عوامل نامطلوب مینامیم و دیگري فعالیت سرمایهگذاري که عبارت است از منافع حاصل از سرمایهگذاري منابع مالی مؤسسه بیمه.
این تحقیق بر آن است تا با استفاده از مدل LVM2، تغییرات کارایی و بهرهوری شعب بیمه ایران در طی سال (1389-1387) در شهر تهران را باهم مقایسه نموده، شاخصی برای تعیین کارایی و ناکارایی یک واحد با استفاده از تغییرات مرز حاصل از ورودی واحدها و تغییرات کارایی آنها صورت دهد و در نهایت با ارائه نتایج، کارایی و بهرهوری شعب را مورد بحث و بررسی قرار داده و جایگاه هریک از شعب را در این مدل تعیین کند.
نهادههایی که در این تحقیق مورد استفاده قرار گرفتهاند، تعداد نمایندگیها، هزینههای اداری و بیمهگری هستند و ستاندههای مورد استفاده، درآمد حاصل از حق بیمه و ارزش وامهای پرداختی به عنوان خروجی مطلوب و ارزش خسارت پرداختی به عنوان خروجی نامطلوب در نظرگرفته شده است، که شناسایی شاخصها و معیارهای عملکردی از طریق مصاحبه و نظرسنجی با کارشناسان و مدیران ارشد بیمه ایران و مطالعه اسنادی صورت پذیرفت. این دادهها با مراجعه مستقیم امور مالی و شعب بیمه ایران در شهر تهران
جمعآوری شده است.
تحقيق حاضر از نظر هدف، از نوع تحقيقات كاربردي محسوب ميشود. همچنين از نظر نحوه گردآوري دادهها اين تحقيق توصيفي و از نوع علّي- مقايسهاي ميباشد. جامعه آماري اين تحقيق كليه شعب بيمه ایران، درشهر تهران ميباشند.
2. بیان مسأله
مفهوم کارایی در اقتصاد، تخصیص مطلوب منابع است. اما از نظر اهداف کاربردي، تعاریف گوناگونی بیان شده است. بهطور کلی کارایی، معرف نسبت ستاندهها به نهادهها در مقایسه با یک استاندارد مشخص است [7].
در عصر ما کارایی و بهرهوری از بالاترین اهداف مدیران و ارزشمندترین مقصد همه سازمانها میباشد.
تلاش برای افزایش بهرهوری جدیترین مبارزهای است که مدیریت در آستانه قرن بیستویکم با آن روبروست. در نگاهی ساده به بهرهوری، نسبت بازده به منابع مصرف شده است. لذا اگر با هزینه یکسان محصول بیشتری تولید شود یا مقدار معینی محصول با هزینه کمتری تولید شود، منافعی برای کل جامعه حاصل میشود که میتواند برای تأمین زندگی بهتر برای افراد جامعه مؤثر باشد [1].
اندازهگیري کارایی و روشهاي محاسباتی آن از اواخر قرن بیستم توجه بیشتر اقتصاددانان را برانگیخته است[37].
روشهاي اندازهگیري اغلب برآورد مرز کاراي تولید و به دست آوردن منحنی مرزي یا تابع تولید مرزي و کلاً به دو روش پارامتریک و ناپارامتریک بوده است. روش تحلیل پوششی دادهها3 که در سال 1978 چارنز و همکارانش4 ارائه کردند، نخست براي ارزیابی اقتصادي و فنی واحدهاي تولیدي معرفی گردید. امروزه این روش براي ارزیابی عملکرد واحدهاي خدماتی، اعم از دولتی و غیردولتی و واحدهاي تولیدی [25] و [34] و [19] و [6] کاربرد گستردهاي دارد.
کائو و هوآنگ [24] براي ارزیابی کارایی شرکتهاي بیمه غیرعمر تایوان از مدل دو مرحلهاي و در واقع DEA دو مرحلهاي استفاده کردهاند. مدل ارتباطی DEA ارتباطی متداول است تا بتواند رابطه فیزیکی بین فرآیند کل و زیرتوسعه یافته مدل DEA دو مرحلهاي، محدودیتهاي DEA و فرآیندهاي جزء را توصیف کند. در مدل ارتباطی هر دو زیر فرآیند، به محدودیت فرآیند کل اضافـه
میشوند.
در صنعت بیمه نیز تحقیقات متعددي از این روش جهت ارزیابی عملکرد نمایندگیهاي بیمه بهره گرفتهاند [5] و [28] و [39].
در همین سال تحقیقات متعددي به طرق گوناگون در زمینه ارزیابی کارایی شرکتهاي بیمه با استفاده از روش تحلیل پوششی دادهها در کشورهای آلمان [28]، چین [14]، تایوان [18]، ایالات متحده [30] و بسیاری از کشورهای دیگر انجام شده است.
چن و همکارانش5، کارایی شرکتهاي بیمه تایوان را با استفاده از روش دومرحلهاي تحلیل پوششی دادهها بررسی کردند [14].
گونزالس و همکاران6در سال 2009 به تحلیل DEA از خطر، هزینه و درآمد در بیمه پرداختند، با استفاده از تحلیل پوششی دادهها به مطالعه در زمینه تجزیه و تحلیل نتایج حاصل از DEA در زمینه چند متغیره، تحلیل آماری با استفاده از تحلیل عاملی تفسیر شده و تأثیرعوامل خطر در بهرهوری مشخص شده است.
زاي7، کارایی شرکتهاي بیمه دولتی و خصوصی ایالات متحده را با استفاده از روش تحلیل پوششی دادهها مقایسه کرد و دریافت بهرغم کارایی بالاي شرکتهاي بیمه خصوصی، علت تمایل ایشان به دولتی شدن به دلیل دسترسی به منابع و سرمایه بیشتر است [38].
باروز و همکارانش8 نیز در همین سال با استفاده از روش دو مرحلهاي تحلیل پوششی دادهها کارایی شرکتهاي بیمه یونان را در دوره 9 ساله بررسی کردند [9].
حمید اسفاندرانی [4] در تحقیق خودکه جامعه آماری آن شامل 24 شعبه و100 نمایندگی واقع در تهران شرکت بیمه ایران میباشد. در این تحقیق انتخاب نهادهها و ستاندهها با توجه به تحقیقات مشابه بوده و مصاحبه و نظرسنجی از کارشناسان و خبرگان بیمه انجام گرفته است. در نهایت با توجه به تجزیه و تحلیلهای انجام گرفته از مدل های متعدد DEA، مدل BCCنهادهگرا به منظور اندازهگیری کارآیی شبکه فروش بیمه عمر مدلی مناسب تشخیص داده شده است.
شاهرودی و همکاران9(2011) به تجزیه و تحلیل کارایی بیمههای خصوصی در ایران با روش تحلیل پوششی
دادهها، به محاسبه کارایی بیمههای خصوصی بین
سالهای2007-2006 با روش DEA دومرحلهای پرداختند. سئول و همکاران (2007) از تلفیق تحلیل پوششی دادهها و درخت تصمیم به عنوان یک روش الگوبرداری در فرایند خدمت استفاده کردهاند [32]. بابازاده و همکاران (2015) رویکرد یکپارچه دوگانهای از تحلیل پوششی دادهها و تکنیکهای برنامهریزی ریاضی را به منظور طراحی راهبردی شبکه زنجیره تأمین زیست – دیزل در ایران ارائه داده اند [8].
3. مواد و روش
در این مقاله، دو روش تلفیقی تحلیل پوششی دادهها و داده کاوی که برای تخمین بهرهوری واحدهای تصمیم گیرنده (DMUS) مورد استفاده قرار میگیرد، در نظر گرفته شده است. در روش تحلیل پوششی دادهها، تخمین کارایی و صرفههای مقیاس، با استفاده از سیستم برنامهریزی ریاضی صورت میگیرد. در این روش محدودیتی در انتخاب تعداد نهادهها و ستاندهها نداریم، البته به شرط آنکه تعداد واحدهای تصمیمگیرنده به اندازه کافی زیاد باشند، هیچ گونه نیازی به انتخاب نوع تابع تولید نیست و تکنیک داده کاوی اجازه کشف و بررسی معنادار اطلاعاتی که قبلاً از یک پایگاه داده بزرگ پنهان بودهاند را میدهد،C&R همان درخت تصمیم در دادهکاوی است که توسط برایمن و همکاران در سال1984 توسعه یافته است و بعدها توسط رایپلی10 بهبود یافته است.
3-1- روش تحلیل پوششی دادهها (DEA)
به طور کلی شالوده روش ناپارامتری برای اندازهگیری کارایی با انتشار مقالهای از فارل11)1957) بنیان نهاده شد. وی با یک رهیافت صرفاً ریاضی، روش جدیدی را برای اندازهگیری کارایی مدل در مقابل روشهای پارامتری معرفی نمود [23]. تحلیل پوششی دادهها روشی ناپارامتریک بر مبنای
برنامهریزی خطی است و نخستین بار توسط چارنز و همکاران ارائه شد [13].
امروزه روش تحلیل پوششی دادهها به عنوان یک روش مناسب برای ارزیابی عملکرد واحدها شناخته شده است که در آن بر پایه اطلاعات موجود، مرز کارا به صورت تجربی برآورد می شود. از آنجایی که در دستیابی به تابع مرزی، همه داده ها پوشش داده میشوند، آن را تحلیل پوششی داده ها نام نهادهاند.
کارایی تکنیکی در روند تولید صنعت بیمه، ورودیها را به خروجی تبدیل میکند (هزینههای اداری و بیمهگری و تعداد نمایندگیها به عنوان ورودی و ارزش وامهای پرداختی و درآمد حاصل از حق بیمه به عنوان خروجی مطلوب و ارزش خسارت پرداختی به عنوان خروجی نامطلوب). ارتباط بین ورودیها و خروجیها میتواند به صورت یک تابع تولید که بیشترین خروجی ممکن برای یک سطح از ورودیهای ارائه شده را نشان میدهد بیان شود، کارایی تکنیکی یک اندازهگیری است که نشان میدهد، چگونه میزان حداکثر خروجی از ورودیهای دسترس به دست می آید.
3-2- کارایی تکنیکی با چندین ورودی و چندین خروجی
فرض کنید، n شعبه بیمه وجود دارد (j=1,2,..,n) با m ورودی(xij ,i=1,2,…,m) وs خروجی تولید میکند
(yrj , r=1,2,…,s). DEA کارایی تکنیکی شعبه را در مقایسه با گروه همتا از n شعبه را به صورت زیر
اندازهگیری میکند:
· کارایی تکنیکی: یک مدل برنامه ریزی خطی برای بازده به مقیاس متغیر(VRS)
Max h0= (1) st:
=1
- +u0≤ 0 j=1, 2, …, n
ur , vi≥ i= 1, …, m, r=1, …, s
u0 free
در این مدل، علامت بازده به مقیاس را تعریف میکند: به معنای بازده به مقیاس افزایشی است؛ به معنای بازده به مقیاس ثابت و نشان دهنده بازده به مقیاس کاهشی است.
مدل (1) یک مدل وزنی است و پوششی این مدل درمدل (2) نشان داده شده است.
کارایی تکنیکی: یک مدل برنامه ریزی خطی برای بازده به مقیاس متغیر: مدل پوششی، ورودیمحور
min h0 = (s+r+ si-)
St: (2)
xij + s-I = h0xij0 i = 1,…, m
yrj – s+r = yrj0 r= 1, …, s
= 1
λj ≥ 0 j=1, …, n
در این مدل، محدودیت اول نشاندهنده این است که همه ترکیبهای ورودی مشاهده شده برایjامین واحد
تصمیمگیرنده بر روی مرز یا زیر مرز تولید قرار دارد و دومین محدودیت نشان میدهد که سطحهای خروجی از مشاهدات ناکارایی با سطحهای واحد مرجع قابل مقایسه است، که از ترکیب محدب خروجی مشاهده تشکیل شده است.
محدودیت سوم معرف بازده به مقدار متغیر است و محدودیت آخر تضمین میکند که همه مقادیر تولید اوزان تحدب بزرگتر مساوی یک است، بنابراین واحد فرضی مرجع درون مجموعه امکان است، کاراست اگر و تنها اگر1 = و تمام متغیرهای کمکی برابر صفر باشند
(( [25].
معرفی مدل
3-3- مدل پیشنهادی روش ناپارامتری خروجیهای نامطلوب با اصل دسترسپذیری ضعیف
· دسترس پذیری ضعیف ورودیها و متغیر پنهان
برتـولت و پـان بـرای زمانـی که تکـنولوژی شـامـل
خروجیهای نامطلوب باشد، روشی را معرفی کردند که براساس اصول زیر ساخته میشود [17].
فرض کنید در یک فعالیت تولیدی، P ورودی در تولید، Q خروجی مطلوب و R خروجی نامطلوب به کار برده شود. بردار ورودی مصرف شده و، به ترتیب نشاندهندهی بردارهای خروجیهای مطلوب و خروجیهای نامطلوب باشند، همچنین،و به ترتیب نشاندهنده قیمت ورودیها، قیمت خروجیهای مطلوب و قیمت خروجیهای نامطلوب باشند و مجموعه مشاهدات با S نشان داده شود.
تمام اصول موضوعه، همراه یک فاکتور انقباضی برای خروجیهای نامطلوب برای تشکیل مدلLV ضروری است. هایلو و ویمن ادعا کردند که اگر قید ورودیها یا
خروجیهای نامطلوب را با فرمتساوی جایگزین شود مدل DEA حاصل، دسترسیپذیری ضعیف را نشان میدهد .
VRS LV Min α:
{DMU║ j=1, 2, … J: K, L}
St. jXtpj= αXtp0, p= 1, 2, …, P (3)
jyqjt ≥ yq0t, q= 1, 2, …, Q
jurjt ≤ λ utr0, r= 1, 2,…, R
j=1
Z
Zj 0
Latent Variable 0 ≤ λ = ≤ 1
{ DMU ║r= 1, 2, …, P}
در این مقاله یک مدل جدید برای ارزیابی کارایی، خروجیها به عنوان ورودی پیشنهاد شده است، با در نظر گرفتن یک فاکتور انقباضی برای خروجیهای نامطلوب، در اینجا با استفاده از شاخص مالم کوییست به بررسی پراکندگی بین دوره ها نیز میپردازیم.
پس از به دست آورد مقادیر کارایی واحدهای تصمیم گیرنده، بهرهوری را برای بازه زمانی سالهای1388-1387و 1389-1388 با توجه به فرمولهای زیر به دست میآوریم.
شاخص بهرهوری مالم کوییست برای ارزیابی تغییرات تکنولوژی واثر تغییرات روی ورودیها و خـروجیها اسـتفاده
میشود [28].
مالمکوئیست به صورت بیشترین فاکتور به وسیله
ورودیهایی که روی یک دوره که میتواند کاهش یابد، تعریف میشود و تولید کردن همان خروجی در یک دوره دوم را میتواند محاسبه کند.
فرض کنید تکنولوژی تولید در دوره K، به طوریکه نمایش اصلی ضریب کاهش به این صورت باشد.
λjk (XjL, YjL, UjL) (4)
به طوری که مقادیر هدف در دوره L هستند، به بیان مختصرتر با سادهسازی نماد اصلی را به نشان میدهیم، که این نشان میدهد اندازهگیری عملکرد برای خروجی نامطلوب در دوره L در حالیکه با تکنولوژی مرجع دورهK محاسبه شده است.
به طور مشابه، اندازهگیری عملکرد برای ورودیها در دوره L چنانچه تکنولوژی مرجع در دوره K محاسبه شده است.
در حالت کلی شاخص بهره وری مالم کوییست(MPI) به دو مؤلفه تجزیه میشود:
تغییرات کارایی تکنیکی12
و تغییر مرز تولید کارایی13
که در واقع نماد اصلی را با مؤلفههای MPI در معادله(3) ترکیب میکنیم. هم هدف کاهش α و هم متغیر پنهانλ، ضرایب کاهشی برای این روش تجزیه هستند. وقتی از یک LVM متراکم ضرایب کاهش همبستگی نسبی ناشی میشود، که به نوبه خود تا به حداقل رساندن واریانس در این مدل کمک میکند.
|
به طور کلی معرفی تکنولوژی متغیر پنهان تحلیل پوششی دادهها یک گام نخست به سوی نه تنها تحلیل خروجیهای نامطلوب بلکه برای گنجاندن پیامدهای خارجی بر روی شرکتها و جامعه است.
این مدل با استفاده از مدل کاهش متغیر پنهان متراکم، تئوری تولید کاهش همزمان خروجیهای نامطلوب و ورودیها را از طریق رابطه علی با ورودیها نشان میدهد.
نتایج بهرهوریDMUها از رابطه(5) بهدست میآید، چنانچه MPI>1 (progress) نشاندهنده روند پیشرفت در طی دوره و اگرMPI=1 (No change) نشاندهنده عدم تغییر و اگرMPI<1 (Regress) نشاندهنده پسرفت در طی دوره است.
3-4- ترکیب DEAبا تکنیک دادهکاوی
محققان DEA در گذشته عمدتاً بر روی ارزیابی و کنترل عملکرد متمرکز شدهاند و تنها تلاش اندکی از ترکیب DEA با تکنیک دادهکاوی گزارش شده است.
برای مثال، سون و مون14(2004) امکان استفاده از درخت تصمیمگیری را با DEA برای پروژههای R&D مورد بررسی قرار دادند، وقتی که یک شرکت سعی بر انتقال یا گسترش تکنولوژی جدید دارد.
مطالعات بسیار اندکی برای DEA برای اهداف پیشگویانه به کار رفته است از جمله، پیشبینی شکست بانک (بار و همکاران، 1994) و پیش بینی شکست اتحادیه اعتباری (پایل و پاردی، 1997). اما هیچ مطالعهای پیرامون DEA و درخت C&R برای کارایی و بهره وری شعب بیمه گزارش نشده است.
3-5- طبقه بندی و درخت رگرسیون(C&R)
تکنیک داده کاوی به DMUها اجازه کشف وکاوش معنادار اطلاعاتی که قبلاً در پایگاه داده های بزرگ پنهان بودهاند را میدهد.
C&Rدرخت تصمیمگیری است که به طور معمول در داده کاوی مورد استفاده قرار میگیرد، به وسیله برایمن و همکاران در سال 1984 توسعه داده شده است و سپس توسط رایپلی در سال 1996بهبود یافت. ساختار درختی نشاندهنده مسأله تصمیم داده شده است به طوری که هریک از گرههای غیر برگ با یکی از متغیرهای تصمیم در ارتباط است، هر شاخه از گره غیر برگ با زیرمجموعهای از مقادیر متغیر تصمیمگیری مربوطه در ارتباط است، و هر گره برگ با یک مقدار از متغیر هدف(متغیر وابسته) وابسته شده است.
برای هر برگ درخت مرتبط با مقدار میانگین متغیر هدف است، بنابراین یک درخت، یک روش جایگزین برای
مدلهای خطی پیوسته برای مشکلات رگرسیون و مدلهای خطی لجستیک برای مسائل طبقه بندی است.
به طور کلی، درختان C&R برخی مزایا بیش از مدل های رگرسـیون دارند. اولاً، مدل ایجـاد شده توسـط یک درخـت قابل فهمتر و نسبتاً ساده برای تفسیر غیرآماری است [22].
ثانیاً، ذاتاً غیر پارامتری است یعنی بدون نیاز به هیچ فرضی با توجه به توزیع اساسی از مقادیر متغیرهای مستقل ساخته شده است. بنابراین، درختانC&R میتوانند دادههای عددی که چولگی زیاد و یا چند وجهی هستند و همچنین پیشبینی های ردهای با هر دو ساختار ترتیبی و غیرترتیبی را اداره کند.
ثالثاً، درختان C&Rروشهای پیچیدهای برای مقابله با متغیرهای از دست رفته در مقایسه با رگرسیون دارد.
در رگرسیون، دادههایی که دارای هر گونه مقدار از دست رفته باشند به طور خودکار حذف می کنیم.
بنابراین، درختان C&R میتوانند حتی هنگامی که متغیرهای مستقل مهم برای برخی ازDMUها ناشناخته است ایجاد شوند.
در نهایت درختانC&R ، نسبتاً یک روش یادگیری ماشین خودکار است. درختان C&R، کارایی محاسباتی ارائه
میکنند تا جاییکه آنها زمان کمتری را درمحاسبات و ذخیرهسازی کمتری نیاز داشته باشند.
در تولید یک درخت C&R، مجموعه دادهها حداقل به دو بخش تقسیم میشوند: مجموعه دادههای آموزشی و مجموعه دادههای آزمایشی (عموماً به عنوان مجموعه
دادههای تست ارجاع داده میشود) [22]. سپس تحت دو فاز فرایند اصلی: مرحله رشد و مرحله هرس قرار میگیرد [26].
در مرحله رشد C&R، یک درخت از مجموعه دادههای آموزشی ساخته میشود. در این مرحله، هر گره برگ با یک کلاس در ارتباط است با تقسیمبندی بیشتری از برگ مفروض در تعدادی از موارد به یک یا دو گره بعدی که در زیر بعضی آستانه مشخص شده، منجر میشود.
دراین مرحله، درختC&R برخلاف صحت یا مجموعه دادههای آموزشی برطبق تولید یک زیر درخت با کمترین نرخ خطای مجموعه دادهها آزمایشی ارزیابی شده است. برای الگوریتم دقیق درختان C&R، هند و همکاران(2001( را میبینیم.
در این مقاله، از تحلیل درختC&R برای کشف و بررسی عوامل درونی و بیرونی همچون تعداد خسارتهای پرداختی، تعداد و تحصیلات کارکنان، درجه شعب، قدمت شعب، تعداد وامها، تعداد بیمه نامهها و...که برروی بهرهوری شعب بیمه مؤثرند، استفاده میشود.
مقدار هدف برای درخت رتبهکارایی و بهرهوری به دست آمده از DEA است. بنابراین، DMUها به دو دسته
گروههای پیشرفت بهرهوری و پسرفت بهرهوری تقسیم
میشود و بنابراین هدف درخت ما یک متغیر گسسته (طبقهای) است.
3-6- ترکیبDEA با درخت C&R
درختC&R که در این مقاله پیشنهاد شده است، شامل چهارمؤلفه اصلی است.
مؤلفه اول، متغیر خروجی یا متغیر وابسته است. به طور کلی این متغیر مشخصهای است که امیدواریم بتوانیم بر اساس متغیرهای مستقل یا پیشبینی کنندهها، پیشبینی کنیم. در این مطالعه متغیر خروجی همان نمرات به دست آمده از بهرهوری است که به سه دسته پیشرفت بهرهوری (1<هدف)، پسرفت (1<هدف)، بدون تغییر (1=هدف) دستهبندی میشود.
مؤلفه دوم از درخت C&R، متغیرهای مستقل یا پیشبینی کننده است، تعدادی متغیرهای مستقل ممکن بسته به هدف از تجزیه و تحلیل وجود دارد.
در این مطالعه موردی، متغیرهای مستقل عوامل درونی و بیرونی هستند که در جدول1 ذکر شده است.
سومین مؤلفه از یک درخت C&R مجموعه داده آموزش است. این یک پایگاه داده شامل مقادیر متغیرهایی برای هم متغیر خروجی و هم متغیرهای پیشبینیکننده (مستقل)، از یک گروه از DMUهایی که میخواهیم نتایج خروجی را پیشبینی کنیم.
مؤلفه چهارم از درخت C&R، آزمون یا مجموعه دادههای بیشتر که متشکل از DMUهایی است که ما خواهان پیشگویی دقیق آنها هستیم. این مجموعه دادههای آزمون ممکن است در عمل وجود نداشته باشد در حالی که به طور معمول براین باوریم که یک مجموعه داده تست مورد نیاز است تا یک طبقه یا قوانین تصمیم را بدان تنفیذ کنیم، یک پایگاه داده آزمایش جداگانه همیشه نیاز به تعیین عملکرد یک قوانین تصمیم ندارد.
شکل1 مراحل ارزیابی کارایی و بهرهوری شعب بیمه با استفاده ازDEA/C&R را نشان میدهد. همانطور که در شکل مشاهده میشود، ابتدا ازDEA برای اندازهگیری کارایی و بهرهوری هر شعبه با 3 ورودی (هزینههای اداری، هزینههای بیمهگری، تعداد نمایندگیها) و 3 خروجی (درآمد حاصل از حق بیمه، ارزش وامهای پرداختی، ارزش خسارت پرداختی) استفاده شده است، به عنوان نتایج این مرحله را به سه گروه شعب کارآمد، ناکارآمد و بدون تغییر تقسیم میکنیم.
بنابراین در مرحله دوم تحلیل درختC&R از عوامل محیطی وابسته به سیستم بیمه همچون قدمت شعب، درجه شعب، تعداد بیمهنامههای صادره و.... به عنوان عوامل ورودی به تحلیل درخت C&Rو نمرات بهرهوری بدست آمده در مرحله نخست به عنوان خروجی درختC&R (برای لیست کامل متغیرها به جدول 1مراجعه کنید).
واضح است که، این یک چارچوب کلی میتواند برای هرگونه تجزیه و تحلیل در بخش بیمه و بانک و یا بخشهای دیگر کاربرد داشته باشد.
در مرحله اول این روش، نمرات بهرهوری DMUها به عنوان متغیر هدف (مستقل) وارد درخت رگرسیون میشوند.
سپس عوامل محیطی در مرحله دوم به عنوان متغیرهای پیش بینی(وابسته)از یک طرف و نتایج بهره وری در مرحله اول از طرف دیگر وارد درخت رگرسیون میشوند و در نهایت
مجموعه قوانینی از درخت استخراج میشود. |
جدول1: عوامل ورودی در درخت تصمیم(1389-1387) |
|
|
شکل1: DEA/C&R متدلوژی برای ارزیابی شعب بیمه ایران |
1درجه شعبه:1، مجتمع ؛ 2، ممتاز ؛ 3، درجه1
2موقعیت جغرافیایی شعبه:1،شمال؛ 2، جنوب؛ 3، شرق؛ 4، غرب؛ 5، مرکز
3تحصیلات کارکنان:1، زیردیپلم؛ 2، دیپلم؛ 3، فوق دیپلم؛ 4، لیسانس؛ 5، فوق لیسانس؛ 6، دکترا
4جنسیت کارکنان:1، زن؛ 2، مرد
4. یافتههای پژوهش
4-1- روش بوت استرپینگ DEA/C&R برای ارزیابی شعب بیمه
یکی از مشکلات استفاده ازDEA/C&R این است که در بسیاری از مطالعات DEA، دادههای کافی برای تولید درخت تصمیم در دسترس وجود ندارد. بنابراین، روش Bootstrapping زیر برای افزایش تعداد DMUها قبل از ایجاد درخت تصمیم C&Rپیشنهاد شده است [15].
این روش از سه مرحله تشکیل شده است، مرحله اول: مقادیر کارایی و بهرهوری را برای هر شعبه محاسبه نموده و بر طبق این نمرات شعب را به سه گروه پیشرفت
بهرهوری (Progress) (Target>1 MPI>1 )، پسرفت
بهرهوری (Regress) (Target<1 MPI<1 ) و بدون تغییر (No change) Target=1) MPI=1) تقسیم میشوند.
یک درخت C&Rدقیق، به یک پایگاه داده بزرگ نیاز دارد؛ بنابراین چون نمونه ما تنها شامل 18 شعبه بیمه است، پس با افزایش پایگاه داده اصلی با100بار استفاده از تکنیک نمونهبرداری مجدد بوت استرپینگ که توسط افرون و تیبشیرانی توصیف شد است، استفاده میشود [16].
بنابراین در مرحله دوم، به طور تصادفی 18واحد (با جایگزینی) انتخاب میکنیم و این نمونهها را 100 بار تا به دست آوردن 1800واحد تکرار میکنیم. بعد از نمونهبرداری مجدد15100بار پایگاه داده اصلی، پایگاه داده به دو گروه آموزشی و آزمایشی به نسبت 7 به 3 تقسیم میشود.
جدول2: متغیرهای ورودی/خروجی در مدلDEA |
|
در طی بررسی روند بهرهوری در سالهای 1388-1387، 5 واحد روند پیشرفت و 13 واحد روند پسرفت داشتهاند و در طی سالهای 1389-1388، 8 واحد بهرهور و 10 واحد عدم بهرهوری را نشان میدهند.
به طور میانگین، 2/36% واحدها دارای پیشرفت بهرهوری و2/66% واحدها پسرفت بهرهوری را نشان میدهند. البته به دلیل پراکندگی بالای مقادیر دادههای ورودی درخت تمام مقادیر قبل از ورود به درخت نرمال شده و سپس وارد درخت شده است تا سبب کاهش دقت پیشبینی نشود.
· مرحله دوم: بوت استرپینگ (Bootstrapping)
همانطور که در بخش قبل به طور کامل توضیح داده شد، با
انتخاب تصادفی 18 واحد با جایگذاری و تکرار این نمونهها 100بار یک پایگاه داده با 1800 واحد به دست آمد. که این اطمینان را برای رسیدن به دقت بالاتری در پیشبینی درختC&R به ما خواهد داد.
· مرحله سوم: تحلیل C&R
بر طبق ارزیابی DEA شعب بیمه به سه گروه، پیشرفت بهرهوری (MI>1)، پسرفت بهرهوری (MI<1) و بدون تغییر بهرهوری (1MI=) تقسیم میشود. این گروهها، به عنوان متغیر هدف در درخت C&R مورد استفاده قرار
میگیرند نمرات کارایی و بهرهوری شعب با شاخص مالمکوییست در جدول3 نشان داده شده است.
|
جدول3: نمرات بهره وری به دست آمده از مدلLVM با شاخص مالمکوییست |
5. بحث و نتیجهگیری
با توجه به انتخاب درخت C&R، با شاخصی به نام (Impurity) بر حسب کمترین مقدار ناخالصی در هر گره، برای تمام خصیصهها16 میزان ناخالصی را قبل و بعد از شاخهزدن محاسبه نموده و خصیصهای که ناخالصی را بیشتر کاهش دهد را انتخاب میکند. به این ترتیب چندین درخت تصمیمگیری رگرسیون، برای هر دوره رسم میشود.
5-1- تحلیل نتایج درخت رگرسیون طی دوره (1388-1387)
ابتدا درخت پیشبینی را برای سال (1388-1387) با متغیرهای، درجه شعبه، قدمت، موقعیت مکانی، تعداد کارمندان فوق لیسانس و دکترا، تعداد وامهای این دوره، تعداد بیمهنامههای صادر شده در این دوره، تعداد
خسارتهای پرداختی در این دوره، به عنوان ورودی و طبقهبندی بهرهوری به عنوان خروجی درخت در نظر گرفته میشود. توجه داشته باشید که یکی از ویژگیهای ذاتی درخت، حذف برخی از ویژگیها برحسب اهمیت یا حداقل همبستگی است، بنابراین درخت تنها با متغیرهای تعداد بیمهنامههای صادره، قدمت و موقیعت مکانی به عنوان متغیرهای محیطی وارد میکنیم.
شکل2، اهمیت متغیرهای محیطی را نشان میدهد. در این شکل مشاهده میکنیم، که تعداد خسارتهای پرداختی دارای بیشترین اهمیت در تعیین طبقهبندی را دارد (59%) و قدمت با (21%) و موقعیت جغرافیایی (0.17%) در جایگاه دوم و سوم و بقیه متغیرها با(0.5%) در مقامهای بعدی اهمیت قرار دارند، اما چون متغیرهای بعدی در جایگاه یکسان اهمیت قرار دارند تا رسیدن به نتیجه مطلوب و دقت بیشتر درخت را با متغیرهای همرده دوباره میسازیم. جدول6-3 دقت پیشبینی درخت تولید شده را نشان
میدهد. به واسطه 1800مورد:
1290مورد در طی سال187-1388، شاخص بهرهوری زیر یک و510 مورد بالای یک را پیشبینی میکند و از 1246 مورد داده برای آزمایش (Training) دادهها صورت گرفته است، 1156مورد به صورت صحیح پیشبینی شده است و با دقت 92.78% این پیشبینی همراه است و90 مورد به اشتباه پیش بینی شده است.
سطح دقت کلی درخت پیشبینی C&R،98.02% است، که سطج اطمینان بالایی را نشان میدهد.
در شکل3درخت تولید شدهC&R ، با 8 گره نمایش داده شده است.
جدول4: دقت پیشبینی درخت تولید شده (شکل6-2) |
شکل2: اهمیت متغیرهای محیطی درخت (1388-1387) |
شکل3: درخت تولید شده با متغیرهای محیطی (1388-1387)
|
بر طبق این درخت قوانین زیر استخراج میشود:
استخراج قوانین برای شعب با پیشرفت بهرهوری
شعب با روند پیشرفت بهرهوری (در مجموع 325 مورد از1246)، اگر قوانین به صورت زیر دنبال شود:
· قانون1: اگر تعداد خسارت پرداختی کوچکتر مساوی 0.020باشد، آنگاه شعبه دارای پیشرفت بهرهوری است (Progress)؛ (192 مورد).
· قانون2: اگر تعدادخسارت پرداختی هر شعبه بزرگتر از 0.020و قدمت تأسیس مربوط به کمتر مساوی از سال1380 باشد و موقعیت مکانی در غرب شهر تهران باشد، آنگاه شعبه دارای پیشرفت بهرهوری است. (Progress)؛ (50مورد).
· قانون3: اگر تعداد خسارت پرداختی شعب بیشتر از 0.020 و قدمت تأسیس مربوط به بیشتر از سال 1380 باشد، آنگاه شعبه دارای پیشرفت بهرهوری است (Progress) ؛ (72 مورد).
5-2- استخراج قوانین برای شعب با پسرفت
بهرهوری
شعب با روند پسرفت بهرهوری (در مجموع 914 مورد از1246)، اگر قوانین به صورت زیر دنبال شود:
· قانون4: اگر تعداد خسارت پرداختی بزرگتر مساوی 0.020 و قدمت شعبه کمتر مساوی سال1380 و موقعیت مکانی شعبه (مرکز، شرق، شمال وجنوب) باشد، آنگاه شعبه دارای روند پسرفت بهرهوری است (Regress) ؛ (912 مورد).
5-3- تحلیل نتایج درخت رگرسیون طی دوره (1389-1388)
جدول5 دقت پیشبینی درخت تولید شده را نشان میدهد. به واسطه 1800مورد:
997 مورد درطی سال1389-1388، شاخص بهرهوری زیر یک و803 مورد بالای یک را پیشبینی میکند و از 1246 مورد داده برای آزمایش (Training) دادهها صورت گرفته است، کل 1246 مورد به صورت صحیح پیشبینی شده است و با دقت100% این پیشبینی همراه است.
سطح دقت کلی درخت پیشبینی C&R، 100% است، که سطح اطمینان بالایی را نشان میدهد.
در شکل5 درخت تولید شده C&R، با 579 مورد پیشرفت بهرهوری و 667 مورد کاهش بهرهوری، با 8 گره نمایش داده شده است.
با توجه به نمودار تشکیل شده در شکل4 که اهمیت متغیرهای ورودی را در درخت رگرسیون نشان میدهد، تعداد خسارات پرداختی در سال1389با (67%) در جایگاه اول و قدمت شعبه با (30%) اهمیت در جایگاه دوم و بقیه متغیرها (تعداد کارمندان با تحصیلات دکترا و فوق لیسانس، درجه شعبه و تعداد بیمهنامههای صادره در سال89) با (6%) در جایگاه بعدی با اهمیت یکسان قرار دارند.
|
جدول5: دقت پیشبینی درخت شکل 5
|
|
شکل4: اهمیت متغیرهای محیطی در درخت ایجاد شده
|
|
شکل5: درخت ایجادشده با متغیرهای اهمیت جدول4
|
5-4- استخراج قوانین برای شعب با پیشرفت
بهرهوری (579 مورد)
· قانون1: اگر تعداد خسارات در سال1389 کمتر مساوی 0.316 باشد و قدمت تأسیس مربوط به سالهای بعد 1372 و قبل 1380 باشد، آنگاه شعبه دارای روند پیشرفت بهرهوری است (Progress)؛ (528 مورد).
· قانون2: اگر تعداد خسارت در سال 1389 کمتر مساوی 0.316 باشد و قدمت تأسیس مربوط به سالهای بعد 1380 باشد و تعداد وامهای پرداختی کمتر مساوی0.034 باشد، شعبه دارای پیشرفت بهرهوری است (Progress) (51 مورد).
5-5- استخراج قوانین برای شعب با پسرفت
بهرهوری(667 مورد)
· قانون3: اگر تعداد خسارت پرداختی سال1389 کمتر مساوی 0.316 باشد و قدمت تأسیس شعبه مربوط به
سالهای قبل از 1372 باشد، شعبه دارای روند کاهشی یا پسرفت بهرهوری است (Regress)؛ (138مورد).
· قانون4: اگر تعداد خسارت پرداختی سال1389 کمتر مساوی 0.316 و قدمت تأسیس شعبه مربوط به سالهای بعد از1372 باشد وتعداد وامهای پرداختی بیشتر از 0.034باشد، شعبه دارای روند کاهشی یا پسرفت بهرهوری است (Regress)؛ (74 مورد).
· قانون5: اگر تعداد خسارت پرداختی بیش از 0.316 پس شعبه دارای روند پسرفت بهرهوری است (Regress)؛ (455 مورد).
5-6- ارزیابی نهایی
به طورخلاصه این مقاله، به معرفی ترکیب DEA و رویکرد درخت C&R میپردازد. مطالعه موردی ما در این مطالعه شعب بیمه ایران در شهر تهران می باشد.
به طور کلی، تحلیل پوششی دادهها نمرات کارایی و با استفاده از شاخص مالمکوییست، نمرات بهرهوری را میتوان محاسبه نمود، اما این روش نمیتواند عوامل مربوط به ناکارایی و عدم بهرهوری را توضیح دهد، خصوصاً اگر این عوامل در شکل متغیرهای غیرعددی مانند درجه شعب باشند.
استفاده از درختC&R میتواند درک بهتری از نتایج به دست آمده از تحلیل پوششی دادهها را نشان دهد و با بررسی عوامل مربوط به کارایی و بهرهوری و عدم بهرهوری که یک مسئله مهم برای سیاست گزاران است، در نظر گرفته شود.
همچنین ما روش پیشنهادی را در صنعت بیمه مورد مطالعه قرار داده، اما روش پیشنهادی در این مطالعه به طور بالقوه دارای کاربردهای بسیار گستردهتری است.
روش پیشنهادی DEA/C&R یک چارچوب برای هر مطالعه دیگری است که می تواند برای ارزیابی کارایی و بهرهوری واحدهای تصمیم گیرنده(DMUS) مورد استفاده قرار گیرد.
نتایج مدل ترکیبی، یک مجموعه قوانینی است که میتواند توسط سیاستگزاران برای کشف دلایل کارایی و ناکارایی واحدهای تصمیمگیرنده مورد استفاده قرار گیرد. اگرچه، برخی از محدودیتها، زمانیکهDEA باC&R ترکیب میشود، وجود دارد.
ایجاد یک درخت خوب و قابل اطمینانC&R ، معمولاً به یک پایگاه داده بزرگ با مشاهدات زیادی نیازمند است.
در اغلب گزارشات DEA در ادبیات موضوع، تعداد واحدهای تصمیمگیرنده (DMUS) به اندازه کافی بزرگ نیست که بتواند یک درختC&R را تغذیه کند.
در این مطالعه، روش بوت استرپینگ (Bootstrapping) را برای رفع این مشکل پیشنهاد کردیم؛ با این حال به نظر میرسد که این موضوع نیاز به تحقیقات بیشتری برای برنامههای کاربردی دارد.
5-7- نتیجه گیری
تحلیل پوششی دادهها (DEA)، یک ابزار مدیریتی برای ارزیابی کارایی و بهرهوری است. این مقاله به معرفی یک چارچوب ترکیب DEAبا طبقهبندی و تحلیل رگرسیون میپردازد.
در حالی که،DEA نتایج قابل قبول و ارزشمندی ارایه
میدهد، از طرفی تحلیلC&R ، مبتنی برتحلیل یافتههای حقایقی اضافی که در مطالعات قبلی نامشخص بودند را برای ما آشکار میکند. برخلاف مطالعات قبل در حوزه تحلیل پوششی دادهها وصنعت بیمه که به شناسایی تأثیر یکسانی از عوامل بر روی کارایی میپردازد، درختC&R، مبتنی بر تحلیل پیشنهادهایی است که سطح17 تأثیر عوامل وابسته به کارایی و بهرهوری را بر روی شعب نشان میدهد.
با بررسی اهمیت متغیرها با نرمافزار کلمنتاین18 و تأثیر قدرت آنها در وابستگی متغیرها با کمترین میزان ناخالصی تا رسیدن به گره هدف، این روند میتواند به تفکیک دقیق عوامل محیطی با نتایج کارایی و بهرهوری شعب که از مرحله قبل و با روش DEA به دست آمده، تحلیلی قابل تعمق و با کمترین میزان خطا را در پی داشته باشد.
با بررسی مطالعات گذشته بر روی صنعت بیمه، تاکنون تنها به ارزیابی شعب بر اساس شاخصهای مؤثر و تنها به تحلیل کارایی یا ناکارایی و یا بهرهوری و عدم بهرهوری در طی دوره پرداخته شده است و به کشف عوامل محیطی مرتبط با پیشرفت بهرهوری(Progress) و یا پسرفت بهرهوری (Regress) پرداخته نشده است.
به عنوان مثال، با این که تعداد خسارت و تعداد وامهای پرداختی و قدمت تأسیس شعبه به عنوان شاخص مهم بیمه در روند کارایی و ناکارایی محسوب نمیشود، اما همین طور که از قوانین استخراج شده استنباط میکنیم، به عنوان عوامل وابسته در این روند با سطح اهمیت متفاوت دخیل هستند.
از طرف دیگر، توانستیم به استخراج قوانین برای هر واحد تصمیمگیرنده (DMU) با استفاده از متغیرهای عددی19و ردهای20 که دارای درصدی از اهمیت بودند، بپردازیم و برای شناسایی بهرهوری و عدم بهرهوری در انتخاب شعب استفاده کنیم.
برخلاف مطالعات قبلی کاربردهای DEA، که تمرکز فقط در زمینه عددی برای محاسبه کارایی و بهرهوری
تصمیمگیری میشد، در این مطالعه با استفاده از درختC&R ، به توسعه عوامل مرتبط با بهرهوری و عدم بهرهوری میپردازد و هرقانونی که میتواند برای یک واحد بهرهور به دست آید با استفاده از متغیرهای عددی و متغیرهای قیاسی را استخراج کند. بدیهی است که این قوانین برای سیاستگزاران بیمه بسیار مفید و روند
تصمیمگیری آنان را تحتالشعاع قرار میدهد.
5-8- پیشنهادات آتی
تعدادی موضوعات فراتر از محدوده تحقیق ما وجود دارد که از لحاظ اهمیت کاربردی برای اشخاصی که با درخت C&R به تحلیل و ارزیابی موضوعات میپردازند، بسیار حائز اهمیت است. این عوامل عبارتند از فاکتورهای مستقل برای
بخشهای بیمه و استفاده از قوانین مختلف و اندازهگیری دقیق همچنین بهبود روش بوت استرپینگ، این موارد
میتواند زمینه را برای توسعه مطالعات آینده گستردهتر کند.
در تحقیقات آتی میتوان، پایگاه دادهای با رکوردهای بالا انتخاب نمود که مجبور به استفاده از بوتاسترپینگ برای تولید پایگاه داده معتبر نبوده وبه راحتی درختی با دقت بالا داشته باشیم، البته استفاده از شبیهسازی دادهها در این تحقیق جزء محدودیتهای تحقیق در زمینه دسترسی به دادههای مورد نظر بوده است.
همچنین میتوان از درخت تصمیم فازی به جای درخت تصمیم در حالت دقیق 21استفاده نمود که برای دادههای کیفی صنعت بیمه، نتایج مفیدی را ارائه میدهد و یا خروجیهای درخت را نتایج کارایی و ناکارایی مدل DEA قرار داد و یا بسته به نوع دادهها و اهمیت متغیرهای ورودی از درختان دیگری چون،،و.. استفاده نمود.
منابع
1. آذر عادل؛ مؤمنی منصور. 1383. اندازهگیری بهرهوری در شرکتهای تولیدی به وسیله مدلهای تحلیل پوششی
دادهها، دو ماهنامه علمی پژوهشی دانشور رفتار، دانشگاه شاهد، سال یازدهم، شماره 8.
2. امامی میبدی علی. 1384. اصول و اندازهگیری کارایی و بهرهوری (علمی- کاربردی)، مؤسسه مطالعات پژوهشهای بازرگانی، چاپ دوم، تهران.
3. اسفاندرانی حمید. 1390. طراحی شبکه فروش بیمههای عمر (مورد مطالعاتی شرکت سهامی بیمه ایران به روش تحلیل پوششی دادهها(DEA)، پایاننامه کارشناسیارشد، دانشگاه تربیت مدرس.
4. دعایی حبیب ا..؛ نیکخواه فرخانی زهرا. 1388. ارزیابی عملکرد عملیاتی و منابع انسانی نمایندگیهای بیمه کارافرین در استان خوزستان با نگرش چندگانه به روش تحلیل پوششی دادهها، فصلنامه صنعت بیمه، سال بیست و چهارم، شماره3و4، پاییز و زمستان، شماره مسلسل96-95.
5. سلطانپناه هیرش و همکاران. 1386. ارزیابی کارایی شعب بیمه البرز با استفاده از تحلیل پوششی دادهها، فصلنامه صنعت بیمه، سال بیست و دوم، شماره4، زمستان، شماره مسلسل88، 151-177.
6. مشیري سعید؛ رضوان مهدی. 1385. اثر بهکارگیري فناوري ارتباطات و اطلاعات در کارایی صنعت خدمات هوایی ایران، فصلنامه پژوهش هاي اقتصادي ایران، سال هشتم، ش 26.
7. مهرگان محمدرضا. 1383. مدلهای کمی در ارزیابی عملکرد سازمانها، انتشارات دانشگاه تهران.
8. Babazadeh, R. Razmi, J. Rabbani, M. Pishvaee, M. S. 2015. An integrated data envelopment analysis-mathematical programming approach to strategic biodiesel supply chain network design problem, Journal of Cleaner Production (Article in press).
9. Barros, C. P., Nektarios, M. & Assaf, A. 2010. Efficiency in the Greek insurance industry, European Journal of Operational Research DEA technology. Omega ,PP. 315-325.
10. Bretholt A, Pan J. . Evolving the latent variable model as a an environmental 9. Charnes, A, Cooper, WW, Rhodes, E. 1978. Measuring the efficiency of decision making units, European journal of operational research, 2, 429-444.
11. Barr, R., L.M. Siford and T.F. Simes. 1994. Forecasting bank failure: a non-parametric approach, Recherches Economiques de Louvain.
12. Breiman, L., J. Friedman, R. Olshenand C. Stone. 1984. Classification and Regression Trees, Pacific Grove, CA: Wadsworth-Monterey.
13. Charnes A., W. W. Cooper , Rhodes E. 1978. Measuring the Efficiency, European Journal of Operations Research, No 2.
14. Chen, Y., Cook, W.D., Li, N., Zhu, J. 2009. Additive efficiency decomposition in two stage DEA. European Journal of Operational Research.
15. Emrouznejad A., Anouze A. 2010. Data envelopment analysis with classification and regression tree-a case of banking efficiency, Expert Systems.
16. Efron, B. and Tibishirani R. 1993. An Introduction to the Bootstrap, New York: Chapman and Hall.
17. Fakhari A., Eftekhari Moghadam A.M. 2013. Combination of classification and regression in decision tree for multi-labeling image annotation and retrieval, Applied Soft Computing.
18.Fan Ch.K, & Cheng, Sh.W. 2009. Using Analytic Hierarchy Process Method and Technique for Order Preference by Similarity to Ideal Solution to Evaluate Curriculum in Department of Risk Management and Insurance, J. Soc. Sci., 19(1).
19. Farzipoor R. 2007. Suppliers selection in the presence of both cardinal and ordinal data, European Journal of Operational Research.
20. Emroznejad A., DEA Home page ,http://www.deazone.com/tutorial.
21. Han J., Kamber M. . Data Mining Concept and Techniques.nd Edition. San Francisco, Elsvier.
22. Hand D.J., Manilla H., Smyth P. 2001. Principles of Data, Cambridge, MA: MIT Press.
23. Hosseini Bamakan, S. M. Gholami, P. 2014. A Novel Feature Selection Method Based on an Integrated Data Envelopment Analysis and Entropy Model, 2nd International Conference on Information Technology and Quantitative Management, ITQM 2014, Procedia Computer Science 31, 632 – 638.
24. Hwang S., Kao T.L. 2007. Measuring Managerial Efficiency in Non-Life Insurance Companies: An Application of Two-Stage Data Envelopment Analysis, International Journal of a Management, vol., No..
25. Jahanshahloo GR. , Alirezaee MR. 1992. Measuring the efficiency of academic units at the Teacher Training University, Procedings of th Annual Iranian math conference.
26. Kim, H. and G.J. Koehler.1995. Theory and practice of decision tree induction, Omega.
27. Lee, S. 2010. Using data envelopment analysis and decision trees for efficiency analysis and recommendation of B2C controls, Decision Support Systems, 49, 486–497.
28. Luhnen, M. 2009. Efficiency and Competition in Insurance Markets, Dissertation no. 3675.
28. Mahlberg,B & Url, Th. 2010. Single Market effects on productivity in the German insurance industry, Journal of Banking & Finance.
28. Malmquist, S. 1953. Index numbers and indifference surfaces. Trabajos de Estatis- tica.
29. Nagurur, N. N. Rajbhanari, B. 2001. Data envelopment analysis for the performance evaluation of air conditioning and refrigeration companies in Thailand, Business Performance Management.
30. Park, J. Lee, D.S. Christakis, N, and Barabasi,A.L.. 2009. The impact of cellular networks on disease comorbidity, Molecular Systems Biology.
31. Pille, P. and Paradi J. 1997. Facets at the frontier and efficiency measurement in DEA, Paper presented at the Fifth European Workshop on Efficiency and Productivity Analysis.
32. Seol, H. Choi, J. Park, G. Park, Y. 2007. A framework for benchmarking service process using data Envelopment analysis and decision tree, Expert Systems with Applications, 32, 432–440.
33. Shahroudi K., Taleghani M., Mohammadi G. 2001. Efficiency Decomposition in Data Envelopment Analysis: An application to Insurance companies in Iran.
34.Sueyoshi T., Goto P. 2009. DEA-discriminate analysis Methodological comparison among eight discriminant analysis approaches, European Journal of Operational Research.
35. Tavana, M., Keramatpour, M., Santos-Arteaga, F.J., Ghorbaniane, E. 2015. A Fuzzy Hybrid Project Portfolio Selection Method Using Data Envelopment Analysis, TOPSIS and Integer Programming, Expert Systems with Applications (Article in press).
36. Torgo L. 1997. Functional models for regression tree leaves, Proceedings of the th International Conference on Machine Learning.
37. Wang, C. H. Chuang, J. J. 2015. Integrating decision tree With back propagation network to conduct business diagnosis and performance simulation For solar companies, Decision Support Systems (Article in press).
38. Xie X. 2010. Are publicly held firms less efficient? Evidence from the US property-liability insurance industry, Journal of Banking & Finance.
39. Yao, Sh., Han,zh.,& Feng, G. 2007. On technical efficiency of China's insurance industry after WTO accession, China Economic Review.
[1] Breiman
[2] Latent Variable Model
[3] Data Envelopment Analysis
[4] Charnens et al, 1978
[5] Chen et al, 2009
[6] MM Segovia-Gonzalez, Contreras and C Mar-Molinero
[7] Xie, 2010
[8] Barros et al, 2010
[9] Shahroudi, 2011
[10] Ripley
[11] Farrel 1957
[12] Technical Efficiency Change
[13] Efficient Production Frontier shift
[14] Sohn & Moon
[15] Re-sampling
[16] Attributes
[17] Level
[18] clementine
[19] Numerical
[20] Categorical
[21] Crisp
|
|