• شماره های پیشین

    • فهرست مقالات Data Mining

      • دسترسی آزاد مقاله

        1 - ارائه روشی برای بخش‌بندی مشتریان با استفاده از مدل RFM در شرایط عدم قطعیت
        عظیمه مظفری
        هدف از انجام این پژوهش ارائه روشی برای بخش‌بندی مشتریان بانک بر مبنای مدل RFM در شرایط عدم قطعیت می‌باشد. در چارچوب پیشنهادی این پژوهش پس از تعیین مقادیر شاخص‌های مدل RFM شامل تازگی مبادله (R)، تعداد دفعات مبادله (F) و ارزش پولی مبادله (M) برای از بین بردن عدم قطعیت حاک چکیده کامل
        هدف از انجام این پژوهش ارائه روشی برای بخش‌بندی مشتریان بانک بر مبنای مدل RFM در شرایط عدم قطعیت می‌باشد. در چارچوب پیشنهادی این پژوهش پس از تعیین مقادیر شاخص‌های مدل RFM شامل تازگی مبادله (R)، تعداد دفعات مبادله (F) و ارزش پولی مبادله (M) برای از بین بردن عدم قطعیت حاکم بر آن‌ها، از تئوری اعداد خاکستری استفاده شده و با استفاده از یک روش متفاوت به بخش‌بندی مشتریان پرداخته شده است. به این ترتیب مشتریان بانک به سه بخش یا خوشه اصلی تحت عنوان مشتریان خوب، معمولی و بد تفکیک شده اند. پس از اعتبارسنجی خوشه‌ها با استفاده از شاخص‌های دان و دیویس بولدین، ویژگی‌های مشتریان در هر یک از بخش‌ها شناسایی شده است. در پایان نیز پیشنهادهایی جهت بهبود سیستم مدیریت ارتباط با مشتری ارائه می‌گردد. پرونده مقاله
      • دسترسی آزاد مقاله

        2 - ارائه مدلی برای استخراج اطلاعات از مستندات متنی، مبتنی بر متن‌کاوی در حوزه یادگیری الکترونیکی
        سمیه آهاری
        هنگامی‌که شبکه‌های کامپیوتری ستون اصلی علم و اقتصاد شد، حجم زیادی از مستندات در دسترس قرار گرفتند. به همین منظور، برای استخراج اطلاعات مفید از روش‌های متن‌کاوی استفاده می‌شود. متن‌کاوی یک حوزه پژوهشی مهم در کشف اطلاعات ناشناخته، فرضیات، و حقایق جدید به‌وسیله استخراج اطل چکیده کامل
        هنگامی‌که شبکه‌های کامپیوتری ستون اصلی علم و اقتصاد شد، حجم زیادی از مستندات در دسترس قرار گرفتند. به همین منظور، برای استخراج اطلاعات مفید از روش‌های متن‌کاوی استفاده می‌شود. متن‌کاوی یک حوزه پژوهشی مهم در کشف اطلاعات ناشناخته، فرضیات، و حقایق جدید به‌وسیله استخراج اطلاعات از اسناد مختلف است. همچنین متن‌کاوی آشکار کردن اطلاعات پنهان با استفاده از روشی است که در یک طرف توانایی مقابله با تعداد زیادی کلمات و ساختارهایی در زبان طبیعی را نشان می‌دهد و از طرف دیگر اجازه مدیریت ابهام و شک را می‌دهد. علاوه بر آن، متن‌کاوی به عنوان داده‌کاوی متن بیان می‌شود که معادل با تجزیه و تحلیل متون است و به فرایند استخراج اطلاعات از متن می‌پردازد و اطلاعات با کیفیت بالا را از میان الگوها و فرایندها استخراج می‌کند. همچنین به عنوان داده‌کاوی متن یا کشف دانش از پایگاه ‌داده‌های متنی شناخته می‌شود و به فرایند استخراج الگوها یا دانش از اسناد متنی بیان می‌شود. روش تحقیق در این کار بدین صورت است که ابتدا به بررسی پژوهش‌های انجام شده در حوزه متن‌کاوی با تأکید بر روش‌ها و کاربردهای آن در آموزش الکترونیکی پرداخته شد. در طی این مطالعات، پژوهش‌های مرتبط در حوزه آموزش الکترونیکی طبقه‌بندی گردیدند. پس از طبقه‌بندی پژوهش‌ها، مسائل و راهکارهای مرتبط با مسائل مطرح شده در آن کارها، استخراج شدند. در همین راستا، در این مقاله ابتدا به تعریف متن‌کاوی پرداخته می‌شود. سپس فرایند متن‌کاوی و حوزه‌های کاربرد متن‌کاوی در آموزش الکترونیکی مورد بررسی قرار می‌گیرند. در ادامه روش‌های متن‌کاوی معرفی شده و تک تک این روش‌ها در حوزه آموزش الکترونیکی مطرح می‌گردد. در انتها ضمن استنتاج نکات مهم مطالعات انجام شده، مدلی جهت استخراج اطلاعات برای بهره‌برداری از روش‌های متن‌کاوی در یادگیری الکترونیکی پیشنهاد می‌شود. پرونده مقاله
      • دسترسی آزاد مقاله

        3 - تلفیق مدل تحلیل پوششی داده¬ها و درخت تصمیم به منظور ارزیابی واحدهای مبتنی بر تکنولوژی اطلاعات
        امیر امینی علی علی نژاد سمیه  شفقی زاده
        هر سازمان به منظور آگاهی از میزان عملکرد و مطلوبیت فعالیت واحدهای خود به یک نظام ارزشیابی جهت سنجش این مطلوبیت نیاز دارد و این موضوع برای مؤسسات مالی از جمله شرکت های مبتنی بر تکنولوژی اطلاعات اهمیت بیشتری دارد. تحلیل پوششی داده ها یک روش غیرپارامتری برای اندازه گیری ک چکیده کامل
        هر سازمان به منظور آگاهی از میزان عملکرد و مطلوبیت فعالیت واحدهای خود به یک نظام ارزشیابی جهت سنجش این مطلوبیت نیاز دارد و این موضوع برای مؤسسات مالی از جمله شرکت های مبتنی بر تکنولوژی اطلاعات اهمیت بیشتری دارد. تحلیل پوششی داده ها یک روش غیرپارامتری برای اندازه گیری کارایی و بهره وری از واحدهای تصمیم گیری (DMUs)هاست. از طرف دیگر تکنیک داده کاوی به DMUs))ها اجازه کاوش و کشف اطلاعات معنی داری، که قبلاً در پایگاه داده های بزرگ پنهان بوده اند را می دهد. این مقاله یک چارچوب کلی ترکیب تحلیل پوششی داده ها بادرخت رگرسیون را برای ارزیابی کارایی و بهره وری ازDMUها پیشنهاد می کند. نتیجه مدل ترکیبی مجموعه ای از قوانین است که می تواند توسط سیاست گذاران برای کشف دلایلDMUهای کارآمد و ناکارآمد مورد استفاده قرار گیرد. به عنوان مطالعه موردی با استفاده از روش پیشنهادی برای بررسی عوامل مرتبط با بهره وری نمونه ای شامل 18 شعبه از بیمه ایران در شهر تهران انتخاب گردید و پس از مدل سازی بر مبنای مدل پیشرفته LVM ورودی محور با دسترسی پذیری ضعیف درتحلیل پوششی داده ها با خروجی نامطلوب محاسبه گردید و با تکنیک درخت تصمیم، به استخراج قوانین برای کشف دلایل افزایش بهره وری و پسرفت بهره وری می پردازد. پرونده مقاله
      • دسترسی آزاد مقاله

        4 - ارائه روشی برای بخش‌بندي مشتريان با استفاده از مدل RFM در شرایط عدم قطعیت
        محمدرضا غلامیان عظیمه مظفری
        هدف از انجام اين پژوهش ارائه روشی برای بخش‌بندی مشتریان یکی از بانک‌های خصوصی شهر شیراز بر مبنای مدل RFM در شرایط عدم قطعیت داده‌های مربوط به مشتریان است. در چارچوب پيشنهادي اين پژوهش ابتدا مقادير شاخص‌هاي مدل RFM شامل تازگي مبادله (R)، تعداد دفعات مبادله (F) و ارزش پول چکیده کامل
        هدف از انجام اين پژوهش ارائه روشی برای بخش‌بندی مشتریان یکی از بانک‌های خصوصی شهر شیراز بر مبنای مدل RFM در شرایط عدم قطعیت داده‌های مربوط به مشتریان است. در چارچوب پيشنهادي اين پژوهش ابتدا مقادير شاخص‌هاي مدل RFM شامل تازگي مبادله (R)، تعداد دفعات مبادله (F) و ارزش پولي مبادله (M) از پایگاه داده مشتریان استخراج و پیش‌پردازش شدند. با توجه به گستردگی دامنه داده‌های مذکور، برای تعیین وضعیت خوب یا بد بودن مشتری نمی‌توان عدد دقیقی تعیین نمود؛ لذا برای از بین بردن این عدم قطعیت، از تئوری اعداد خاکستری استفاده شد که وضعیت مشتری را به صورت یک بازه در نظر می‌گیرد. به این ترتیب با استفاده از یک روش متفاوت به بخش‌بندی مشتريان بانک پرداخته شد که طبق نتایج، مشتریان به سه بخش یا خوشه اصلی تحت عنوان مشتریان خوب، معمولی و بد تفکیک شدند. پس از اعتبارسنجی خوشه‌ها با استفاده از شاخص‌های دان و دیویس بولدین، ویژگی‌های مشتریان در هر یک از بخش‌ها شناسایی شد و در پایان نيز پيشنهادهايي جهت بهبود سيستم مديريت ارتباط با مشتري ارائه گردید. پرونده مقاله
      • دسترسی آزاد مقاله

        5 - بهبود روش شناسایی وب سایت فیشینگ با استفاده از داده‌کاوی روی صفحات وب
        مهدیه بهارلو علیرضا یاری
        فیشینگ یک نوع حمله اینترنتی در سطح وب است که هدف آن سرقت مشخصات فردی کاربران برای دزدی آنلاین است. فیشینگ دارای اثر منفی در از بین بردن اعتماد بین کاربران در کسب‌وکارهای الکترونیکی است؛ بنابراین در این تحقیق سعی بر بررسی روشهای تشخیص وب سایت‌های فیشینگ با استفاده از داد چکیده کامل
        فیشینگ یک نوع حمله اینترنتی در سطح وب است که هدف آن سرقت مشخصات فردی کاربران برای دزدی آنلاین است. فیشینگ دارای اثر منفی در از بین بردن اعتماد بین کاربران در کسب‌وکارهای الکترونیکی است؛ بنابراین در این تحقیق سعی بر بررسی روشهای تشخیص وب سایت‌های فیشینگ با استفاده از داده کاوی شده است. شناسایی ویژگی‌های برجسته از فیشینگ یکی از پیش‌شرط‌های مهم در طراحی یک سیستم تشخیصی دقیق است؛ لذا در گام اول، برای شناسایی ویژگی‌های نفوذ فیشینگ یک لیست با 30 ویژگی مطرح در وب‌سایت‌های فیشینگ آماده گردید. سپس برای افزایش کارایی سامانه‌های تشخیص فیشینگ روش جدیدی جهت کاهش ویژگی ها در دومرحله‌ مبتنی بر انتخاب ویژگی و استخراج ویژگی پیشنهاد شده است که موجب می شود تعداد ویژگی‌ها به‌طور قابل‌توجهی کاهش یابند. پس‌ازآن عملکرد روش‌های درخت تصمیم J48، جنگل تصادفی و بیزین ساده بر روی ویژگی‌های کاهش‌یافته موردبررسی قرار گرفت. نتایج نشان می‌دهند دقت مدل ایجاد شده برای تعیین وب سایت‌های فیشینگ با استفاده از کاهش ویژگی دومرحله‌ای مبتنی بر پوششی و الگوریتم تحلیل مؤلفه اصلی (PCA) در روش جنگل تصادفی ۹۶٫۵۸% می‌باشد که نسبت به سایر روش‌ها نتیجه مطلوبی است. پرونده مقاله
      • دسترسی آزاد مقاله

        6 - ارائه ی مدلی برای عقیده کاوی در سطح ویژگی برای نظرات کاربران هتل ها
        الهام  خلج شهریار  محمدی
        امروزه بررسی نظرات و عقاید کاربران در بستر اینترنت بخش مهمی از فرآیند تصمیم گیری مردم در رابطه با انتخاب یک محصول یا استفاده از خدمات ارایه شده را شامل می شود. با وجود بستر اینترنت و دسترسی ساده به وبلاگ های مربوط به نظرات در زمینه صنعت گردشگری و هتلداری، منابع غنی و ع چکیده کامل
        امروزه بررسی نظرات و عقاید کاربران در بستر اینترنت بخش مهمی از فرآیند تصمیم گیری مردم در رابطه با انتخاب یک محصول یا استفاده از خدمات ارایه شده را شامل می شود. با وجود بستر اینترنت و دسترسی ساده به وبلاگ های مربوط به نظرات در زمینه صنعت گردشگری و هتلداری، منابع غنی و عظیمی از عقاید بصورت متن موجود می باشد که افراد می‌توانند از روش های متن کاوی برای کشف عقاید دیگران استفاده کنند. با توجه به اهمیت نظر و عقاید کاربران در صنایع و بویژه صنعت گردشگری و هتلداری، مباحث عقیده‌کاوی و تحلیل احساسات و کاوش متون نوشته شده توسط کاربران مورد توجه متصدیان امور قرار گرفته است . در این مقاله یک روش ترکیبی و جدید بر اساس یک رویکرد رایج در تحلیل احساسات، استفاده از واژگان برای تولید ویژگی هایی برای طبقه بندی بار احساسی نظرات ارائه شده است. بدین صورت که دو روش ساخت فهرست واژگان یکی با استفاده از روش های آماری و دیگری با استفاده از الگوریتم ژنتیکی ارائه شده است. واژگان فوق الذکر با فرهنگ واژگان احساس عمومی و استاندارد لیو بینگ آمیخته می شوند تا دقت طبقه بندی افزایش یابد. پرونده مقاله
      • دسترسی آزاد مقاله

        7 - ارائه مدلی برای پیش بینی بقای بیماران مبتلا به ملانوم بر اساس الگوریتم های داده کاوی
        فریناز صناعی سید عبدالله امین موسوی عباس طلوعی اشلقی علی  رجب زاده قطری
        مقدمه: ملانوم جزء شایعترین سرطان تشخیصي و دومین علت مرگ ناشي از سرطان در میان افراد است. تعداد مبتلایان به آن در حال افزایش است. ملانوم، نادرترین و بدخیم ترین نوع سرطان پوست است.در شرایط پیشرفته توانایي انتشار به ارگانهاي داخلي را دارد و ميتواند منجر به مرگ شود. طبق ب چکیده کامل
        مقدمه: ملانوم جزء شایعترین سرطان تشخیصي و دومین علت مرگ ناشي از سرطان در میان افراد است. تعداد مبتلایان به آن در حال افزایش است. ملانوم، نادرترین و بدخیم ترین نوع سرطان پوست است.در شرایط پیشرفته توانایي انتشار به ارگانهاي داخلي را دارد و ميتواند منجر به مرگ شود. طبق برآوردهاي انجمن سرطان آمریکا براي ملانوم در ایالاتمتحده براي سال 2022 عبارتاند از: حدود 99،780 ز افراد مبتلابه ملانوم تشخیص داده شدند و حدود 7،650 نفر در اثر ملانوم جان خود را از دست ميدهند. لذا هدف از این مطالعه، طراحي بهبود دقت الگوریتم براي پیش بیني بقاي این بیماران است. روش پژوهش: روش حاضر کاربردي، توصیفي- تحلیلي و گذشتهنگر است. جامعه پژوهش را بیماران مبتلابه سرطان ملانوم پایگاه داده مرکز تحقیقات کشوري سرطان دانشگاه شهید بهشتي ) 1۳87 تا 1۳91 ( که تا 5 سال مورد پیگیري قرارگرفته بودند، تشکیل داده است. مدل پیشبیني بقاي ملانوم بر اساس شاخص هاي ارزیابي الگوریتم هاي داده کاوي انتخاب شد. یافته ها: الگوریتم هاي شبکه عصبي، بیز ساده، شبکه بیزي، ترکیب درخت تصمیم گیري با بیز ساده، رگرسیون لجستیک، J48 ، ID3 بهعنوان مدل هاي استفاده شده ي پایگاه داده کشور انتخاب شدند . عملکرد شبکه عصبي در همه شاخصهاي ارزیابي ازلحاظ آماري نسبت به سایر الگوریتم هاي منتخب بالاتر بود. نتیجه گیري: نتایج مطالعه حاضر نشان داد که شبکه عصبي با مقدار 97 / 0 ازلحاظ دقت پیش بیني عملکرد بهینه دارد. بنابراین مدل پیش بیني کننده بقاي ملانوم، هم ازلحاظ قدرت تمایز و هم ازلحاظ پایایي، عملکرد بهتري از خود نشان داد؛ بنابراین، این الگوریتم به عنوان مدل پیش بیني بقاي ملانوم پیشنهاد شد پرونده مقاله
      • دسترسی آزاد مقاله

        8 - ارائه یک سیستم توصیه گر وب برای پیش بینی صفحات مورد علاقه کاربر با استفاده از الگوریتم خوشه بندی DBSCAN و روش SVM یادگیری ماشین
        رضا  مولایی فرد محمد مصلح
        سیستم‌های توصیه گر می‌توانند درخواست‌های آینده کاربر را پیش‌بینی و سپس لیستی از صفحات موردعلاقه کاربر را تولید کند. به‌عبارت‌دیگر سیستم های توصیه گر می توانند نمایه ایی دقیق از رفتار کاربران را به دست آورده و صفحه ایی پیش‌بینی شود که کاربر درحرکت بعدی آن را انتخاب خواهد چکیده کامل
        سیستم‌های توصیه گر می‌توانند درخواست‌های آینده کاربر را پیش‌بینی و سپس لیستی از صفحات موردعلاقه کاربر را تولید کند. به‌عبارت‌دیگر سیستم های توصیه گر می توانند نمایه ایی دقیق از رفتار کاربران را به دست آورده و صفحه ایی پیش‌بینی شود که کاربر درحرکت بعدی آن را انتخاب خواهد کرد که این کار می‌تواند مشکل شروع سرد سیستم را حل و باعث کیفیت بخشیدن به جستجو شود. در این تحقیق به ارائه روش جدیدی به‌منظور بهبود سیستم‌های توصیه گر در زمینه وب پرداخته می‌شود که از الگوریتم خوشه‌بندی DBSCAN جهت خوشه‌بندی داده‌ها استفاده می‌شود که این الگوریتم امتیاز کارایی ۹۹٪ را به دست آورد. سپس با استفاده از الگوریتم Page rank، صفحات موردعلاقه کاربر وزن دهی می‌شوند. سپس با استفاده از روش SVM، داده‌ها را دسته‌بندی و جهت تولید پیش‌بینی به کاربر به یک سیستم توصیه گر ترکیبی داده می‌دهیم که درنهایت این سیستم توصیه گر لیستی از صفحات را در اختیار کاربر قرار خواهد داد که می‌تواند موردعلاقه وی باشند. ارزیابی نتایج حاصل از تحقیق حاکی از آن بود که استفاده از این روش پیشنهادی می‌تواند امتیاز ۹۵% را در قسمت فراخوانی و امتیاز ۹۹% را در قسمت دقت به دست آورد که این نتایج اثبات می‌کند که این سیستم توصیه گر تا بیش از ۹۰٪ می‌تواند صفحات موردنظر کاربر را به‌درستی تشخیص داده و تا حدود زیادی نقاط ضعف سایر سیستم های پیشین را برطرف سازد. پرونده مقاله
      • دسترسی آزاد مقاله

        9 - تشخیص نفوذ و ناهنجاری ها با استفاده از داده کاوی و انتخاب ویژگی ها بوسیله الگوریتم PSO
        فریدون  رضائی محمدعلی افشار کاظمی محمد علی کرامتی
        امروزه با توجه به پیشرفت فناوری و توسعه استفاده از اینترنت در کسب و کارها و تغییر نوع کسب و کارها از حالت فیزیکی به مجازی و اینترنت، باعث شده است که نوع حملات و ناهنجاری‌های مرتبط نیز از حالت فیزیکی به حالت مجازی تغییر کند. یعنی بجای دستبرد به یک فروشگاه یا مغازه، افراد چکیده کامل
        امروزه با توجه به پیشرفت فناوری و توسعه استفاده از اینترنت در کسب و کارها و تغییر نوع کسب و کارها از حالت فیزیکی به مجازی و اینترنت، باعث شده است که نوع حملات و ناهنجاری‌های مرتبط نیز از حالت فیزیکی به حالت مجازی تغییر کند. یعنی بجای دستبرد به یک فروشگاه یا مغازه، افراد با استفاده از حملات سایبری به سایت‌ها و فروشگاه‌های مجازی نفوذ کرده و در آنها اخلال ایجاد می‌کنند. آشکارسازی حملات و ناهنجاری‌ها یکی از چالش‌های جدید در مسیر پیشبرد تکنولوژی تجارت الکترونیک می‌باشد. تشخیص ناهنجاری‌های یک شبکه و فرآیند شناسایی فعالیت‌های مخرب در کسب و کارهای تجارت الکترونیک با تجزیه و تحلیل رفتار ترافیک شبکه امکان‌پذیر است. سیستم‌های داده‌کاوی بطور گسترده‌ای در سیستمهای تشخیص نفوذ (IDS) برای تشخیص ناهنجاری‌ها استفاده می‌شوند. کاهش ابعاد ویژگی‌ها نقش بسیار مهمی در تشخیص نفوذ ایفا می‌کند، زیرا تشخیص ناهنجاری‌ها از ویژگی‌های ترافیک شبکه با ابعاد بالا فرآیندی زمان‌بری است. انتخاب ویژگی‌های درست و مناسب بر سرعت تجزیه و تحلیل و کار پیشنهادی تاثیر می‌گذارد و می‌تواند سرعت تشخیص را بهبود بخشد. در این مقاله با استفاده از الگوریتم‌های داده‌کاوی مانند بیزین، پرسپترون چندلایه، CFS، Best First، J48 و PSO، میزان دقت تشخیص ناهنجاری‌ها و حملات به 0.996 و میزان خطای آن 0.004 رسانده شده است. پرونده مقاله