• شماره های پیشین

    • فهرست مقالات Text mining

      • دسترسی آزاد مقاله

        1 - ارائه مدلی برای استخراج اطلاعات از مستندات متنی، مبتنی بر متن‌کاوی در حوزه یادگیری الکترونیکی
        سمیه آهاری
        هنگامی‌که شبکه‌های کامپیوتری ستون اصلی علم و اقتصاد شد، حجم زیادی از مستندات در دسترس قرار گرفتند. به همین منظور، برای استخراج اطلاعات مفید از روش‌های متن‌کاوی استفاده می‌شود. متن‌کاوی یک حوزه پژوهشی مهم در کشف اطلاعات ناشناخته، فرضیات، و حقایق جدید به‌وسیله استخراج اطل چکیده کامل
        هنگامی‌که شبکه‌های کامپیوتری ستون اصلی علم و اقتصاد شد، حجم زیادی از مستندات در دسترس قرار گرفتند. به همین منظور، برای استخراج اطلاعات مفید از روش‌های متن‌کاوی استفاده می‌شود. متن‌کاوی یک حوزه پژوهشی مهم در کشف اطلاعات ناشناخته، فرضیات، و حقایق جدید به‌وسیله استخراج اطلاعات از اسناد مختلف است. همچنین متن‌کاوی آشکار کردن اطلاعات پنهان با استفاده از روشی است که در یک طرف توانایی مقابله با تعداد زیادی کلمات و ساختارهایی در زبان طبیعی را نشان می‌دهد و از طرف دیگر اجازه مدیریت ابهام و شک را می‌دهد. علاوه بر آن، متن‌کاوی به عنوان داده‌کاوی متن بیان می‌شود که معادل با تجزیه و تحلیل متون است و به فرایند استخراج اطلاعات از متن می‌پردازد و اطلاعات با کیفیت بالا را از میان الگوها و فرایندها استخراج می‌کند. همچنین به عنوان داده‌کاوی متن یا کشف دانش از پایگاه ‌داده‌های متنی شناخته می‌شود و به فرایند استخراج الگوها یا دانش از اسناد متنی بیان می‌شود. روش تحقیق در این کار بدین صورت است که ابتدا به بررسی پژوهش‌های انجام شده در حوزه متن‌کاوی با تأکید بر روش‌ها و کاربردهای آن در آموزش الکترونیکی پرداخته شد. در طی این مطالعات، پژوهش‌های مرتبط در حوزه آموزش الکترونیکی طبقه‌بندی گردیدند. پس از طبقه‌بندی پژوهش‌ها، مسائل و راهکارهای مرتبط با مسائل مطرح شده در آن کارها، استخراج شدند. در همین راستا، در این مقاله ابتدا به تعریف متن‌کاوی پرداخته می‌شود. سپس فرایند متن‌کاوی و حوزه‌های کاربرد متن‌کاوی در آموزش الکترونیکی مورد بررسی قرار می‌گیرند. در ادامه روش‌های متن‌کاوی معرفی شده و تک تک این روش‌ها در حوزه آموزش الکترونیکی مطرح می‌گردد. در انتها ضمن استنتاج نکات مهم مطالعات انجام شده، مدلی جهت استخراج اطلاعات برای بهره‌برداری از روش‌های متن‌کاوی در یادگیری الکترونیکی پیشنهاد می‌شود. پرونده مقاله
      • دسترسی آزاد مقاله

        2 - کشف گزارش¬های نقص محصول از متن نظرات آنلاین کاربران
        نرگس نعمتی فرد محرم منصوری زاده مهدی سخائی نیا
        با توسعه وب 2 و شبکه های اجتماعی، مشتریان و کاربران نظرهای خود را درباره ی محصولات مختلف با یکدیگر به اشتراک می گذارند. این نظرها به عنوان یک منبع ارزشمند، جهت تعیین جایگاه کالا و موفقیت در بازاریابی، می تواند مورد استفاده قرار گیرد. استخراج نواقص گزارش شده از میان حج چکیده کامل
        با توسعه وب 2 و شبکه های اجتماعی، مشتریان و کاربران نظرهای خود را درباره ی محصولات مختلف با یکدیگر به اشتراک می گذارند. این نظرها به عنوان یک منبع ارزشمند، جهت تعیین جایگاه کالا و موفقیت در بازاریابی، می تواند مورد استفاده قرار گیرد. استخراج نواقص گزارش شده از میان حجم زیاد نظرهایی که توسط کاربران تولید شده از مشکلات عمده این زمینه تحقیقاتی است. مشتریان و مصرف کنندگان با مقایسه محصولات تولیدکنندگان مختلف نقاط قوت و ضعف محصولات را در قالب نظرهای مثبت و منفی بیان می نمایند. طبقه بندی نظرات بر اساس واژگان حسی مثبت و منفی در متن نظر به اسناد حاوی گزارش نقص و فاقد آن نتیجه درست و دقیقی در پی ندارد. چون گزارش نواقص صرفاً در نظرات منفی صورت نمی گیرد. ممکن است که مشتری نسبت به یک کالا حس مثبتی داشته باشد و با این حال در نظر خود یک نقص را گزارش نماید. بنابراین چالش دیگر این زمینه تحقیقاتی طبقه بندی درست و دقیق نظرات است. برای حل این مشکلات و چالش ها، در این مقاله روشی موثر و کارا برای استخراج نظرهای حاوی گزارش نقص محصول از نظرهای آنلاین کاربران ارائه گردیده است. بدین منظور طبقه بند جنگل تصادفی برای تشخیص گزارش نقص و تکنیک بدون ناظر مدل سازی موضوعی تخصیص پنهان دیریکله را برای ارائه ی خلاصه ای از گزارش نقص بکار گرفته شدند. برای تحلیل و ارزیابی روش پیشنهادی از داده های وب سایت آمازون استفاده شده است. نتایج نشان داد جنگل تصادفی حتی با تعداد کم داده های آموزشی عملکرد قابل قبولی برای کشف گزارش نقص دارد. نتایج و خروجی های استخراج شده از اسناد حاوی گزارش نقص، شامل خلاصه ی گزارش نقص جهت سهولت در تصمیم گیری تولیدکنند-گان، یافتن الگوهای وجود گزارش نقص در متن به صورت خودکار و کشف جنبه هایی از محصول که بیشترین گزارش نقص مربوط به آنها می باشد، نشان دهنده توانایی روش تخصیص پنهان دیریکله است. پرونده مقاله
      • دسترسی آزاد مقاله

        3 - به‌کارگیری وب‌کاوی در پیش‌بینی جهت قیمت سهام گروه محصولات شیمیایی در بورس اوراق بهادار
        امیر دایی امیدمهدی عبادتی کیوان  برنا
        پیش‌بینی بازارها از جمله سهام به دلیل حجم بالای معاملات و نقدینگی برای محققان و سرمایه‌گذاران دارای جذابیت بوده است. توانایی پیش‌بینی جهت قیمت ما را قادر می‌سازد با کاهش ریسک و اجتناب از ضرر و زیان مالی، به بازده بالاتری دست‌یابیم. اخبار نقش مهمی در فرایند ارزیابی قیمت چکیده کامل
        پیش‌بینی بازارها از جمله سهام به دلیل حجم بالای معاملات و نقدینگی برای محققان و سرمایه‌گذاران دارای جذابیت بوده است. توانایی پیش‌بینی جهت قیمت ما را قادر می‌سازد با کاهش ریسک و اجتناب از ضرر و زیان مالی، به بازده بالاتری دست‌یابیم. اخبار نقش مهمی در فرایند ارزیابی قیمت فعلی سهام دارد. توسعه روش‌های داده‌کاوی، هوش محاسباتی و الگوریتم‌های یادگیری ماشین سبب ایجاد مدل‌های جدیدی در پیش‌بینی شده‌اند. هدف از این پژوهش ذخیره سازی اخبار خبرگزارها و استفاده از روش‌های متن کاوی و الگوریتم ماشین بردار پشیبان به منظور پیش‌بینی جهت قیمت روز آینده سهم است. بدین منظور خبرها منتشر شده در 17 خبرگزاری با استفاده از یک خزگشر موضوعی به زبان پی‌اچ‌پی ذخیره و دسته‌بندی شده است. سپس با استفاده از روش‌های متن‌کاوی و الگوریتم ماشین بردار پشتیبان و کرنل‌های مختلف به پیش‌بینی جهت قیمت سهام گروه محصولات شیمیایی در بورس اوراق بهادار پرداخته می‌شود. دراین مطالعه از 300 هزار خبر در دسته‌های سیاسی و اقتصادی و قیمت‌های سهام 25 شرکت منتخب در بازه زمانی آبان تا اسفند 97 در 122 روز معاملاتی استفاده شده است. نتایج نشان می‌دهد با مدل ماشین بردار پشتیبان با کرنل خطی می‌توان به صورت میانگین 83 درصد جهت قیمت‌ها را پیش‌بینی کرد. با استفاده از کرنل‌های غیرخطی و معادله درجه 2 ماشین بردار پشتیبان صحت پیش‌بینی به صورت میانگین تا 85 درصد افزایش می‌یابد و سایر کرنل‌ها نتایج ضعیف‌تری از خود نشان می‌دهند. پرونده مقاله
      • دسترسی آزاد مقاله

        4 - بهبود استخراج جنبه های متن با استفاده از دانش دامنه و گراف کلمات
        محمدرضا شمس احمد براآنی مهدی هاشمی
        با گسترش روزافزون علم و فناوري، تحلیل نظرات کاربران و تعیین نحوه نگرش کاربر به موضوعهاي مختلف به یک امر مهم تبدیل شده است. نظرکاوي فرایند استخراج نگرش افراد از روي نظرات نوشته شده است که در سه سطح سند، جمله و جنبه قابل انجام است. در سطح جنبه، نظر افراد در خصوص جنبههاي م چکیده کامل
        با گسترش روزافزون علم و فناوري، تحلیل نظرات کاربران و تعیین نحوه نگرش کاربر به موضوعهاي مختلف به یک امر مهم تبدیل شده است. نظرکاوي فرایند استخراج نگرش افراد از روي نظرات نوشته شده است که در سه سطح سند، جمله و جنبه قابل انجام است. در سطح جنبه، نظر افراد در خصوص جنبههاي مختلف یک موضوع بررسي ميشود. مهمترین زیر بخش نظرکاوي جنبهگرا، استخراج جنبه است که موضوع اصلي این پژوهش ميباشد. در بسیاري از روشهاي ارائه شده براي استخراج جنبه، راه حل مورد نظر نیاز به مجموعه یادگیري اولیه و یا منابع زباني وسیع دارند که تهیه چنین دادههایي بسیار زمانبر و پرهزینه است. در این مقاله، رویکردي بدون نظارت براي استخراج جنبه مبتني بر مدل موضوعي و بردار کلمات پیشنهاد ميشود که از ایجاد گراف کلمات براي ادغام اطلاعات معنایي و دانش دامنه استفاده ميکند. نتایج ارزیابيها نشان از این دارد که روش پیشنهادي نه تنها باعث بهبود دقت استخراج جنبه در مقایسه با سایر روشهاي پیشین شده است، بلکه تمامي مراحل به صورت خودکار و بدون دخالت کاربر انجام ميشود و بدلیل عدم وابستگي به منابع زباني، در زبانهاي مختلف قابل اجرا ميباشد. پرونده مقاله