هنگامیکه شبکههای کامپیوتری ستون اصلی علم و اقتصاد شد، حجم زیادی از مستندات در دسترس قرار گرفتند. به همین منظور، برای استخراج اطلاعات مفید از روشهای متنکاوی استفاده میشود. متنکاوی یک حوزه پژوهشی مهم در کشف اطلاعات ناشناخته، فرضیات، و حقایق جدید بهوسیله استخراج اطل چکیده کامل
هنگامیکه شبکههای کامپیوتری ستون اصلی علم و اقتصاد شد، حجم زیادی از مستندات در دسترس قرار گرفتند. به همین منظور، برای استخراج اطلاعات مفید از روشهای متنکاوی استفاده میشود. متنکاوی یک حوزه پژوهشی مهم در کشف اطلاعات ناشناخته، فرضیات، و حقایق جدید بهوسیله استخراج اطلاعات از اسناد مختلف است. همچنین متنکاوی آشکار کردن اطلاعات پنهان با استفاده از روشی است که در یک طرف توانایی مقابله با تعداد زیادی کلمات و ساختارهایی در زبان طبیعی را نشان میدهد و از طرف دیگر اجازه مدیریت ابهام و شک را میدهد. علاوه بر آن، متنکاوی به عنوان دادهکاوی متن بیان میشود که معادل با تجزیه و تحلیل متون است و به فرایند استخراج اطلاعات از متن میپردازد و اطلاعات با کیفیت بالا را از میان الگوها و فرایندها استخراج میکند. همچنین به عنوان دادهکاوی متن یا کشف دانش از پایگاه دادههای متنی شناخته میشود و به فرایند استخراج الگوها یا دانش از اسناد متنی بیان میشود. روش تحقیق در این کار بدین صورت است که ابتدا به بررسی پژوهشهای انجام شده در حوزه متنکاوی با تأکید بر روشها و کاربردهای آن در آموزش الکترونیکی پرداخته شد. در طی این مطالعات، پژوهشهای مرتبط در حوزه آموزش الکترونیکی طبقهبندی گردیدند. پس از طبقهبندی پژوهشها، مسائل و راهکارهای مرتبط با مسائل مطرح شده در آن کارها، استخراج شدند. در همین راستا، در این مقاله ابتدا به تعریف متنکاوی پرداخته میشود. سپس فرایند متنکاوی و حوزههای کاربرد متنکاوی در آموزش الکترونیکی مورد بررسی قرار میگیرند. در ادامه روشهای متنکاوی معرفی شده و تک تک این روشها در حوزه آموزش الکترونیکی مطرح میگردد. در انتها ضمن استنتاج نکات مهم مطالعات انجام شده، مدلی جهت استخراج اطلاعات برای بهرهبرداری از روشهای متنکاوی در یادگیری الکترونیکی پیشنهاد میشود.
پرونده مقاله
با توسعه وب 2 و شبکه های اجتماعی، مشتریان و کاربران نظرهای خود را درباره ی محصولات مختلف با یکدیگر به اشتراک
می گذارند. این نظرها به عنوان یک منبع ارزشمند، جهت تعیین جایگاه کالا و موفقیت در بازاریابی، می تواند مورد استفاده قرار گیرد. استخراج نواقص گزارش شده از میان حج چکیده کامل
با توسعه وب 2 و شبکه های اجتماعی، مشتریان و کاربران نظرهای خود را درباره ی محصولات مختلف با یکدیگر به اشتراک
می گذارند. این نظرها به عنوان یک منبع ارزشمند، جهت تعیین جایگاه کالا و موفقیت در بازاریابی، می تواند مورد استفاده قرار گیرد. استخراج نواقص گزارش شده از میان حجم زیاد نظرهایی که توسط کاربران تولید شده از مشکلات عمده این زمینه تحقیقاتی است. مشتریان و مصرف کنندگان با مقایسه محصولات تولیدکنندگان مختلف نقاط قوت و ضعف محصولات را در قالب نظرهای مثبت و منفی بیان می نمایند. طبقه بندی نظرات بر اساس واژگان حسی مثبت و منفی در متن نظر به اسناد حاوی گزارش نقص و فاقد آن نتیجه درست و دقیقی در پی ندارد. چون گزارش نواقص صرفاً در نظرات منفی صورت نمی گیرد. ممکن است که مشتری نسبت به یک کالا حس مثبتی داشته باشد و با این حال در نظر خود یک نقص را گزارش نماید. بنابراین چالش دیگر این زمینه تحقیقاتی طبقه بندی درست و دقیق نظرات است. برای حل این مشکلات و چالش ها، در این مقاله روشی موثر و کارا برای استخراج نظرهای حاوی گزارش نقص محصول از نظرهای آنلاین کاربران ارائه گردیده است. بدین منظور طبقه بند جنگل تصادفی برای تشخیص گزارش نقص و تکنیک بدون ناظر مدل سازی موضوعی تخصیص پنهان دیریکله را برای ارائه ی خلاصه ای از گزارش نقص بکار گرفته شدند. برای تحلیل و ارزیابی روش پیشنهادی از داده های وب سایت آمازون استفاده شده است. نتایج نشان داد جنگل تصادفی حتی با تعداد کم داده های آموزشی عملکرد قابل قبولی برای کشف گزارش نقص دارد. نتایج و خروجی های استخراج شده از اسناد حاوی گزارش نقص، شامل خلاصه ی گزارش نقص جهت سهولت در تصمیم گیری تولیدکنند-گان، یافتن الگوهای وجود گزارش نقص در متن به صورت خودکار و کشف جنبه هایی از محصول که بیشترین گزارش نقص مربوط به آنها
می باشد، نشان دهنده توانایی روش تخصیص پنهان دیریکله است.
پرونده مقاله
پیشبینی بازارها از جمله سهام به دلیل حجم بالای معاملات و نقدینگی برای محققان و سرمایهگذاران دارای جذابیت بوده است. توانایی پیشبینی جهت قیمت ما را قادر میسازد با کاهش ریسک و اجتناب از ضرر و زیان مالی، به بازده بالاتری دستیابیم. اخبار نقش مهمی در فرایند ارزیابی قیمت چکیده کامل
پیشبینی بازارها از جمله سهام به دلیل حجم بالای معاملات و نقدینگی برای محققان و سرمایهگذاران دارای جذابیت بوده است. توانایی پیشبینی جهت قیمت ما را قادر میسازد با کاهش ریسک و اجتناب از ضرر و زیان مالی، به بازده بالاتری دستیابیم. اخبار نقش مهمی در فرایند ارزیابی قیمت فعلی سهام دارد. توسعه روشهای دادهکاوی، هوش محاسباتی و الگوریتمهای یادگیری ماشین سبب ایجاد مدلهای جدیدی در پیشبینی شدهاند. هدف از این پژوهش ذخیره سازی اخبار خبرگزارها و استفاده از روشهای متن کاوی و الگوریتم ماشین بردار پشیبان به منظور پیشبینی جهت قیمت روز آینده سهم است. بدین منظور خبرها منتشر شده در 17 خبرگزاری با استفاده از یک خزگشر موضوعی به زبان پیاچپی ذخیره و دستهبندی شده است. سپس با استفاده از روشهای متنکاوی و الگوریتم ماشین بردار پشتیبان و کرنلهای مختلف به پیشبینی جهت قیمت سهام گروه محصولات شیمیایی در بورس اوراق بهادار پرداخته میشود. دراین مطالعه از 300 هزار خبر در دستههای سیاسی و اقتصادی و قیمتهای سهام 25 شرکت منتخب در بازه زمانی آبان تا اسفند 97 در 122 روز معاملاتی استفاده شده است. نتایج نشان میدهد با مدل ماشین بردار پشتیبان با کرنل خطی میتوان به صورت میانگین 83 درصد جهت قیمتها را پیشبینی کرد. با استفاده از کرنلهای غیرخطی و معادله درجه 2 ماشین بردار پشتیبان صحت پیشبینی به صورت میانگین تا 85 درصد افزایش مییابد و سایر کرنلها نتایج ضعیفتری از خود نشان میدهند.
پرونده مقاله
با گسترش روزافزون علم و فناوري، تحلیل نظرات کاربران و تعیین نحوه نگرش کاربر به موضوعهاي مختلف به یک امر مهم تبدیل شده است. نظرکاوي فرایند استخراج نگرش افراد از روي نظرات نوشته شده است که در سه سطح سند، جمله و جنبه قابل انجام است. در سطح جنبه، نظر افراد در خصوص جنبههاي م چکیده کامل
با گسترش روزافزون علم و فناوري، تحلیل نظرات کاربران و تعیین نحوه نگرش کاربر به موضوعهاي مختلف به یک امر مهم تبدیل شده است. نظرکاوي فرایند استخراج نگرش افراد از روي نظرات نوشته شده است که در سه سطح سند، جمله و جنبه قابل انجام است. در سطح جنبه، نظر افراد در خصوص جنبههاي مختلف یک موضوع بررسي ميشود. مهمترین زیر بخش نظرکاوي جنبهگرا، استخراج جنبه است که موضوع اصلي این پژوهش ميباشد. در بسیاري از روشهاي ارائه شده براي استخراج جنبه، راه حل مورد نظر نیاز به مجموعه یادگیري اولیه و یا منابع زباني وسیع دارند که تهیه چنین دادههایي بسیار زمانبر و پرهزینه است.
در این مقاله، رویکردي بدون نظارت براي استخراج جنبه مبتني بر مدل موضوعي و بردار کلمات پیشنهاد ميشود که از ایجاد گراف کلمات براي ادغام اطلاعات معنایي و دانش دامنه استفاده ميکند. نتایج ارزیابيها نشان از این دارد که روش پیشنهادي نه تنها باعث بهبود دقت استخراج جنبه در مقایسه با سایر روشهاي پیشین شده است، بلکه تمامي مراحل به صورت خودکار و بدون دخالت کاربر انجام ميشود و بدلیل عدم وابستگي به منابع زباني، در زبانهاي مختلف قابل اجرا ميباشد.
پرونده مقاله