جلسه ۹ رپیدماینر: آموزش یک مدلسازی عملی جهت طبقه بندی مجموعه ای از داده ها در رپیدماینر
جلسه ۹: آموزش یک مدلسازی عملی جهت طبقه بندی مجموعه ای از داده ها در رپیدماینر
یکی از مهمترین فرآیند و آزمایشاتی که در علم داده کاوی و هوش مصنوعی صورت می پذیرد، طبقه بندی، پیش بینی و تشخیص رخدادهای آینده یا اطلاعات فعلی یک سیستم است. طبقه بندی داده ها جزو روش های با نظارت بوده که هدف اصلی اش طبقه بندی نمونه هایی است که جدیداً وارد سیستم می شوند. در این آموزش به طبقه بندی دیتاست سرطان سینه در زنان پرداخته شده است.
در فرآیند طبقه بندی نمونه های موجود در یک سیستم یا پیش بینی رخدادهای آینده یا تشخیص نمونه های جدید در یک سیستم دو نوع داده وجود دارند که عبارتند از: ۱) داده های آموزشی یا Train 2) داده های آزمایشی یا Test
داده های آموزشی ۷۰% الی ۸۰% از کل نمونه های استفاده شده است. از داده های آموزشی برای آموزش دادن هسته الگوریتم های یادگیری ماشین (Machine Learning) استفاده می گردد.
داده های آزمایشی که معمولاً ۳۰% الی ۲۰% از نمونه های استفاده شده در یک سیستم است جهت ارزیابی و سنجش میزان عملکرد الگوریتم استفاده شده اعم از الگوریتم های درخت تصمیم، شبکه عصبی، ماشین بردار پشتیبان، KNN و غیره کاربرد دارد.
از مهمترین جلسات پیش نیاز این جلسه آموزشی، جلسه شماره ۱ از دوره های آموزشی رپیدماینر می باشد زیرا در جلسه آموزشی شماره ۱ ضمن اشاره نمودن به نحوه تفکیک نمونه های Test و Train، یک نمونه عملی نیز مثال زده شده است.
اگر بخواهیم بصورت خلاصه یافته های این جلسه آموزشی را تشریح کنیم، باید اینگونه بیان نمود که در این جلسه آموزشی از مجموعه دوره های آموزشی رپیدماینر، ابتدا نحوه تفکیک داده های آموزشی (%۸۰) و داده های آزمایشی (%۲۰) پرداخته می شود. پس دو نوع الگوریتم که هر کدام شامل زیرمجموعه ای از الگوریتم ها هستند را جهت طبقه بندی و تشخیص بیماری سرطان سینه و پیش بینی برق مصرفی معرفی خواهیم نمود. الگوریتم هایی را که در این جلسه آموزشی همراه با ارائه دو مثال عملی به آن پرداخته می شود عبارتند از: الگوریتم درخت تصمیم، شبکه عصبی، ماشین بردار پشتیبان، KNN است.
در این جلسه آموزشی دو نوع مدل تولید می گردد یکی مدلی که میلیارهای مثل دقت (Accuracy )، صحت (Precision)، فراخوانی (Recall) و خطا را با کمک اپراتورهای Performance را محاسبه کرده و نمایش می دهد. دوم مدلی که در خروجی نتایج پیش بینی را نشان می دهد.
سرفصل ها و رئوس مطالب بحث شده در این جلسه از دوره های آموزشی رپیدماینر عبارتند از:
- معرفی مختصر دیتاست سرطان سینه در خانم ها
- معرفی مختصر دیتاست پیش بینی میزان بار مصرفی و محتویات دیتاست
- آموزش نحوه تفکیک داده های آزمایشی (Test) و داده های آموزشی (Train) در قالب فایل های اکسل
- معرفی الگوریتم طبقه بندی درخت تصمیم بصورت کامل همراه با پارامترهای مهم آن
- معرفی الگوریتم طبقه بندی شبکه عصبی بصورت کامل همراه با پارامترهای مهم آن
- معرفی الگوریتم طبقه بندی KNN بصورت کامل همراه با پارامترهای مهم آن
- معرفی الگوریتم طبقه بندی SRM بصورت کامل همراه با پارامترهای مهم آن
- معرفی کنترل Validation جهت ارزیابی عملکرد الگوریتم ها
- معرفی کنترل Apply Model جهت تولید مدل برای الگوریتم های یادگیری ماشین
- معرفی کنترل Performance Classification جهت محاسبه معیارهای دقت، فراخوانی، صحت و خطا
- تشریح کامل خروجی های ارزیابی
- تشریح کامل خروجی مدل پیش بینی
در جلسات آتی تحت عنوان جلسات فوق العاده بصورت خاص به تدریس و آموزش اختصاص الگوریتم های پرکاربردی مثل Ad boost، Deep Learning ، Boosting و Voting پرداخته خواهد شد که می توانید در جلسات آینده ملاحظه نمائید.
این آموزش برای رشته های زیر مفید است:
دوره های آموزشی نرم افزار داده کاوی رپیدماینر(Rapidminer) از جلسات مقدماتی تا سطوح متوسطه و پیشرفته برای رشته هایی ذیل مناسب و مفید می باشد.
- رشته کامپیوتر گرایش های نرم افزار، سخت افزار و معماری
- رشته تجارت الکترونیک
- رشته برنامه نویسی
- رشته فناوری اطلاعات
- و سایر رشته های مرتبط
جلسه ۹ رپیدماینر: آموزش یک مدلسازی عملی جهت طبقه بندی مجموعه ای از داده ها در رپیدماینر
-
رایگانجلسه۲۲ رپیدماینر: آموزش یک پروژه عملی درجهت پردازش تصویر در رپیدماینر
-
رایگانجلسه ۲۱ رپیدماینر: آموزش پردازش تصویر در رپیدماینر
-
رایگانجلسه ۲۰ رپیدماینر: آموزش یک پروژه عملی جهت تحلیل احساسات افراد در پیام ها با استفاده از متن کاوی در رپید ماینر
-
رایگانجلسه ۱۹ رپیدماینر: آموزش متن کاوی یا Text Mining در نرم افزار داده کاوی رپیدماینر
-
رایگانجلسه۱۸ رپیدماینر: آموزش اضافه نمودن پلاگین در نرم افزار داده کاوی رپیدماینر
-
رایگانجلسه ۱۷ رپیدماینر: آموزش انتخاب ویژگی با کنترل Optimization و الگوریتم های طبقه بندی در رپیدماینر
-
رایگانجلسه۱۶ رپیدماینر: آموزش انتخاب ویژگی های بهینه از مجموعه ی داده ها با استفاده از الگوریتم pso_svm در رپیدماینر
-
رایگاندوره آموزشی رپیدمانیر
-
رایگانجلسه۱۴ رپیدماینر: آموزش طبقه بندی داده های سرطان سینه با استفاده از روش voting در رپیدماینر
-
رایگانجلسه۱۳ رپیدماینر: آموزش طبقه بندی داده ها با الگوریتم Deep learning در رپیدماینر
-
رایگانجلسه۱۲ رپیدماینر: آموزش طبقه بندی مجموعه داده ها با کمک الگوریتم یادگیری عمیق در نرم افزار داده کاوی در رپیدماینر
-
رایگانجلسه۱۱ رپیدماینر: آموزش یک پروژه عملی پیش بینی میزان برق مصرفی باکمک الگوریتم های پیش بینی کننده در رپیدماینر
-
رایگانجلسه ۱۰رپیدماینر: آموزش پیش بینی با الگوریتم های شبکه عصبی و SVM در رپیدماینر
-
رایگانجلسه ۹ رپیدماینر: آموزش یک مدلسازی عملی جهت طبقه بندی مجموعه ای از داده ها در رپیدماینر
-
رایگانجلسه ٨ رپیدماینر: آموزش الگوریتم های طبقه بندی (Classification) در رپیدماینر
-
رایگانجلسه۷ رپیدماینر: آموزش یک پروژه عملی جهت خوشه بندی دیتاست حملات در رپیدماینر
-
رایگانجلسه۶ رپیدماینر: آموزش خوشه بندی داده ها در نرم افزار داده کاوی رپیدماینر
-
رایگانجلسه ۵ رپیدماینر: آموزش کنترل های تبدیل داده در رپیدماینر
-
رایگانجلسه ۴ رپیدماینر: آموزش تبدیل انواع داده ها به یکدیگر و اعمال پیش پرداز بر روی داده ها در رپیدماینر
-
رایگانجلسه ۳ رپیدماینر: آموزش ورود انواع دیتاست ها به رپیدماینر
مشاهده همه مطالب