حوزه یادگیری ماشین یکی از زیر مجموعه های هوش مصنوعی است که هوش مصنوعی با یادگیری روش حل مساله آنها را حل می کند اگر به این حوزه علاقه مندید و می خواهید اطلاعاتی در این زمینه کسب کنید باید بدانید امروزه دانشمندان داده از الگوریتم های مختلفی در این حوزه استفاده می کنند.
یادگیری ها شامل یادگیری نظارت شده ،یادگیری نظارت نشده، یادگیری نیمه نظارتی و یادگیری تقویتی می شود که در این مطلب در مورد کاربردهای یادگیری نظارت نشده صحبت می کنیم و انواع آن را برای شما شرح می دهیم در ابتدا به توضیح مختصری در خصوص الگوریتم های نظارت شده و نظارت نشده می پردازیم همچنین کاربرد یادگیری نظارت نشده را می آموزیم.
یادگیری به کمک تعدادی داده ی آموزشی و یا تجربیات صورت میگیرد اگر نتوانیم مستقیما برنامه ای را بنویسیم از یادگیری استفاده می کنیم.
آنچه در این نوشته خواهیم داشت
یادگیری نظارت شده(Supervised learning)
یادگیری نظارت شده نوعی از یادگیری مربوط به یادگیری ماشین است که در آن ورودی و خروجی مشخص است و در واقع ناظری اطلاعاتی را در اختیار یادگیرنده قرار میدهد، و به این ترتیب سیستم تابعی را از ورودی به خروجی یاد می گیرد، در آن از داده های برچسب گذاری شده استفاده می شود.
برای مثال ایمیلی که به شما زده می شود را در نظر بگیرید ایمیل ها ورودی هستند و خروجی اسپم یا غیر اسپم بودن آنهاست که در واقع اسپم ها فیلتر می شوند ابتدا داده ها به دو صورت اسپم و غیر اسپم تقسیم می شوند و به ماشین آموزش داده می شود از ماشین امتحان گرفته می شود و ایمیلی را به ماشین می دهید که تشخیص می دهد اسپم یا غیر اسپم است به عبارت دیگر برای ورودی ما خروجی تعریف شده است.
مطالعه مقاله «انواع یادگیری ماشین همراه با مثال» به شما توصیه می شود.
یادگیری بدون نظارت(Unsupervised learning)
یادگیری بدون نظارت یک روش یادگیری ماشین است که در آن کاربران نیازی به نظارت بر مدل ندارند. در عوض ، به مدل اجازه می دهد تا به تنهایی برای کشف الگوها و اطلاعاتی که قبلاً کشف نشده بودند کار کند، این کار عمدتا با داده های بدون برچسب سروکار دارد.
در یادگیری نظارت نشده بر خلاف یادگیری نظارت شده، داده ها از قبل مشخص نشده است و هدف آن ارتباط بین ورودی و خروجی نیست و فقط دستهبندی آنها مهم است و یادگیرنده که باید در دادهها به دنبال ساختاری خاص بگردد.
نمونه ای از یادگیری ماشین بدون نظارت
بیایید برای مثال یک نوزاد و سگ خانوادگی اش را در نظر بگیریم، او سگ خانوادگی اش را می شناسد و شناسایی می کند، چند هفته بعد یک دوست خانوادگی یک سگ جدید را به همراه می آورد و سعی می کند با کودک بازی کند.نوزاد این سگ را تا به حال ندیده است. اما بسیاری از خصوصیات (2 گوش ، چشم ، راه رفتن روی 4 پا) که مانند سگ حیوان خانگی او است را شناسایی می کند، او حیوان جدید را به عنوان یک سگ معرفی می کند.
این یادگیری بدون نظارت است ، جایی که به شما آموزش داده نمی شود اما از داده ها می آموزید (در این مورد داده های مربوط به یک سگ) اگر این یادگیری تحت نظارت بود ، دوست خانوادگی به کودک می گفت که این یک سگ است.
چرا از یادگیری بدون نظارت استفاده کنیم؟
در اینجا دلایل اصلی استفاده از یادگیری بدون نظارت آمده است:
- یادگیری ماشین بدون نظارت همه نوع الگوهای ناشناخته را در داده ها پیدا می کند.
- روش های بدون نظارت به شما در یافتن ویژگی هایی که می توانند برای دسته بندی مفید باشند کمک می کند.
- یادگیری بدون نظارت در زمان واقعی انجام می شود ، بنابراین تمام داده های ورودی باید در حضور زبان آموزان تجزیه و تحلیل و برچسب گذاری شوند.
- دریافت داده های بدون برچسب از رایانه آسانتر از داده های دارای برچسب است که نیاز به مداخله دستی دارند.
الگوریتم های یادگیری بدون نظارت
الگوریتم های یادگیری بدون نظارت به کاربران امکان می دهد کارهای پردازشی پیچیده تری را در مقایسه با یادگیری تحت نظارت انجام دهند. اگرچه یادگیری بدون نظارت در مقایسه با سایر روشهای یادگیری طبیعی می تواند غیر قابل پیش بینی باشد.
الگوریتم های یادگیری بدون نظارت شامل خوشه بندی ،روش پیوستگی،الگوریتمهای کاهش ابعاد Dimensionality Reduction،تشخیص ناهنجاری ، شبکه های عصبی و … است.
روش خوشه بندی(Clustering)
خوشه بندی هنگام یادگیری بدون نظارت مفهوم مهمی است. این کار عمدتا با یافتن ساختار یا الگویی در مجموعه داده های دسته بندی نشده سروکار دارد. الگوریتم های خوشه بندی داده های شما را پردازش می کنند و در صورت وجود خوشه های طبیعی (گروه ها) در داده ها ، پیدا می شوند. همچنین می توانید تعداد خوشه هایی را که الگوریتم های شما باید شناسایی کند اصلاح کنید. به شما امکان می دهد دانه بندی این گروه ها را تنظیم کنید به عبارت دیگر دادهها به چندین گروه با صفات مشترک تقسیم میشوند خوشه بندی نوعی یادگیری بدون نظارت است که در آن الگوهایی را برای داده هایی میابید که روی آنها کار می کنید که ممکن است به صورت شکل ، اندازه و غیره باشد که برای گروه بندی موارد داده یا ایجاد خوشه هم به کار می رود.
روش پیوستگی(Association)
قوانین پیوستگی به شما امکان می دهد تا در میان داده ها در پایگاه های داده بزرگ ارتباط و پیوستگی برقرار کنید. این روش بدون نظارت در مورد کشف روابط جالب بین متغیرها در پایگاه های داده بزرگ است. به عنوان مثال ، افرادی که خانه جدید می خرند به احتمال زیاد مبلمان جدید خریداری می کنند و یا افرادی که کالای x را میخرند تمایل دارند کالای y را هم بخرند.
الگوریتمهای کاهش ابعاد (Dimensionality Reduction)
کاهش ابعاد ، تبدیل داده ها از یک فضای با ابعاد بالا به یک فضای کم بعد است به طوری که نمایش با ابعاد پایین برخی از ویژگی های معنی دار داده های اصلی را حفظ می کند ، در حالت ایده آل نزدیک به بعد ذاتی آن می باشد.
این مدل را برای کم کردن یا ترکیب متغیرهایی به کار میبرد که تاثیر کمی روی نتیجه دارند یا اصلا بیتاثیر هستند، از این الگوریتم همراه با الگوریتم طبقهبندی یا رگرسیون استفاده می شود.
کاربردهای یادگیری ماشین بدون نظارت
برخی از کاربردهای تکنیک های یادگیری ماشین بدون نظارت عبارتند از:
- خوشه بندی به صورت خودکار مجموعه داده ها را بر اساس شباهت هایشان به گروه تقسیم می کند.
- تشخیص ناهنجاری می تواند نقاط داده غیرمعمول را در مجموعه داده شما کشف کند ، برای یافتن معاملات جعلی مفید است.
- روش پیوستگی مجموعه مواردی را که اغلب در مجموعه داده شما با هم وجود دارند شناسایی می کند.
- مدل های متغیر پنهان به طور گسترده ای برای پیش پردازش داده ها استفاده می شود. مانند کاهش تعداد ویژگی های یک مجموعه داده یا تجزیه مجموعه داده به چندین بخش.
معایب یادگیری بدون نظارت
- شما نمی توانید اطلاعات دقیق مربوط به مرتب سازی داده ها را بدست آورید ، و خروجی به عنوان داده های مورد استفاده در یادگیری بدون نظارت دارای برچسب و شناخته شده نیست.
- دقت کمتر نتایج بدلیل ناشناخته بودن داده های ورودی است و از قبل توسط افراد برچسب گذاری نشده است. این بدان معناست که دستگاه نیاز دارد خودش این کار را انجام دهد.
- کلاسهای طیفی همیشه با کلاسهای اطلاعاتی مطابقت ندارند.
- کاربر باید وقت خود را صرف تفسیر و برچسب گذاری کلاسهایی کند که از آن طبقه بندی پیروی می کنند.
- خصوصیات طیفی کلاسها نیز می توانند با گذشت زمان تغییر کنند بنابراین شما نمی توانید هنگام انتقال از یک تصویر به تصویر دیگر ، همان اطلاعات کلاس را داشته باشید.
جمع بندی
با توجه به مطالب گفته شده یادگیری نظارت نشده یکی از شاخه های ماشین لرنینگ است که کاربردهای زیادی از جمله در گروه بندی مشتری، تحلیل رفتار مصرف کننده،گروه بندی سوابق کارمندان و … دارد. این مدل یادگیری که با استفاده از زبان برنامه نوسی پایتون توسعه پیدا میکند، میتواند به عنوان نقطه عطفی در پیشرفت هوش مصنوعی در سال های آتی قلمداد شود. همانطور که توضیح داده شد الگوریتم های یادگیری نظارت نشده شامل حوزه گسترده ای است که به مطالعه بیشتری در این زمینه نیاز است.