یادگیری ماشینی (ML) یا یادگیری عمیق، به انواع روش های یادگیری ماشین بستگی دارد که اقدامات انجام شده را اطلاع دهند و سپس یک تابع استنباط شده را تولید کنند.
در آینده، ممکن است شاهد آن باشیم که ماشینها به خودآگاهی واقعی دست یابند و مستقل از ورودیهای انسانی و تحت تأثیر دادهها عمل میکنند.
اما در حال حاضر، انسانها و دادهها همچنان نقش مهمی در شکل دهی پیش بینیهای ماشین محور دارند.
انواع روش های یادگیری ماشین مختلف بوده و بسته به این که چه دادههایی در دسترس است و چه سؤالی پرسیده میشود، برای ایجاد یک نتیجه با استفاده از یکی از این انواع روشها آموزش داده میشود.
در این مقاله به بررسی یادگیری ماشین، انواع روش های یادگیری ماشین و عوامل مهم در انتخاب انواع روش های یادگیری ماشین خواهیم پرداخت.
1# یادگیری ماشین چیست؟
یادگیری ماشینی شاخهای از هوش مصنوعی است که بر توسعه مدلها و انواع روش های یادگیری ماشین تمرکز میکند و به کامپیوترها اجازه میدهد از دادهها یاد بگیرند و از تجربیات قبلی خود بدون برنامه ریزی صریح برای هر کار، استفاده کنند.
به عبارت ساده، ML به سیستمها میآموزد که با یادگیری از دادهها مانند انسانها فکر و درک کنند.
یادگیری ماشینی به صورت کلی یک سیستم آموزشی برای یادگیری از تجربیات گذشته و بهبود عملکرد در طول زمان است.
یادگیری ماشینی به پیش بینی حجم عظیمی از دادهها و همپنین به ارائه نتایج سریع و دقیق برای به دست آوردن فرصتهای سودآور کمک میکند.
2# انواع روش های یادگیری ماشین
در ابتداییترین حالت، یادگیری ماشین از انواع روشهای برنامه ریزی شده ای استفاده کرده که دادههای ورودی را دریافت و تجزیه و تحلیل میکند تا مقادیر خروجی را در محدوده قابل قبولی پیش بینی کند.
همانگونه که دادههای جدید به این روشها ایجاد میشوند، آنها عملیات خود را برای بهبود عملکرد یاد گرفته و بهینه کرده و در طول زمان هوش مصنوعی را توسعه میدهند.
پنج نوع روش یادگیری ماشین وجود دارد که عبارت اند از:
- تحت نظارت یا supervised
- نیمه نظارتی یا semi-supervised
- بدون نظارت یا unsupervised
- تقویتی یا reinforcement
- خودنظارتی یا Self-supervised
که در ادامه به بررسی هر یک از آنها خواهیم پرداخت.
1-2# یادگیری ماشینی تحت نظارت
یادگیری تحت نظارت زمانی تعریف میشود که یک مدل روی مجموعه دادههای برچسب دار آموزش ببیند.
مجموعه دادههای برچسب گذاری شده دارای پارامترهای ورودی و خروجی هستند و در روشهای یادگیری نظارتی میآموزند که نقاط بین ورودیها و خروجیهای صحیح را ترسیم کنند.
این روش از انواع روش های یادگیری ماشین، دارای هر دو مجموعه داده آموزشی و اعتبارسنجی برچسب گذاری شده است.
مثال: سناریویی را در نظر بگیرید که در آن باید یک طبقه بندی کننده تصویر بسازید، تا بین گربهها و سگها تمایز قائل شود.
اگر مجموعه دادههای سگها و گربهها را با تصاویر برچسب دار به الگوریتم تغذیه کنید، دستگاه میآموزد که از این تصاویر برچسب گذاری شده بین سگ یا گربه تمایز قائل نشود.
وقتی تصاویر جدیدی از سگ یا گربه وارد میکنیم که قبلاً هرگز ندیده است، از الگوریتمهای آموخته شده استفاده و پیش بینی میکند که سگ است یا گربه.
این روشی است که یادگیری تحت نظارت با آن کار میکند.
دو دسته اصلی از یادگیری تحت نظارت وجود دارد که عبارت اند از:
- طبقه بندی
- رگرسیون
1) مزایای یادگیری ماشین نظارت شده
مزایای یادگیری این دسته از انواع روش های یادگیری ماشین عبارت اند از:
- مدلهای یادگیری نظارت شده میتوانند دقت بالایی داشته باشند؛ زیرا روی دادههای برچسب دار آموزش داده میشوند.
- فرآیند تصمیم گیری در مدلهای یادگیری نظارت شده اغلب قابل تفسیر است.
- اغلب میتوان از آن در مدلهای از پیش آموزش دیده استفاده کرد که باعث صرفه جویی در زمان و منابع هنگام توسعه مدلهای جدید از ابتدا میشود.
2) معایب یادگیری ماشینی نظارت شده
معایب این روش عبارت اند از:
- محدودیتهایی در شناخت الگوها دارد و ممکن است با الگوهای نادیده یا غیرمنتظرهای که در دادههای آموزشی وجود ندارند، تقابل داشته باشد.
- میتواند وقت گیر و پرهزینه باشد؛ زیرا فقط به دادههای برچسب دار متکی است.
- منجر به تعمیم ضعیف بر اساس دادههای جدید شود.
3) کاربردهای یادگیری تحت نظارت
یادگیری تحت نظارت در طیف گسترده ای از برنامهها استفاده میشود، از جمله:
- طبقه بندی تصویر
- پردازش زبان طبیعی
- تشخیص گفتار
- سیستمهای توصیه
- تجزیه و تحلیل پیش بینی کننده
- تشخیص پزشکی
- تشخیص تقلب
- وسایل نقلیه خودمختار
- تشخیص هرزنامه ایمیل
- کنترل کیفیت در تولید
- امتیازدهی اعتباری
- بازی
- پشتیبانی مشتری
- پیش بینی آب و هوا
- تجزیه و تحلیل ورزشی
2-2# یادگیری نیمه نظارتی
یادگیری نیمه نظارتی یکی از انواع روش های یادگیری ماشین است که بین یادگیری نظارت شده و بدون نظارت کار کرده، بنابراین از دادههای برچسب دار و بدون برچسب استفاده میکند.
این به ویژه زمانی مفید است که به دست آوردن دادههای برچسب دار پرهزینه، وقت گیر یا منابع فشرده باشد.
یادگیری نیمه نظارتی زمانی انتخاب میشود که دادههای برچسب گذاری شده به مهارتها و منابع مرتبط نیاز داشته باشند تا بتوان با استفاده از آنها آموزش داد یا از آن یاد گرفت.
از این تکنیکها زمانی استفاده میشود که با دادههایی سروکار داریم که کمی از آنها برچسب دارند و بخش بزرگی بدون برچسب هستند.
میتوانیم از تکنیکهای بدون نظارت به منظور پیش بینی برچسبها استفاده کرده و سپس این برچسبها را به تکنیکهای نظارت شده تغذیه کنیم.
این تکنیک بیشتر در مورد مجموعه دادههای تصویری که معمولاً همه تصاویر برچسب گذاری نمیشوند، کاربرد دارد.
مثال: در نظر بگیرید که ما در حال ساخت یک مدل ترجمه زبان هستیم، داشتن ترجمههای برچسب دار برای هر جفت جمله میتواند منابع زیادی را به خود اختصاص دهد.
این امر به مدلها اجازه میدهد تا از جفت جملات برچسب دار و بدون برچسب یاد بگیرند و آنها را دقیقتر میکند.
این تکنیک به بهبود قابل توجهی در کیفیت خدمات ترجمه ماشینی میانجامد.
1) انواع روش های یادگیری ماشین نیمه نظارتی
تعدادی از روشهای مختلف یادگیری نیمه نظارتی وجود دارد که هر کدام ویژگیهای خاص خود را دارند.
برخی از رایجترین آنها عبارت اند از:
- یادگیری نیمه نظارتی مبتنی بر نمودار: این رویکرد از یک نمودار برای نشان دادن روابط بین نقاط داده استفاده میکند.
سپس نمودار برای انتشار برچسبها از نقاط داده برچسب دار به نقاط داده بدون برچسب استفاده میشود. - انتشار برچسب: این رویکرد به صورت مکرر برچسبها را از نقاط داده برچسب گذاری شده به نقاط داده بدون برچسب، بر اساس شباهتهای بین نقاط داده منتشر میکند.
- آموزش مشترک: این رویکرد دو مدل مختلف یادگیری ماشینی را زیرمجموعههای مختلف دادههای بدون برچسب آموزش میدهد.
سپس از این دو مدل برای برچسب زدن پیش بینیهای یکدیگر استفاده میشود. - خودآموزی: این رویکرد یک مدل یادگیری ماشینی را روی دادههای برچسب دار آموزش داده و سپس از مدل برای پیش بینی برچسب برای دادههای بدون برچسب استفاده میکند.
سپس مدل روی دادههای برچسب گذاری شده و برچسبهای پیش بینی شده برای دادههای بدون برچسب دوباره آموزش داده میشود. - شبکههای مولد GANs :GANها نوعی الگوریتم یادگیری عمیق هستند که میتوانند برای تولید دادههای مصنوعی استفاده شوند.
از GANها میتوان برای تولید دادههای بدون برچسب به منظور یادگیری نیمه نظارتی با آموزش دو شبکه عصبی، یک مولد و یک تشخیص دهنده استفاده کرد.
2) مزایای یادگیری ماشین نیمه نظارت شده
مزایای یادگیری این دسته از انواع روش های یادگیری ماشین میتوان به موارد زیر اشاره کرد:
- در مقایسه با یادگیری نظارت شده به تعمیم بهتری میانجامد؛ زیرا هم دادههای برچسب دار و هم بدون برچسب را در بر میگیرد.
- میتواند برای طیف گستردهای از دادهها اعمال و استفاده شود.
3) معایب یادگیری ماشین نیمه نظارت شده
از جمله معایب یادگیری ماشین نیمه نظارت شده میتوان به موارد زیر اشاره کرد:
- روشهای نیمه نظارت شده میتوانند در مقایسه با سایر رویکردها پیچیدهتر باشند.
- هنوز به برخی دادههای برچسب گذاری شده نیاز دارد که ممکن است، همیشه در دسترس نباشد یا به راحتی به دست آید.
- دادههای بدون برچسب میتوانند بر عملکرد مدل تأثیر بگذارند.
4) کاربردهای یادگیری نیمه نظارتی
در این بخش برخی از کاربردهای رایج یادگیری نیمه نظارتی آورده شده است که عبارت اند از:
- طبقه بندی تصویر و تشخیص اشیا
- پردازش زبان طبیعی (NLP)
- تشخیص گفتار
- سیستمهای توصیه
- مراقبتهای بهداشتی و تصویربرداری پزشکی
3-2# یادگیری ماشینی بدون نظارت
یادگیری بدون نظارت، نوعی تکنیک یادگیری ماشینی است که در آن یک روش، الگوها و روابط را با استفاده از دادههای بدون برچسب کشف میکند.
برخلاف یادگیری تحت نظارت، یادگیری بدون نظارت شامل ارائه روش با خروجیهای هدف برچسب گذاری شده نیست.
هدف اصلی یادگیری بدون نظارت اغلب کشف الگوها، شباهتها یا خوشههای پنهان در دادهها است که سپس میتواند برای اهداف مختلف مانند کاوش داده، تجسم و کاهش ابعاد استفاده شود.
مثال: در نظر بگیرید که مجموعه داده ای دارید که حاوی اطلاعاتی درباره خریدهایی است که از فروشگاه انجام دادهاید.
از طریق خوشه بندی، روش میتواند رفتار خرید یکسانی را بین کاربر و سایر مشتریان گروه بندی کند که مشتریان بالقوه را بدون برچسبهای از پیش تعریف شده نشان میدهد.
این نوع اطلاعات میتواند به کسب و کارها کمک کند تا مشتریان هدف را به دست آورند و همچنین اطلاعات پرت را شناسایی کنند.
دو دسته اصلی از یادگیری بدون نظارت وجود دارد که عبارت اند از:
- خوشه بندی
- انجمن
1) مزایای یادگیری ماشین بدون نظارت
مزایای این دسته از انواع روش های یادگیری ماشین عبارت اند از:
- به کشف الگوهای پنهان و روابط مختلف بین دادهها کمک میکند.
- برای کارهایی مانند تقسیم بندی مشتری، تشخیص ناهنجاری و اکتشاف داده استفاده میشود.
- این روش نیازی به دادههای برچسب دار ندارد و تلاش به منظور برچسب گذاری دادهها را کاهش میدهد.
2) معایب یادگیری ماشینی بدون نظارت
معایب این روش عبارت اند از:
- بدون استفاده از برچسبها، ممکن است، پیش بینی کیفیت خروجی مدل دشوار باشد.
- تفسیرپذیری خوشهای ممکن است واضح نباشد و تفسیرهای معناداری نداشته باشد.
- دارای تکنیکهایی مانند رمزگذار خودکار و کاهش ابعاد است که میتواند برای استخراج ویژگیهای معنی دار از دادههای خام استفاده شود.
3) کاربردهای یادگیری بدون نظارت
در اینجا برخی از کاربردهای رایج یادگیری بدون نظارت آورده شده است:
- خوشه بندی
- تشخیص ناهنجاری
- کاهش ابعاد
- سیستمهای توصیه
- مدل سازی موضوع
- تخمین چگالی
- فشرده سازی تصویر و ویدئو
- پیش پردازش دادهها
- تجزیه و تحلیل سبد بازار
- تجزیه و تحلیل دادههای ژنومی
- تقسیم بندی تصویر شناسایی جامعه در شبکههای اجتماعی
- تجزیه و تحلیل رفتار مشتری
- توصیه محتوا
- تجزیه و تحلیل دادههای اکتشافی
4-2# تقویت یادگیری ماشین
تقویت یادگیری ماشینی، یکی دیگر از انواع روش های یادگیری ماشین بوده که با تولید کنش و کشف خطا با محیط در تعامل است.
آزمون، خطا و تأخیر مرتبط ترین ویژگیهای یادگیری تقویتی هستند.
در این تکنیک، مدل با استفاده از بازخورد پاداش برای یادگیری رفتار یا الگو، عملکرد خود را افزایش میدهد.
این روش مختص مشکل خاص بوده، مثلاً ماشین خودران Google ،AlphaGo که در آن یک ربات با انسانها و حتی خودش رقابت میکند تا عملکرد بهتری در بازی Go داشته باشد.
هر بار که دادهها را تغذیه میکنیم، آنها یاد میگیرند و دادهها را به دانش خود که دادههای آموزشی است، اضافه میکنند.
بنابراین، هر چه بیشتر یاد بگیرد، بهتر آموزش میبیند و در نتیجه تجربه میکند.
در این بخش برخی از رایج ترین الگوریتمهای یادگیری تقویتی آورده شده است:
- Q-learning: الگوریتم Q-learning یک الگوریتم RL بدون مدل است که یک تابع Q را یاد میگیرد و حالتها را به اقدامات تبدیل میکند.
تابع Q پاداش مورد انتظار انجام یک اقدام خاص را در یک حالت مشخص تخمین میزند.
- SARSA (State-Action-Reward-State-Action) :SARSA یکی دیگر از الگوریتمهای RL بدون مدل است که یک تابع Q را یاد میگیرد.
با این حال، بر خلاف یادگیری Q ،SARSA به جای اقدام بهینه، تابع Q را برای عملی که واقعاً انجام شده است، به روز رسانی میکند.
- Deep Q-learning: این الگوریتم ترکیبی از یادگیری Q و یادگیری عمیق است.
یادگیری عمیق Q از یک شبکه عصبی برای نمایش تابع Q استفاده میکند که به آن اجازه میدهد، روابط پیچیده بین حالتها و اقدامات را بیاموزد.
مثال: در نظر بگیرید که در حال آموزش یک عامل هوش مصنوعی برای انجام یک بازی مانند شطرنج هستید.
عامل حرکتهای مختلف را بررسی کرده و بر اساس نتیجه بازخورد مثبت یا منفی دریافت میکند.
Reinforcement Learning همچنین کاربردهایی را پیدا میکند که در آنها یاد میگیرند وظایف را از طریق تعامل با محیط اطراف خود انجام دهند.
1) انواع یادگیری ماشینی تقویتی
دو نوع اصلی یادگیری تقویتی وجود دارد که عبارت اند از:
- تقویت مثبت:
- به عامل برای انجام یک اقدام دلخواه پاداش میدهد.
- عامل را به تکرار رفتار تشویق میکند.
- مثالها: هدیه دادن به سگ برای نشستن، ارائه امتیاز در یک بازی برای پاسخ صحیح.
- تقویت منفی:
- یک محرک نامطلوب را برای تشویق یک رفتار مطلوب حذف میکند.
- عامل را از تکرار رفتار منصرف میکند.
- مثالها: خاموش کردن زنگ بلند هنگام فشار دادن اهرم، اجتناب از امتیاز دادن با انجام یک کار.
2) مزایای یادگیری ماشینی تقویتی
مزایای این بخش از انواع روش های یادگیری ماشین عبارت اند از:
- دارای تصمیم گیری مستقلی بوده که برای کارها مناسب است و میتواند تصمیمات متوالی مانند روباتیک و بازی را یاد بگیرد.
- این تکنیک برای دستیابی به نتایج بلند مدتی که دستیابی به آنها بسیار دشوار است، ترجیح داده میشود.
- از آن برای حل مسائل پیچیده ای استفاده میشود که با تکنیکهای مرسوم قابل حل نیستند.
3) معایب یادگیری ماشینی تقویتی
از جمله معایب این روش میتوان به موارد زیر اشاره کرد:
- تقویت آموزش عوامل یادگیری میتوانند، از نظر محاسباتی گران و وقت گیر باشند.
- یادگیری تقویتی بر حل مسائل ساده ارجحیت ندارد.
- به دادهها و محاسبات زیادی نیاز دارد که آن را غیرعملی و پرهزینه میکند.
4) کاربردهای یادگیری ماشینی تقویتی
در این بخش برخی از کاربردهای یادگیری تقویتی آورده شده است که عبارت اند از:
- پخش بازی
- رباتیک
- وسایل نقلیه خودران
- سیستمهای توصیه
- مراقبتهای بهداشتی
- پردازش زبان طبیعی
- امور مالی و تجارت
- مدیریت زنجیره تأمین و موجودی
- مدیریت انرژی
- بازی
- دستیارهای شخصی تطبیقی
- واقعیت مجازی (VR) و واقعیت افزوده
- کنترل صنعتی
- آموزش
- کشاورزی
5-2# یادگیری ماشینی خود نظارتی
یادگیری خود نظارتی (SSL) به مدلها این امکان را میدهد که به جای نیاز به مجموعه دادههای بزرگ حاشیه نویسی یا برچسب گذاری شده، خود را روی دادههای بدون برچسب آموزش دهند.
الگوریتمهای SSL که الگوریتمهای یادگیری پیش بینی یا بهانه ای نیز نامیده میشوند، بخشی از ورودی را از قسمتی دیگر یاد میگیرند، به صورت خودکار برچسبها را تولید میکنند و مشکلات بدون نظارت را به موارد نظارت شده تبدیل میکنند.
این روشها به ویژه برای مشاغلی مانند بینایی کامپیوتر و NLP مفید هستند، جایی که حجم دادههای آموزشی برچسب گذاری شده مورد نیاز برای آموزش مدلها میتواند بسیار زیاد باشد.
3# چه عواملی را هنگام انتخاب انواع روش های یادگیری ماشین باید در نظر گرفت؟
در این بخش به بررسی عواملی که هنگام استفاده از انواع روش های یادگیری ماشینی به کار میبریم، خواهیم پرداخت.
1-3# نوع داده
اولین چیزی که باید به آن نگاه کنید، تعیین نوع داده ای است که دارید.
برای مثال، مجموعه دادههای برچسب گذاری شده یا آنهایی که خروجیهای تعریف شده دارند را میتوان در اختیار روشهای نظارت شده قرار داد.
از سوی دیگر، در مورد دادههای بدون برچسب، رویکردهای بدون نظارت برای مکان یابی ساختارهای پنهان مورد نیاز است.
در سناریوهایی که یادگیری از طریق تعامل انجام میشود، به نظر میرسد یادگیری تقویتی کاندیدای مفیدی باشد.
2-3# پیچیدگی مسئله
پس از آن، پیچیدگی مسئلهای را که میخواهید حل شود، ارزیابی کنید.
در کارهایی که پیچیدگی کمتری دارند، روشهای سادهتر میتوانند کار را انجام دهند.
با این حال، اگر با یک موضوع پیچیدهتر با روابط پیچیده مقابله میکنید، ممکن است بخواهید از روشهای پیشرفتهتر مانند شبکههای عصبی یا تکنیکهای مجموعه استفاده کنید.
3-3# منابع محاسباتی
عامل مهم دیگر قدرت محاسباتی در اختیار کاربر است.
برخی از روشها، مانند مدلهای یادگیری عمیق میتوانند، منابع فشرده باشند و به سخت افزار قدرتمندی نیاز دارند.
اگر با منابع محدودی کار میکنید، روشهای سادهتر مانند رگرسیون لجستیک یا نزدیکترین همسایه K همچنان میتوانند بدون اعمال فشار بیش از حد بر سیستم، نتایج محکمی ارائه دهند.
4-3# تفسیرپذیری در مقابل دقت
در نهایت، به این فکر کنید که آیا به روشی نیاز دارید که درک آن آسان باشد یا روشی که دقت را در اولویت قرار دهد.
درختهای تصمیم گیری و رگرسیون خطی به صورت کلی برای تفسیر آسانتر هستند و برای توضیح به سهامداران عالی کار میکنند.
در مقابل، مدلهای پیچیدهتر مانند شبکههای عصبی ممکن است دقت بیشتری به کاربر بدهند؛ اما توضیح آن دشوارتر است.
نظرتون درباره این مقاله چیه؟
ما رو راهنمایی کنید تا اون رو کامل تر کنیم و نواقصش رو رفع کنیم.
توی بخش دیدگاه ها منتظر پیشنهادهای فوق العاده شما هستیم.