یادگیری ماشین (ماشین لرنینگ) چیست؟
یادگیری ماشینی به سرعت به بخشی جدایی ناپذیر از زندگی ما تبدیل شده است. از توصیههای شخصیشده در پلتفرمهای استریم گرفته تا خودروهای خودران، برنامههای کاربردی آن متنوع و در حال گسترش هستند. در این پست، دنیای یادگیری ماشینی، اهمیت و تاثیر گسترده آن بر صنایع مختلف را بررسی خواهیم کرد.
یادگیری ماشین چیست؟
یادگیری ماشین شاخهای از هوش مصنوعی (AI) و علوم کامپیوتر است که بر استفاده از دادهها و الگوریتمها برای تقلید از روشی که انسانها یاد میگیرند تمرکز دارد و به تدریج دقت آن را بهبود میبخشد.
آی بی ام (IBM) سابقهای غنی در زمینه یادگیری ماشینی دارد. یکی از آنها، آرتور ساموئل، به دلیل ابداع اصطلاح “یادگیری ماشین” با تحقیقات خود در مورد بازی چکرز اعتبار دارد. رابرت نیلی، استاد خودخوانده چکرز، این بازی را در سال 1962 روی یک کامپیوتر IBM 7094 انجام داد و به رایانه باخت. در مقایسه با آنچه امروزه میتوان انجام داد، این شاهکار پیش پا افتاده به نظر میرسد، اما نقطه عطفی بزرگ در زمینه هوش مصنوعی به حساب میآید.
طی چند دهه گذشته، پیشرفتهای تکنولوژیکی در زمینه ذخیرهسازی و قدرت پردازش، برخی از محصولات نوآورانه مبتنی بر یادگیری ماشینی مانند موتور پیشنهاد دهی نتفلیکس و خودروهای خودران را ممکن ساخته است.
یادگیری ماشینی جزء مهمی از حوزه رو به رشد علم داده است. از طریق استفاده از روشهای آماری، الگوریتمها برای طبقه بندی یا پیش بینی و کشف بینشهای کلیدی در پروژههای داده کاوی آموزش داده میشوند. این بینشها تصمیمگیری را در برنامهها و کسبوکارها هدایت میکنند و به طور ایدهآل بر معیارهای رشد کلیدی تأثیر میگذارند. با ادامه گسترش و رشد big date، تقاضای بازار برای دانشمندان داده افزایش مییابد. از آنها خواسته میشود تا به شناسایی مرتبطترین سؤالات تجاری و دادههای پاسخ به آنها کمک کنند.
الگوریتمهای یادگیری ماشین معمولاً با استفاده از چارچوبهایی ایجاد میشوند که توسعه راهحل را تسریع میکنند، مانند TensorFlow و PyTorch.
یادگیری ماشین در مقابل یادگیری عمیق و شبکههای عصبی
از آنجایی که یادگیری عمیق و یادگیری ماشین به جای یکدیگر مورد استفاده قرار میگیرند، ارزش توجه به تفاوتهای ظریف بین این دو را دارد. یادگیری ماشینی، یادگیری عمیق و شبکههای عصبی همگی زیر شاخههای هوش مصنوعی هستند. با این حال، شبکههای عصبی در واقع زیر شاخهای از یادگیری ماشینی هستند و یادگیری عمیق زیر شاخهای از شبکههای عصبی است.
تفاوت یادگیری عمیق و یادگیری ماشین در نحوه یادگیری هر الگوریتم است. یادگیری ماشینی «عمیق» میتواند از مجموعه دادههای برچسب گذاریشده، که به عنوان یادگیری نظارت شده نیز شناخته میشود، برای اطلاعرسانی الگوریتم خود استفاده کند، اما لزوماً به یک مجموعه داده برچسبدار نیاز ندارد. یادگیری عمیق میتواند دادههای بدون ساختار را به شکل خام (مثلاً متن یا تصاویر) وارد کند و میتواند به طور خودکار مجموعهای از ویژگیهایی را تعیین کند که دستههای مختلف دادهها را از یکدیگر متمایز میکند. این امر برخی از مداخلات انسانی مورد نیاز را حذف میکند و امکان استفاده از مجموعه دادههای بزرگتر را فراهم میکند.
یادگیری ماشین کلاسیک یا “غیر عمیق” بیشتر به مداخله انسان برای یادگیری وابسته است. متخصصان انسانی مجموعهای از ویژگیها را برای درک تفاوت بین ورودیهای داده تعیین میکنند که معمولاً برای یادگیری به دادههای ساختاریافته بیشتری نیاز دارند.
شبکههای عصبی یا شبکههای عصبی مصنوعی (ANN) از لایههای گرهای تشکیل شدهاند که شامل یک لایه ورودی، یک یا چند لایه پنهان و یک لایه خروجی است. هر گره یا نورون مصنوعی به دیگری متصل میشود و دارای وزن و آستانه مرتبط است. اگر خروجی هر گره فردی بالاتر از مقدار آستانه مشخص شده باشد، آن گره فعال میشود و دادهها را به لایه بعدی شبکه ارسال میکند. در غیر این صورت، هیچ دادهای توسط آن گره به لایه بعدی شبکه منتقل نمیشود. “عمیق” در یادگیری عمیق فقط به تعداد لایههای یک شبکه عصبی اشاره دارد. یک شبکه عصبی که از بیش از سه لایه تشکیل شده است (که شامل ورودی و خروجی میشود) میتواند یک الگوریتم یادگیری عمیق یا یک شبکه عصبی عمیق در نظر گرفته شود. یک شبکه عصبی که فقط سه لایه دارد، فقط یک شبکه عصبی اولیه است.
یادگیری عمیق و شبکههای عصبی باعث تسریع پیشرفت در زمینههایی مانند بینایی رایانه، پردازش زبان طبیعی و تشخیص گفتار میشوند.
یادگیری ماشین چگونه کار میکند؟
UC Berkeley سیستم یادگیری یک الگوریتم یادگیری ماشین را به سه بخش اصلی تقسیم میکند:
- فرآیند تصمیم گیری: به طور کلی، الگوریتمهای یادگیری ماشین برای پیش بینی یا طبقه بندی استفاده میشود. بر اساس برخی از دادههای ورودی، که میتوانند دارای برچسب یا بدون برچسب باشند، الگوریتم شما تخمینی در مورد یک الگو در دادهها ایجاد میکند.
- یک تابع خطا: یک تابع خطا پیش بینی مدل را ارزیابی میکند. اگر نمونههای شناخته شده وجود داشته باشد، یک تابع خطا میتواند مقایسهای برای ارزیابی دقت مدل انجام دهد.
- یک فرآیند بهینه سازی مدل: اگر مدل بتواند بهتر با نقاط داده در مجموعه آموزشی تناسب داشته باشد، وزنها برای کاهش اختلاف بین مثال شناخته شده و برآورد مدل تنظیم میشوند. الگوریتم این فرآیند “ارزیابی و بهینه سازی” را تکرار میکند و وزنها را به طور مستقل تا رسیدن به آستانه دقت به روز میکند.
روشهای یادگیری ماشینی
مدلهای یادگیری ماشینی به سه دسته اصلی تقسیم میشوند:
یادگیری ماشین تحت نظارت
یادگیری نظارت شده، همچنین به عنوان یادگیری ماشین نظارت شده شناخته میشود، با استفاده از مجموعه دادههای برچسب گذاری شده برای آموزش الگوریتمها برای طبقه بندی دادهها یا پیش بینی دقیق نتایج تعریف میشود. همانطور که دادههای ورودی به مدل وارد میشود، مدل وزن خود را تا زمانی که به طور مناسب نصب داده شود تنظیم میکند. این به عنوان بخشی از فرآیند اعتبار سنجی متقاطع برای اطمینان از اینکه مدل از نصب بیش از حد یا عدم تناسب اجتناب میکند، رخ میدهد. یادگیری تحت نظارت به سازمانها کمک میکند تا انواع مشکلات دنیای واقعی را در مقیاس بزرگ حل کنند، مانند طبقه بندی هرزنامهها در یک پوشه جداگانه از صندوق ورودی شما. برخی از روشهای مورد استفاده در یادگیری نظارت شده عبارتند از: شبکههای عصبی، خلیجهای ساده، رگرسیون خطی، رگرسیون لجستیک، جنگل تصادفی و ماشین بردار پشتیبان.
یادگیری ماشین بدون نظارت
یادگیری بدون نظارت، همچنین به عنوان یادگیری ماشین بدون نظارت شناخته میشود، از الگوریتمهای یادگیری ماشین برای تجزیه و تحلیل و خوشه بندی مجموعه دادههای بدون برچسب استفاده میکند. این الگوریتمها الگوهای پنهان یا گروه بندی دادهها را بدون نیاز به دخالت انسان کشف میکنند. توانایی این روش برای کشف شباهتها و تفاوتها در اطلاعات، آن را برای تجزیه و تحلیل دادههای اکتشافی، استراتژیهای فروش متقابل، تقسیمبندی مشتری، و تشخیص تصویر و الگو ایدهآل میکند. همچنین برای کاهش تعداد ویژگیهای یک مدل از طریق فرآیند کاهش ابعاد استفاده میشود. تجزیه و تحلیل مؤلفه اصلی (PCA) و تجزیه ارزش منفرد (SVD) دو رویکرد رایج برای این کار هستند. سایر الگوریتمهای مورد استفاده در یادگیری بدون نظارت شامل شبکههای عصبی، خوشهبندی k-means و روشهای خوشهبندی احتمالی است.
یادگیری ماشین نیمه نظارتی
یادگیری نیمهنظارتی واسطهای شاد بین یادگیری تحت نظارت و بدون نظارت است. در طول آموزش، از یک مجموعه داده برچسبدار کوچکتر برای هدایت طبقهبندی و استخراج ویژگی از یک مجموعه داده بزرگتر و بدون برچسب استفاده میکند. یادگیری نیمه نظارت شده میتواند مشکل نداشتن دادههای برچسب گذاری شده کافی برای الگوریتم یادگیری نظارت شده را حل کند. همچنین اگر برچسب گذاری دادههای کافی بسیار پرهزینه باشد کمک میکند.
تقویت یادگیری ماشین
یادگیری ماشینی تقویتی یک مدل یادگیری ماشینی است که شبیه به یادگیری نظارت شده است، اما الگوریتم با استفاده از دادههای نمونه آموزش داده نمیشود. این مدل با استفاده از آزمون و خطا یاد میگیرد. دنبالهای از نتایج موفقیت آمیز برای ایجاد بهترین توصیه یا خط مشی برای یک مشکل خاص تقویت میشود.
الگوریتم های رایج یادگیری ماشین
تعدادی از الگوریتمهای یادگیری ماشین معمولاً استفاده میشود. این شامل:
شبکههای عصبی
شبکههای عصبی نحوه عملکرد مغز انسان را با تعداد زیادی گره پردازشی مرتبط شبیه سازی میکنند. شبکههای عصبی در تشخیص الگوها خوب هستند و نقش مهمی در کاربردهایی از جمله ترجمه زبان طبیعی، تشخیص تصویر، تشخیص گفتار و ایجاد تصویر دارند.
رگرسیون خطی
این الگوریتم برای پیش بینی مقادیر عددی بر اساس رابطه خطی بین مقادیر مختلف استفاده میشود. به عنوان مثال، این تکنیک میتواند برای پیش بینی قیمت خانه بر اساس دادههای تاریخی برای منطقه مورد استفاده قرار گیرد.
رگرسیون لجستیک
این الگوریتم یادگیری نظارت شده برای متغیرهای پاسخ طبقهای، مانند پاسخهای «بله/خیر» به سؤالات، پیشبینی میکند. میتوان از آن برای برنامههایی مانند طبقه بندی هرزنامه و کنترل کیفیت در خط تولید استفاده کرد.
خوشه بندی
با استفاده از یادگیری بدون نظارت، الگوریتمهای خوشه بندی میتوانند الگوهای موجود در دادهها را شناسایی کنند تا بتوان آنها را گروه بندی کرد. رایانهها میتوانند با شناسایی تفاوتهای بین اقلام دادهای که انسانها نادیده گرفتهاند، به دانشمندان داده کمک کنند.
درخت تصمیم
درخت تصمیم را میتوان هم برای پیش بینی مقادیر عددی (رگرسیون) و هم برای طبقه بندی دادهها به دستهها استفاده کرد. درختان تصمیم از یک دنباله انشعاب از تصمیمات مرتبط استفاده میکنند که میتواند با یک نمودار درختی نمایش داده شود. یکی از مزایای درخت تصمیم این است که بر خلاف جعبه سیاه شبکه عصبی، اعتبارسنجی و ممیزی آسان است.
جنگلهای تصادفی
در یک جنگل تصادفی، الگوریتم یادگیری ماشین با ترکیب نتایج تعدادی درخت تصمیم، یک مقدار یا دسته را پیشبینی میکند.
موارد استفاده از یادگیری ماشین در دنیای واقعی
در اینجا فقط چند نمونه از یادگیری ماشینی وجود دارد که ممکن است هر روز با آنها روبرو شوید:
تشخیص گفتار:
همچنین با نامهای تشخیص خودکار گفتار (ASR)، تشخیص گفتار رایانهای یا گفتار به متن نیز شناخته میشود و قابلیتی است که از پردازش زبان طبیعی (NLP) برای ترجمه گفتار انسان به قالب نوشتاری استفاده میکند. بسیاری از دستگاههای تلفن همراه برای انجام جستجوی صوتی از تشخیص گفتار در سیستمهای خود استفاده میکنند. سیری (Siri) دسترسی به پیامک را بهبود بخشید.
خدمات مشتری:
چت رباتهای آنلاین در طول سفر مشتری جایگزین عوامل انسانی میشوند و طرز فکر ما را در مورد تعامل با مشتری در وبسایتها و پلتفرمهای رسانههای اجتماعی تغییر میدهند. چت باتها به سؤالات متداول درباره موضوعاتی مانند حمل و نقل پاسخ میدهند، یا توصیههای شخصی، فروش محصولات متقابل یا پیشنهاد اندازهها را به کاربران ارائه میدهند. به عنوان مثال میتوان به عوامل مجازی در سایتهای تجارت الکترونیک اشاره کرد. رباتهای پیامرسان، با استفاده از Slack و .Facebook Messenger و کارهایی که معمولاً توسط دستیارهای مجازی و دستیارهای صوتی انجام میشود.
بینایی رایانه:
این فناوری هوش مصنوعی رایانهها را قادر میسازد تا اطلاعات معنیداری را از تصاویر دیجیتال، ویدیوها و سایر ورودیهای بصری به دست آورند و سپس اقدام مناسب را انجام دهند. بینایی کامپیوتر با پشتیبانی از شبکههای عصبی کانولوشنال دارای کاربردهایی در برچسب گذاری عکس در رسانههای اجتماعی، تصویربرداری رادیولوژی در مراقبتهای بهداشتی و خودروهای خودران در صنعت خودروسازی است.
موتورهای پیشنهادی:
با استفاده از دادههای رفتار مصرف گذشته، الگوریتمهای هوش مصنوعی میتوانند به کشف روندهای دادهای که میتوانند برای توسعه استراتژیهای فروش متقابل مؤثرتر مورد استفاده قرار گیرند، کمک کنند. این رویکرد توسط خرده فروشان آنلاین برای ارائه توصیههای مربوط به محصول به مشتریان در طول فرآیند پرداخت استفاده میشود.
معاملات خودکار سهام:
پلتفرمهای معاملاتی با فرکانس بالا مبتنی بر هوش مصنوعی که برای بهینهسازی سبد سهام طراحی شدهاند، هزاران یا حتی میلیونها معامله را در روز بدون دخالت انسان انجام میدهند.
تشخیص تقلب:
بانکها و سایر موسسات مالی میتوانند از یادگیری ماشینی برای شناسایی تراکنشهای مشکوک استفاده کنند. یادگیری تحت نظارت میتواند یک مدل را با استفاده از اطلاعات مربوط به تراکنشهای جعلی شناخته شده آموزش دهد. تشخیص ناهنجاری میتواند تراکنشهایی را شناسایی کند که غیر معمول (غیر واقعی) به نظر میرسند و مستحق بررسی بیشتر هستند.
نتیجهگیری
یادگیری ماشینی روش زندگی و کار ما را متحول میکند. کاربردهای آن بی حد و مرز است و با ادامه تکامل، صنایع مختلف را متحول خواهد کرد. استفاده از قدرت یادگیری ماشینی میتواند به پیشرفتهای قابل توجهی در فناوری و جامعه منجر شود.
در آخر حتماً نظراتتان را با ما به اشتراک بگذارید.