دیتا ساینس

یادگیری ماشین (ماشین لرنینگ) چیست؟

یادگیری ماشینی به سرعت به بخشی جدایی ناپذیر از زندگی ما تبدیل شده است. از توصیه‌های شخصی‌شده در پلتفرم‌های استریم گرفته تا خودروهای خودران، برنامه‌های کاربردی آن متنوع و در حال گسترش هستند. در این پست، دنیای یادگیری ماشینی، اهمیت و تاثیر گسترده آن بر صنایع مختلف را بررسی خواهیم کرد.

یادگیری ماشین چیست؟

یادگیری ماشین شاخه‌ای از هوش مصنوعی (AI) و علوم کامپیوتر است که بر استفاده از داده‌ها و الگوریتم‌ها برای تقلید از روشی که انسان‌ها یاد می‌گیرند تمرکز دارد و به تدریج دقت آن را بهبود می‌بخشد.

آی بی ام (IBM) سابقه‌ای غنی در زمینه یادگیری ماشینی دارد. یکی از آن‌ها، آرتور ساموئل، به دلیل ابداع اصطلاح “یادگیری ماشین” با تحقیقات خود در مورد بازی چکرز اعتبار دارد. رابرت نیلی، استاد خودخوانده چکرز، این بازی را در سال 1962 روی یک کامپیوتر IBM 7094 انجام داد و به رایانه باخت. در مقایسه با آنچه امروزه می‌توان انجام داد، این شاهکار پیش پا افتاده به نظر می‌رسد، اما نقطه عطفی بزرگ در زمینه هوش مصنوعی به حساب می‌آید.

طی چند دهه گذشته، پیشرفت‌های تکنولوژیکی در زمینه ذخیره‌سازی و قدرت پردازش، برخی از محصولات نوآورانه مبتنی بر یادگیری ماشینی مانند موتور پیشنهاد دهی نتفلیکس و خودروهای خودران را ممکن ساخته است.

یادگیری ماشینی جزء مهمی از حوزه رو به رشد علم داده است. از طریق استفاده از روش‌های آماری، الگوریتم‌ها برای طبقه بندی یا پیش بینی و کشف بینش‌های کلیدی در پروژه‌های داده کاوی آموزش داده می‌شوند. این بینش‌ها تصمیم‌گیری را در برنامه‌ها و کسب‌وکارها هدایت می‌کنند و به طور ایده‌آل بر معیارهای رشد کلیدی تأثیر می‌گذارند. با ادامه گسترش و رشد big date، تقاضای بازار برای دانشمندان داده افزایش می‌یابد. از آن‌ها خواسته می‌شود تا به شناسایی مرتبط‌ترین سؤالات تجاری و داده‌های پاسخ به آن‌ها کمک کنند.

الگوریتم‌های یادگیری ماشین معمولاً با استفاده از چارچوب‌هایی ایجاد می‌شوند که توسعه راه‌حل را تسریع می‌کنند، مانند TensorFlow و PyTorch.

یادگیری ماشین در مقابل یادگیری عمیق و شبکه‌های عصبی

از آنجایی که یادگیری عمیق و یادگیری ماشین به جای یکدیگر مورد استفاده قرار می‌گیرند، ارزش توجه به تفاوت‌های ظریف بین این دو را دارد. یادگیری ماشینی، یادگیری عمیق و شبکه‌های عصبی همگی زیر شاخه‌های هوش مصنوعی هستند. با این حال، شبکه‌های عصبی در واقع زیر شاخه‌ای از یادگیری ماشینی هستند و یادگیری عمیق زیر شاخه‌ای از شبکه‌های عصبی است.

تفاوت یادگیری عمیق و یادگیری ماشین در نحوه یادگیری هر الگوریتم است. یادگیری ماشینی «عمیق» می‌تواند از مجموعه داده‌های برچسب‌ گذاری‌شده، که به عنوان یادگیری نظارت‌ شده نیز شناخته می‌شود، برای اطلاع‌رسانی الگوریتم خود استفاده کند، اما لزوماً به یک مجموعه داده برچسب‌دار نیاز ندارد. یادگیری عمیق می‌تواند داده‌های بدون ساختار را به شکل خام (مثلاً متن یا تصاویر) وارد کند و می‌تواند به طور خودکار مجموعه‌ای از ویژگی‌هایی را تعیین کند که دسته‌های مختلف داده‌ها را از یکدیگر متمایز می‌کند. این امر برخی از مداخلات انسانی مورد نیاز را حذف می‌کند و امکان استفاده از مجموعه داده‌های بزرگتر را فراهم می‌کند. 

یادگیری ماشین کلاسیک یا “غیر عمیق” بیشتر به مداخله انسان برای یادگیری وابسته است. متخصصان انسانی مجموعه‌ای از ویژگی‌ها را برای درک تفاوت بین ورودی‌های داده تعیین می‌کنند که معمولاً برای یادگیری به داده‌های ساختاریافته بیشتری نیاز دارند.

شبکه‌های عصبی یا شبکه‌های عصبی مصنوعی (ANN) از لایه‌های گره‌ای تشکیل شده‌اند که شامل یک لایه ورودی، یک یا چند لایه پنهان و یک لایه خروجی است. هر گره یا نورون مصنوعی به دیگری متصل می‌شود و دارای وزن و آستانه مرتبط است. اگر خروجی هر گره فردی بالاتر از مقدار آستانه مشخص شده باشد، آن گره فعال می‌شود و داده‌ها را به لایه بعدی شبکه ارسال می‌کند. در غیر این صورت، هیچ داده‌ای توسط آن گره به لایه بعدی شبکه منتقل نمی‌شود. “عمیق” در یادگیری عمیق فقط به تعداد لایه‌های یک شبکه عصبی اشاره دارد. یک شبکه عصبی که از بیش از سه لایه تشکیل شده است (که شامل ورودی و خروجی می‌شود) می‌تواند یک الگوریتم یادگیری عمیق یا یک شبکه عصبی عمیق در نظر گرفته شود. یک شبکه عصبی که فقط سه لایه دارد، فقط یک شبکه عصبی اولیه است.

یادگیری عمیق و شبکه‌های عصبی باعث تسریع پیشرفت در زمینه‌هایی مانند بینایی رایانه، پردازش زبان طبیعی و تشخیص گفتار می‌شوند.

یادگیری ماشین چگونه کار می‌کند؟

UC Berkeley سیستم یادگیری یک الگوریتم یادگیری ماشین را به سه بخش اصلی تقسیم می‌کند:

  • فرآیند تصمیم گیری: به طور کلی، الگوریتم‌های یادگیری ماشین برای پیش بینی یا طبقه بندی استفاده می‌شود. بر اساس برخی از داده‌های ورودی، که می‌توانند دارای برچسب یا بدون برچسب باشند، الگوریتم شما تخمینی در مورد یک الگو در داده‌ها ایجاد می‌کند.
  • یک تابع خطا: یک تابع خطا پیش بینی مدل را ارزیابی می‌کند. اگر نمونه‌های شناخته شده وجود داشته باشد، یک تابع خطا می‌تواند مقایسه‌ای برای ارزیابی دقت مدل انجام دهد.
  • یک فرآیند بهینه سازی مدل: اگر مدل بتواند بهتر با نقاط داده در مجموعه آموزشی تناسب داشته باشد، وزن‌ها برای کاهش اختلاف بین مثال شناخته شده و برآورد مدل تنظیم می‌شوند. الگوریتم این فرآیند “ارزیابی و بهینه سازی” را تکرار می‌کند و وزن‌ها را به طور مستقل تا رسیدن به آستانه دقت به روز می‌کند.

روش‌های یادگیری ماشینی

مدل‌های یادگیری ماشینی به سه دسته اصلی تقسیم می‌شوند:

یادگیری ماشین تحت نظارت

یادگیری نظارت شده، همچنین به عنوان یادگیری ماشین نظارت شده شناخته می‌شود، با استفاده از مجموعه داده‌های برچسب گذاری شده برای آموزش الگوریتم‌ها برای طبقه بندی داده‌ها یا پیش بینی دقیق نتایج تعریف می‌شود. همانطور که داده‌های ورودی به مدل وارد می‌شود، مدل وزن خود را تا زمانی که به طور مناسب نصب داده شود تنظیم می‌کند. این به عنوان بخشی از فرآیند اعتبار سنجی متقاطع برای اطمینان از اینکه مدل از نصب بیش از حد یا عدم تناسب اجتناب می‌کند، رخ می‌دهد. یادگیری تحت نظارت به سازمان‌ها کمک می‌کند تا انواع مشکلات دنیای واقعی را در مقیاس بزرگ حل کنند، مانند طبقه بندی هرزنامه‌ها در یک پوشه جداگانه از صندوق ورودی شما. برخی از روش‌های مورد استفاده در یادگیری نظارت شده عبارتند از: شبکه‌های عصبی، خلیج‌های ساده، رگرسیون خطی، رگرسیون لجستیک، جنگل تصادفی و ماشین بردار پشتیبان.

یادگیری ماشین بدون نظارت

یادگیری بدون نظارت، همچنین به عنوان یادگیری ماشین بدون نظارت شناخته می‌شود، از الگوریتم‌های یادگیری ماشین برای تجزیه و تحلیل و خوشه بندی مجموعه داده‌های بدون برچسب استفاده می‌کند. این الگوریتم‌ها الگوهای پنهان یا گروه بندی داده‌ها را بدون نیاز به دخالت انسان کشف می‌کنند. توانایی این روش برای کشف شباهت‌ها و تفاوت‌ها در اطلاعات، آن را برای تجزیه و تحلیل داده‌های اکتشافی، استراتژی‌های فروش متقابل، تقسیم‌بندی مشتری، و تشخیص تصویر و الگو ایده‌آل می‌کند. همچنین برای کاهش تعداد ویژگی‌های یک مدل از طریق فرآیند کاهش ابعاد استفاده می‌شود. تجزیه و تحلیل مؤلفه اصلی (PCA) و تجزیه ارزش منفرد (SVD) دو رویکرد رایج برای این کار هستند. سایر الگوریتم‌های مورد استفاده در یادگیری بدون نظارت شامل شبکه‌های عصبی، خوشه‌بندی k-means و روش‌های خوشه‌بندی احتمالی است.

یادگیری ماشین نیمه نظارتی

یادگیری نیمه‌نظارتی واسطه‌ای شاد بین یادگیری تحت نظارت و بدون نظارت است. در طول آموزش، از یک مجموعه داده برچسب‌دار کوچک‌تر برای هدایت طبقه‌بندی و استخراج ویژگی از یک مجموعه داده بزرگ‌تر و بدون برچسب استفاده می‌کند. یادگیری نیمه نظارت شده می‌تواند مشکل نداشتن داده‌های برچسب گذاری شده کافی برای الگوریتم یادگیری نظارت شده را حل کند. همچنین اگر برچسب گذاری داده‌های کافی بسیار پرهزینه باشد کمک می‌کند.

تقویت یادگیری ماشین

یادگیری ماشینی تقویتی یک مدل یادگیری ماشینی است که شبیه به یادگیری نظارت شده است، اما الگوریتم با استفاده از داده‌های نمونه آموزش داده نمی‌شود. این مدل با استفاده از آزمون و خطا یاد می‌گیرد. دنباله‌ای از نتایج موفقیت آمیز برای ایجاد بهترین توصیه یا خط مشی برای یک مشکل خاص تقویت می‌شود.

الگوریتم های رایج یادگیری ماشین

تعدادی از الگوریتم‌های یادگیری ماشین معمولاً استفاده می‌شود. این شامل:

شبکه‌های عصبی

شبکه‌های عصبی نحوه عملکرد مغز انسان را با تعداد زیادی گره پردازشی مرتبط شبیه سازی می‌کنند. شبکه‌های عصبی در تشخیص الگوها خوب هستند و نقش مهمی در کاربردهایی از جمله ترجمه زبان طبیعی، تشخیص تصویر، تشخیص گفتار و ایجاد تصویر دارند.

رگرسیون خطی

این الگوریتم برای پیش بینی مقادیر عددی بر اساس رابطه خطی بین مقادیر مختلف استفاده می‌شود. به عنوان مثال، این تکنیک می‌تواند برای پیش بینی قیمت خانه بر اساس داده‌های تاریخی برای منطقه مورد استفاده قرار گیرد.

رگرسیون لجستیک

این الگوریتم یادگیری نظارت شده برای متغیرهای پاسخ طبقه‌ای، مانند پاسخ‌های «بله/خیر» به سؤالات، پیش‌بینی می‌کند. می‌توان از آن برای برنامه‌هایی مانند طبقه بندی هرزنامه و کنترل کیفیت در خط تولید استفاده کرد.

خوشه بندی

با استفاده از یادگیری بدون نظارت، الگوریتم‌های خوشه بندی می‌توانند الگوهای موجود در داده‌ها را شناسایی کنند تا بتوان آن‌ها را گروه بندی کرد. رایانه‌ها می‌توانند با شناسایی تفاوت‌های بین اقلام داده‌ای که انسان‌ها نادیده گرفته‌اند، به دانشمندان داده کمک کنند.

درخت تصمیم

درخت تصمیم را می‌توان هم برای پیش بینی مقادیر عددی (رگرسیون) و هم برای طبقه بندی داده‌ها به دسته‌ها استفاده کرد. درختان تصمیم از یک دنباله انشعاب از تصمیمات مرتبط استفاده می‌کنند که می‌تواند با یک نمودار درختی نمایش داده شود. یکی از مزایای درخت تصمیم این است که بر خلاف جعبه سیاه شبکه عصبی، اعتبارسنجی و ممیزی آسان است.

جنگل‌های تصادفی

در یک جنگل تصادفی، الگوریتم یادگیری ماشین با ترکیب نتایج تعدادی درخت تصمیم، یک مقدار یا دسته را پیش‌بینی می‌کند.

موارد استفاده از یادگیری ماشین در دنیای واقعی

در اینجا فقط چند نمونه از یادگیری ماشینی وجود دارد که ممکن است هر روز با آنها روبرو شوید:

تشخیص گفتار: 

همچنین با نام‌های تشخیص خودکار گفتار (ASR)، تشخیص گفتار رایانه‌ای یا گفتار به متن نیز شناخته می‌شود و قابلیتی است که از پردازش زبان طبیعی (NLP) برای ترجمه گفتار انسان به قالب نوشتاری استفاده می‌کند. بسیاری از دستگاه‌های تلفن همراه برای انجام جستجوی صوتی از تشخیص گفتار در سیستم‌های خود استفاده می‌کنند. سیری (Siri) دسترسی به پیامک را بهبود بخشید.

خدمات مشتری: 

چت ربات‌های آنلاین در طول سفر مشتری جایگزین عوامل انسانی می‌شوند و طرز فکر ما را در مورد تعامل با مشتری در وب‌سایت‌ها و پلتفرم‌های رسانه‌های اجتماعی تغییر می‌دهند. چت بات‌ها به سؤالات متداول درباره موضوعاتی مانند حمل و نقل پاسخ می‌دهند، یا توصیه‌های شخصی، فروش محصولات متقابل یا پیشنهاد اندازه‌ها را به کاربران ارائه می‌دهند. به عنوان مثال می‌توان به عوامل مجازی در سایت‌های تجارت الکترونیک اشاره کرد. ربات‌های پیام‌رسان، با استفاده از Slack و  .Facebook Messenger و کار‌هایی که معمولاً توسط دستیارهای مجازی و دستیارهای صوتی انجام می‌شود.

بینایی رایانه: 

این فناوری هوش مصنوعی رایانه‌ها را قادر می‌سازد تا اطلاعات معنی‌داری را از تصاویر دیجیتال، ویدیوها و سایر ورودی‌های بصری به دست آورند و سپس اقدام مناسب را انجام دهند. بینایی کامپیوتر با پشتیبانی از شبکه‌های عصبی کانولوشنال دارای کاربردهایی در برچسب گذاری عکس در رسانه‌های اجتماعی، تصویربرداری رادیولوژی در مراقبت‌های بهداشتی و خودروهای خودران در صنعت خودروسازی است.

موتورهای پیشنهادی: 

با استفاده از داده‌های رفتار مصرف گذشته، الگوریتم‌های هوش مصنوعی می‌توانند به کشف روندهای داده‌ای که می‌توانند برای توسعه استراتژی‌های فروش متقابل مؤثرتر مورد استفاده قرار گیرند، کمک کنند. این رویکرد توسط خرده فروشان آنلاین برای ارائه توصیه‌های مربوط به محصول به مشتریان در طول فرآیند پرداخت استفاده می‌شود.

معاملات خودکار سهام: 

پلتفرم‌های معاملاتی با فرکانس بالا مبتنی بر هوش مصنوعی که برای بهینه‌سازی سبد سهام طراحی شده‌اند، هزاران یا حتی میلیون‌ها معامله را در روز بدون دخالت انسان انجام می‌دهند.

تشخیص تقلب: 

بانک‌ها و سایر موسسات مالی می‌توانند از یادگیری ماشینی برای شناسایی تراکنش‌های مشکوک استفاده کنند. یادگیری تحت نظارت می‌تواند یک مدل را با استفاده از اطلاعات مربوط به تراکنش‌های جعلی شناخته شده آموزش دهد. تشخیص ناهنجاری می‌تواند تراکنش‌هایی را شناسایی کند که غیر معمول (غیر واقعی)  به نظر می‌رسند و مستحق بررسی بیشتر هستند.

نتیجه‌گیری

یادگیری ماشینی روش زندگی و کار ما را متحول می‌کند. کاربردهای آن بی حد و مرز است و با ادامه تکامل، صنایع مختلف را متحول خواهد کرد. استفاده از قدرت یادگیری ماشینی می‌تواند به پیشرفت‌های قابل توجهی در فناوری و جامعه منجر شود.

در آخر حتماً نظراتتان را با ما به اشتراک بگذارید.

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا

به خبرنامه دانشکار بپیوند!

اگر می‌خوای از جدیدترین مطالب حوزه‌های مختلف کاری، دوره‌های جدید، وبینارهای رایگان و ... زودتر از همه باخبر بشی، اطلاعات خودت رو ثبت کن تا عضو خبرنامه دانشکار بشی.