لینک کوتاه مطلب : https://hsgar.com/?p=5375

یادگیری مشابه فاقد چارچوب است. بنابراین ما یکی را ساختیم | توسط واسنتسف آندری | ژوئن، 2022

یادگیری شباهت جدید نیست اما یک حوزه فعالانه در حال توسعه یادگیری ماشین است. در ادبیات به عنوان یادگیری متریک نیز شناخته می شود، اما من اصطلاح دیگر را ترجیح می دهم، زیرا ایده اصلی را بهتر نشان می دهد.

به طور خلاصه، Similarity Learning به مدل هایی می پردازد که سعی می کنند شباهت یا عدم شباهت یک جفت شی را پیش بینی کنند. واقعیت این است که اشیاء “مشابه” نباید یکسان باشند. علاوه بر این، آنها می توانند در اشکال مختلف وجود داشته باشند، به عنوان مثال، یک عکس و توضیحات متنی آن – هر چیزی که بتوانیم با یکدیگر مطابقت دهیم.

این اصل به ظاهر ساده به شما این امکان را می دهد که بسیاری از مشکلات، از جستجو و توصیه ها گرفته تا طبقه بندی و تشخیص ناهنجاری را حل کنید.

چرا یادگیری مشابه؟

Similarity Learning علاوه بر طیف وسیعی از کاربردها، مزایای خاصی نسبت به رویکردهای کلاسیک دارد.

اگر می خواهید مشکلات یادگیری ماشین را با استفاده از رویکردهای سنتی مانند طبقه بندی حل کنید، احتمالاً با تعدادی از مسائل روبرو خواهید شد:

  • مشکل شروع سرد – ممکن است قبل از راه اندازی محصول، داده های علامت گذاری شده نداشته باشید. و برای علامت گذاری آنها باید محصول را راه اندازی کنید.
  • سازگاری مجموعه داده – چندین مجموعه داده مناسب برای کار خود پیدا کرده‌اید، اما برچسب‌گذاری کمی متفاوت دارند که استفاده از آنها را با هم غیرممکن می‌کند.
  • تغییرات مورد نیاز — شما مدل را آموزش داده‌اید، اما پس از راه‌اندازی آن متوجه شدید که کلاس جدیدی وجود دارد که در نشانه‌گذاری گنجانده نشده است.
  • اصلاح غیر ممکن – پس از استقرار مدل، تغییر رفتار آن در برخی از گوشه های خاص بدون بررسی وضعیت دستی غیرممکن است.
  • عدم قابلیت توضیح – توضیح پیش‌بینی‌های مدل طبقه‌بندی نوعی هنر است. فقط ساده‌ترین مدل‌ها دارای نوعی توضیح پذیری هستند.

Similarity Learning جایگزینی ارائه می دهد که این معایب را از بین می برد.

برخلاف مدل‌های طبقه‌بندی سنتی، به مجموعه‌ای از برچسب‌های از پیش تعریف‌شده تکیه نمی‌کند، بلکه شباهت‌های بین اشیا را یاد می‌گیرد. و معلوم می شود که این رویکرد مزایای زیادی در مراحل جمع آوری داده ها، مدل سازی و استقرار دارد.

جمع‌آوری مجموعه‌های داده برای یادگیری شباهت بسیار آسان‌تر است، زیرا هر مجموعه داده طبقه‌بندی نیز یک مجموعه داده مشابه است. اطلاعات مربوط به کلاس ها را می توان مستقیماً برای تعیین شباهت بین اشیاء استفاده کرد.

و بنابراین، مجموعه داده‌های طبقه‌بندی چندگانه را می‌توان در یک مجموعه داده مشابه ترکیب کرد، حتی اگر برچسب‌های اولیه سازگار نباشند. و در برخی موارد حتی به نشانه گذاری دستی اصلا نیاز نخواهید داشت. اگر داده ها از چندین مؤلفه مانند جفت های چندوجهی تشکیل شده است، می توانید از رویکرد خود نظارتی استفاده کنید.

در مرحله مدل‌سازی، یادگیری شباهت نیز بسیار انعطاف‌پذیر است – به تعداد ثابتی از کلاس‌ها بستگی ندارد، بنابراین دسته‌های جدید را می‌توان تنها با گسترش ساده مجموعه مرجع معرفی کرد. همین امر در مورد مرحله استقرار نیز صادق است، جایی که می توانید نمونه های جدیدی را بدون هیچ گونه خرابی و جابجایی مجدد معرفی کنید.

و در نهایت، بررسی شباهت‌های بین اشیاء حاصل از مدل می‌تواند بینش‌هایی را در مورد آنچه که مدل در هنگام پیش‌بینی توسط آن هدایت می‌شود، ارائه دهد.

چرا به یک چارچوب جدید نیاز داریم؟

بسیاری از چارچوب‌های همه‌منظوره به شما این امکان را می‌دهند که به سرعت وظایف Computer Vision یا NLP را آموزش دهید. با این حال، Similarity Learning دارای ویژگی‌هایی است که معمولاً به یک لایه پیچیدگی اضافی در بالای خطوط لوله معمولی نیاز دارد.

بنابراین به عنوان مثال اندازه دسته ای در آموزش مدل های مشابه نقش بسیار بیشتری نسبت به سایر مدل ها دارد. برچسب ها یا وجود ندارند یا به روشی کاملاً متفاوت مدیریت می شوند. در بسیاری از موارد، مدل از قبل آموزش داده شده است، که فرآیند را نیز تنظیم می کند.

با تمرکز بر یادگیری شباهت، می‌توانیم از چنین الزامات تخصصی و در عین حال ساده‌سازی و تسریع فرآیند آموزش، پشتیبانی بهتری داشته باشیم.

معرفی Quaterion

با توسعه مدل‌های یادگیری تشابه یکی پس از دیگری، متوجه الگوهایی شدیم که به ما کمک کردند همه تجربیات خود را در مورد آموزش و تنظیم دقیق چنین مدل‌هایی در یک بسته قرار دهیم.

لطفا ملاقات کنید Quaterion – یک چارچوب متن‌باز، سریع، قابل تنظیم و مقیاس‌پذیر برای آموزش و تنظیم دقیق مدل‌های یادگیری مشابه.

این نه تنها به شما امکان می‌دهد تا مدل‌های یادگیری شباهت را به آسانی یک طبقه‌بندی‌کننده معمولی توسعه دهید، بلکه می‌توانید آن را با سرعت بیشتری حتی در ضعیف‌ترین GPU انجام دهید.

مقایسه سرعت تمرین با ویژگی Quaterion Cache (سرعت ضبط بدون تغییر است)

به لطف مکانیسم ذخیره سازی، می توانید در حین اتمام یک فنجان قهوه، ده ها آزمایش انجام دهید. در عین حال، به شما امکان می دهد از اندازه های دسته ای استفاده کنید که از راه های دیگر دست نیافتنی هستند.

Quaterion در بالای ساخته شده است PyTorch Lightning – چارچوبی برای تحقیقات هوش مصنوعی با کارایی بالا. تمام وظایف مربوط به ساخت یک حلقه آموزشی برای مدل‌های ML را بر عهده می‌گیرد: مدیریت دوره‌ها، گزارش‌گیری، توقف زودهنگام، نقطه‌گذاری چک، آموزش توزیع‌شده، و خیلی بیشتر.

علاوه بر قابلیت PyTorch Lightning، Quaterion یک داربست برای تعریف:

  • مدل‌های یادگیری شباهت با قابلیت تنظیم دقیق – رمزگذارها و لایه‌های سر
  • مجموعه داده ها و بارگذارهای داده برای نمایش اطلاعات شباهت
  • توابع از دست دادن برای یادگیری شباهت
  • معیارهایی برای ارزیابی عملکرد مدل

بعدی چیه؟

می توانید از Quaterion استفاده کنید همین الان!

ما نمونه‌هایی از مدل‌هایی را آماده کرده‌ایم که می‌توانید با Quaterion آن‌ها را تنظیم کنید:

  • آموزش NLP – پاسخ در مورد سؤالات متداول ارائه دهنده ابر با یادگیری مشابه
  • آموزش CV – جستجو برای ماشین های مشابه در دسته بندی های رمان

اگر به الهام بیشتر نیاز دارید، ما را بررسی کنید دموهای زنده، راه حل ها و صنایع جایی که یادگیری شباهت قبلاً با موفقیت اعمال شده است.

ما نیز مشتاقانه منتظر دیدار شما در ما هستیم جامعه اختلاف، گپ زدن و پاسخ به سوالات افرادی که روی کارهای مشابه کار می کنند.

لینک منبع

ارسال یک پاسخ

آدرس ایمیل شما منتشر نخواهد شد.