NLP Course documentation

به دوره‌ آموزشی هاگینگ‌فِیس خوش آمدید

Hugging Face's logo
Join the Hugging Face community

and get access to the augmented documentation experience

to get started

# مقدمه
Ask a Question

به دوره‌ آموزشی هاگینگ‌فِیس خوش آمدید

در این دوره آموزشی، پردازش زبان طبیعی[^1] را با استفاده از کتابخانه‌های اکوسیستم هاگینگ‌فِیس یعنی Transformers, Datasets, Tokenizers, Accelerate و همچنین هاب هاگینگ‌فِیس می‌آموزید. این دوره کاملا رایگان و بدون تبلیغات است.

در این دوره چه چیزهایی را می‌آموزیم؟

دید کلی کوتاه از مباحث این دوره آموزشی:

دید کلی کوتاه از مباحث این دوره آموزشی
  • از فصل ۱ تا ۴ مقدمه‌ای از مباحث‌ پایه‌‌ای کتابخانه‌ی ترنسفورمرز هاگینگ‌فِیس ارائه می‌شود. در پایان این فصل، شما با شیوه‌ی عملکرد مدل‌های ترنسفومر آشنا می‌شوید و می‌آموزید که چگونه از یک مدل در هاب هاگینگ‌فِیس استفاده کنید، آن را برای مجموعه داده خود کوک کنید و نتایج خود را در هاب به اشتراک بگذارید.
  • در فصل‌های ۵ تا ۸، اصول پایه‌‌ی کتابخانه‌های Datasets و Tokenizers، پیش از آن که وارد مسائل کلاسیک NLP شویم،‌ آموزش داده می‌شوند. در پایان این فصول، قادر خواهید بود مسائل متداول NLP را به تنهایی حل کنید.
  • فصل‌های ۹ تا ۱۲ به مباحث فراتر از NLP و استفاده از مدل‌های ترنسفورمر برای حل مسائل پردازش گفتار و بینایی ماشین می‌پردازند. در طی این مسیر، فرا می‌گیرید که چگونه مدلی جدید ساخته، نمونه اولیه از آن را عرضه کرده و برای محیط استقرار نرم‌افزار بهینه‌اش کنید. در پایان این فصل، آماده‌ی استفاده از ترنسفورمرهای هاگینگ‌فِیس برای (تقریبا) همه مسائل یادگیری ماشین خواهید بود.

این دوره آموزشی:

  • به سطح خوبی از دانش پایتون نیاز دارد.
  • بهتر است پس از یک دوره آموزشی آشنایی با یادگیری عمیق، مانند دوره آموزشی یادگیری عمیق عملی برای برنامه‌نویس‌ها از fast.ai و یا یکی از دوره‌های ارائه شده توسط DeepLearning.AI، دنبال شود.
  • نیازمند دانش پیشین پایتورچ یا تِنسورفِلو نیست، با این حال آشنایی با هر کدام از آنها می‌تواند کمک‌کننده باشد.

پس از اینکه این دوره آموزشی را به پایان رساندید، توصیه می‌کنیم نگاهی به دوره آموزشی تخصصی پردازش زبان طبیعی که توسط DeepLearning.AI ارائه شده است، بیاندازید. این دوره، بخش اعظمی از مدل‌های سنتی‌ NLP مانند دسته‌بندی‌کننده بیز ساده و LSTMها را شامل می‌شود که شناخت آن‌ها ارزشمند است.

ما چه کسانی هستیم؟

درباره نویسندگان:

متیو کاریگن[^2] مهندس یادگیری ماشین در هاگینگ‌فِیس است. او در دوبلین ایرلند زندگی می‌کند و پیش‌تر بعنوان مهندس یادگیری ماشین در Parse.ly مشغول به کار بوده است. او دوره‌ی تحقیقات پسادکترای خود را در کالج ترینیتی دوبلین به پایان رسانده است. به عقیده‌ی وی هوش جامع مصنوعی[^3] با افزایش مقیاس معماری‌های فعلی حاصل نخواهد شد، با این حال او امید بسیاری به جاودانگی انسان در قالب رباتی دارد.

لیسندره دبوت[^4] مهندس یادگیری ماشین در هاگینگ‌فِیس است و از ابتدا، بر روی کتابخانه‌ی ترنفسورمرهای هاگینگ‌فِیس کار کرده است. هدف او دسترس‌پذیر کردن NLP برای همگان با توسعه ابزارهایی با API بسیار ساده است.

سیلوین گوجر[^5] مهندس محقق در هاگینگ‌فِیس است و از هسته‌ی تیم مدیریت‌کنندگان کتابخانه‌ی ترنفسورمرهای هاگینگ‌فِیس محسوب می‌شود. او قبل‌تر مهندس محقق در fast.ai بود و کتاب یادگیری عمیق عملی برای برنامه‌نویس‌ها با استفاده از fast.ai و پایتورچ را با همکاری جرمی هاوارد[^6] نگاشته است. تمرکز اصلی تحقیقات وی بر دسترس‌پذیرتر کردن یادگیری عمیق است. او برای این کار از طراحی و پیش‌برد شیوه‌هایی استفاده می‌کند که امکان یادگیری سریع با منابع محدود را برای مدل‌ها پدید می‌آورد.

مروه نویان[^7] توسعه‌ی دهنده در هاگینگ‌فِیس است و بر روی توسعه‌ی ابزارها و تولید محتوا برای آن‌ها کار می‌کند. هدف او دسترس‌پذیر کردن یادگیری ماشین برای همگان است.

لوسیله ساولنیر[^8] مهندس یادگیری ماشین در هاگینگ‌فِیس است و بر روی توسعه و پشتیبانی از ابزارهای متن‌باز تمرکز دارد. وی همچنین بصورت فعالانه‌ای در بسیاری از پروژهای تحقیقاتی در حوزه پردازش زبان طبیعی، مانند یادگیری مشارکتی و بیگ‌ساینس مشارکت دارد.

لویس تونستال[^9] مهندس یادگیری ماشین در هاگینگ‌فِیس است. تمرکز اصلی او توسعه‌ی ابزارهای متن باز و دسترس‌پذیر کردن آنها برای جامعه‌ی گسترده‌تری از کاربران است. او همچنین از نویسندگان کتاب انتشارات اُریلی[^10] درباره‌ی ترنسفورمرها است.

لئاندرو ون ورا[^11] مهندس یادگیری ماشین در تیم متن‌باز هاگینگ‌فِیس و از نویسندگان کتاب انتشارات اُریلی درباره‌ی ترنسفورمرها است. وی تجربه‌ی چندین سال کار در صنعت را دارد. او با کار در تمام جنبه‌های یادگیری ماشین، پروژه‌های متن‌باز را از مرحله‌ی تحقیق به استقرار در صنایع می‌رساند.

آماده‌ی ورود به این دوره هستید؟ در این فصل شما می‌آموزید که:

  • چگونه می‌توان از تابع pipeline() برای حل مسائل NLP مانند تولید متن و دسته‌بندی استفاده کرد.
  • معماری ترنسفورمرها چگونه است.
  • چگونه معماری‌های مختلف انکودر، دیکودر و انکودر-دیکودر را از یکدیگر تشخصی داد و کاربردهای آن‌ها در چیست.

[^1]: Natural Language Processing (NLP) [^2]: Matthew Carrigan [^3]: Artificial General Intelligence (AGI) [^4]: Lysandre Debut [^5]: Sylvain Gugger [^6]: Jeremy Howard [^7]: Merve Noyan [^8]: Lucile Saulnier [^9]: Lewis Tunstall

[^11]: Leandro von Werra