چالش پالایش داده برای آموزش مدل‌های زبانی لبه

مقدمه و انگیزه

توسعه سریع مدل‌های زبانی (LM) کاتالیزوری برای پیشرفت‌ها در حوزه‌های مختلف، از جمله درک زبان طبیعی، رباتیک و تعامل انسان دیجیتال بوده است. در مقایسه با مدل‌های زبانی بزرگ عمومی که استقرار آنها در دستگاه‌های لبه‌ای با منابع محدود دشوار است، مدل‌های زبانی لبه که برای وظایف پایین‌دستی هدف‌گذاری شده تنظیم دقیق شده‌اند، این پتانسیل را دارند که هم به کارایی بیشتر و هم به دقت بالاتر وظیفه دست یابند. با این حال، این تنظیم دقیق به در دسترس بودن مجموعه داده‌های متنوع و با کیفیت بالا بستگی دارد.

چالش پالایش داده برای آموزش مدل‌های زبانی لبه به دنبال متحد کردن محققان دانشگاهی، کارشناسان صنعت و علاقه‌مندان به هوش مصنوعی برای توسعه تکنیک‌های پالایش داده است که مجموعه داده‌هایی را اصلاح می‌کنند که نسل بعدی مدل‌های زبانی لبه را هدایت می‌کنند.

این چالش از شرکت‌کنندگان دعوت می‌کند تا تکنیک‌های پالایش داده را ایجاد و مجموعه‌داده‌های اصلاح‌شده توسط این روش‌ها را ارسال کنند، با هدف افزایش قابل‌توجه عملکرد قابل دستیابی مدل‌های زبانی لبه در وظایف پایین‌دستی مستقر در دستگاه‌های لبه‌ای. با تمرکز بر بهبود دقت مدل و کاربرد در حوزه‌های حیاتی، شرکت‌کنندگان این فرصت را خواهند داشت که مرز مدل‌های زبانی لبه را به پیش ببرند و در جامعه هوش مصنوعی شناخته شوند. برای تکنیک تنظیم دقیق، ما بر روشی به نام انطباق با رتبه پایین (LoRA) تمرکز می‌کنیم، که امکان ایجاد مدل‌های زبانی لبه‌ای خاص وظیفه کارآمد از مدل‌های از پیش آموزش‌دیده با استفاده از منابع کمتر را فراهم می‌کند و آن را برای دستگاه‌هایی مانند تلفن‌های هوشمند و ربات‌های قابل‌حمل ایده‌آل می‌کند.

دامنه این چالش

از شرکت‌کنندگان دعوت می‌شود تا تکنیک‌های پالایش داده را برای انتخاب مجموعه‌داده‌های بهینه‌سازی‌شده برای موارد استفاده کلیدی در استقرار مدل زبانی لبه توسعه دهند و به کار گیرند. هدف این مجموعه‌داده‌ها افزایش عملکرد مدل‌های زبانی لبه در سناریوهای متنوع، از جمله موارد زیر است:

  • نقش‌آفرینی در محیط‌های دیجیتال تعاملی
  • فراخوانی عملکرد بر روی دستگاه‌های تلفن همراه
  • رباتیک برای وظایف مستقل
  • وظایف تولید تقویت‌شده با بازیابی (RAG)

هدف این است که اطمینان حاصل شود مدل‌های زبانی لبه که به‌طور مداوم روی این مجموعه‌داده‌های انتخاب‌شده آموزش داده می‌شوند، بهبودهای قابل‌توجهی را در این موارد استفاده نشان می‌دهند. به‌ویژه، شرکت‌کنندگان باید برجسته کنند که چگونه این مجموعه‌داده‌ها، همراه با مدل‌های تقویت‌شده با LoRA، عملکرد را بهبود می‌بخشند.

جزئیات بیشتر را می‌توانید در صفحه مسئله بیابید.

اخبار

  • 03/13/2025

وب‌سایت ما آنلاین است!

جدول زمانی چالش

  • انتشار وب‌سایت - 21 مارس 2025
  • انتشار ابزار - 1 مه 2025
  • آخرین‌مهلت ثبت‌نام - 21 مارس 2025
  • آخرین‌مهلت ارسال - 15 ژوئن 2025
  • اعلام جوایز - 22 ژوئن 2025
  • مراسم اهدای جوایز / کارگاه - تابستان 2025

جوایز

  • جایزه بزرگ - 10،000 دلار
  • جوایز خاص رده - 3،000 دلار
  • جایزه نوآوری - 3،000 دلار
حامی 1

حامیان

حامی 2
حامی 3
Shizhe Diao

برگزارکنندگان چالش

شیزه دیائو

NVIDIA

Yonggan Fu

یونگان فو

Georgia Institute of Technology

Xin Dong

شین دونگ

NVIDIA

Peter Belcak

پیتر بلکاک

NVIDIA

Lexington Whalen

لکسینگتون ویلن

Georgia Institute of Technology

Mostofa Patwary

مصطفی پاتواری

NVIDIA

Mohammad Shoeybi

محمد شعیبی

NVIDIA

Wenfei Zhou

ون‌فی ژو

NVIDIA

Jan Kautz

یان کاتز

NVIDIA

Yingyan (Celine) Lin

یینگیان (سلین) لین

Georgia Institute of Technology

Pavlo Molchanov

پاول مولچانوف

NVIDIA