انویدیا اعلام کرده است که Isaac GR00T N1 - مدل بنیادین متنباز، از پیش آموزشدیده اما قابل تنظیم این شرکت که برای تسریع توسعه و قابلیتهای رباتهای انساننما طراحی شده است - اکنون در دسترس است. جنسن هوانگ (Jensen Huang)، بنیانگذار و مدیرعامل انویدیا میگوید: «عصر رباتیک عمومی فرا رسیده است.» «با Nvidia Isaac GR00T N1 و چارچوبهای جدید تولید داده و یادگیری ربات، توسعهدهندگان رباتیک در همه جا، مرز بعدی را در عصر هوش مصنوعی باز خواهند کرد.»
هوانگ در سخنرانی اصلی خود در GTC 2025، ربات انساننمای NEO Gamma شرکت 1X را به نمایش گذاشت که با استفاده از یک خطمشی پسآموزشدیده ساخته شده بر اساس مدل GR00T N1، کارهای مرتبسازی خودکار را انجام میدهد. برنت بورنیچ (Bernt Børnich)، مدیرعامل 1X Technologies میگوید: «آینده انساننماها در مورد سازگاری و یادگیری است.» «در حالی که ما مدلهای خود را توسعه میدهیم، GR00T N1 انویدیا تقویت قابل توجهی برای استدلال و مهارتهای ربات ارائه میدهد. با حداقل دادههای پسآموزشی، ما به طور کامل بر روی NEO Gamma مستقر شدیم - ماموریت خود را برای ایجاد رباتهایی که صرفاً ابزار نیستند، بلکه همراهانی هستند که قادر به کمک به انسانها به روشهای معنادار و غیرقابل اندازهگیری هستند، پیش میبریم.»
شاید به خاطر بیاورید که این ربات فوقالعاده شبیه به انسان را چند هفته پیش در تیزر Nothing برای آخرین تلفن خود دیده باشید. ما آن را پست نکردیم زیرا به نظر میرسید که یک انسان دیگر در لباس ربات است - ممنون، ایلان.
سایر شرکتهایی که در حال توسعه رباتهای انساننما هستند و دسترسی زودهنگام به مدل GR00T N1 داشتهاند، عبارتند از: Boston Dynamics، سازندگان Atlas؛ Agility Robotics; Mentee Robotics; و Neura Robotics.
مدل بنیادین GR00T N1 که در ابتدا یک سال پیش به عنوان پروژه GR00T اعلام شد، از یک معماری دو سیستمی الهام گرفته از شناخت انسان استفاده میکند.
سیستم 1، همانطور که انویدیا آن را مینامد، به عنوان یک «مدل عمل تفکر سریع» توصیف میشود که رفتاری مشابه رفلکسها و شهود انسان دارد. این سیستم بر اساس دادههای جمعآوریشده از طریق نمایشهای انسانی و دادههای مصنوعی تولید شده توسط پلتفرم Omniverse انویدیا آموزش داده شده است.
سیستم 2، که توسط یک مدل زبان بصری (vision language model) نیرو میگیرد، یک «مدل تفکر آهسته» است که «در مورد محیط خود و دستورالعملهایی که دریافت کرده است، استدلال میکند تا اقدامات را برنامهریزی کند.» این برنامهها به سیستم 1 منتقل میشوند، که آنها را به «حرکات ربات دقیق و پیوسته» تبدیل میکند که شامل گرفتن، حرکت دادن اشیاء با یک یا دو بازو، و همچنین وظایف چند مرحلهای پیچیدهتر است که شامل ترکیبی از مهارتهای اساسی است.
در حالی که مدل بنیادین GR00T N1 با استدلال و مهارتهای کلی انساننما از پیش آموزش داده شده است، توسعهدهندگان میتوانند رفتار و قابلیتهای آن را برای نیازهای خاص با پسآموزش آن با دادههای جمعآوریشده از نمایشهای انسانی یا شبیهسازیها سفارشی کنند.
انویدیا دادههای آموزشی GR00T N1 و سناریوهای ارزیابی وظایف را برای دانلود از طریق Hugging Face و GitHub در دسترس قرار داده است.
بهروزرسانی، ۱۹ مارس: بهروزرسانی نظر از برنت بورنیچ، مدیرعامل 1X Technologies.