شرکت بزرگ سازنده تراشه، انویدیا (Nvidia)، روز چهارشنبه از در دسترس بودن عمومی ابزارهایی برای توسعه هوش مصنوعی "عاملی" (agentic) برای شرکتها خبر داد.
ابزارهای نرمافزاری که NeMo microservices نامیده میشوند و بخشی از مجموعه نرمافزاری AI Enterprise انویدیا هستند، عملکردهای مختلفی را ارائه میدهند که عملکرد عوامل هوش مصنوعی را برای طیف وسیعی از وظایف، از جمله مراکز تماس و توسعه نرمافزار، سفارشی و به طور مکرر بهینه میکنند.
جویی کانوی (Joey Conway)، رئیس بخش هوش مصنوعی مولد برای شرکتها در انویدیا، در یک جلسه توجیهی رسانهای، نرمافزار NeMo را به عنوان راهی برای استفاده از عوامل هوش مصنوعی به عنوان "کارمندان دیجیتال" معرفی کرد.
کانوی گفت: "دیدگاه ما در مورد اینکه اوضاع به کجا میرود این است که بیش از یک میلیارد کارگر دانشی در صنایع، مناطق جغرافیایی و مکانهای مختلف وجود دارد." "و دیدگاه ما این است که کارمندان دیجیتال یا عوامل هوش مصنوعی، قادر خواهند بود به شرکتها کمک کنند تا کار بیشتری را در این حوزهها و سناریوهای مختلف انجام دهند."
بهرهوری
کانوی گفت: پیادهسازیهای اولیه عوامل هوش مصنوعی، افزایش بهرهوری قابل اندازهگیری را نشان داده است.
به عنوان مثال، Amdocs، سازنده نرمافزاری که توسط شرکتهای تلفن استفاده میشود، از NeMo microservices برای ایجاد عوامل صورتحساب، عوامل فروش و عوامل شبکه استفاده کرده است. کانوی گفت، عامل صورتحساب، که تماسهای مشتریان در مورد قبض تلفن خود را رسیدگی میکند، توانست سوالات بیشتری را حل کند، از جمله 50٪ افزایش در چیزی که "حل و فصل تماس اول" نامیده میشود.
اظهارات کانوی در مورد عوامل به عنوان کارمندان دیجیتال، تکرار یک موضوع مداوم از سال گذشته است: ایده کد هوش مصنوعی به عنوان "کارگران" شرکتی که میتوانند فرآیندهای شرکتی را تصاحب کرده و درست مانند کارمندان مدیریت شوند.
انویدیا بیش از پنج سال است که نرمافزار NeMo را در اشکال مختلف ارائه میدهد، با هدف کلی تسریع توسعه مدلهای هوش مصنوعی توسط شرکتها.
در این راستا، این شرکت در سال 2022 شروع به ارائه مدلهای هوش مصنوعی از پیش ساخته شده NeMo به عنوان یک پیشنهاد ابری در صورت تقاضا کرد. Microservices در اکتبر سال گذشته دنبال شد.
اجزای Microservice جدید
اجزای NeMo شامل دو microservice است که قبلاً در دسترس بودهاند: Curator و Retriever. Curator توسط توسعهدهندگان برای ساختن "خطوط لوله" استفاده میشود که مجموعههای داده مورد استفاده برای آموزش یا تنظیم دقیق مدلهای هوش مصنوعی را پاک و اصلاح میکنند. Retriever منابع داده را میگیرد و عناصری را استخراج میکند که توسط مدل استفاده میشوند، مانند متن، گرافیک و عناصر نمودار.
سه جزء اضافی با Curator و Retriever کار میکنند: Customizer، Evaluator و Guardrails.
Microservice Customizer خروجی Curator را میگیرد و آن را با تکنیکهایی برای پس از آموزش یا تنظیم دقیق ترکیب میکند تا "به این مدلها مهارتهای جدید بیاموزد"، همانطور که کانوی بیان کرد.
Evaluator نوعی نسخه فشاری از تستهای معیار هوش مصنوعی است که مدل را پس از گذراندن Customizer از طریق آزمایش اجرا میکند تا ارزیابی کند که آیا مدل "واقعاً بهبود یافته و مهارتهای جدیدی کسب کرده است".
Guardrails قرار است در زمان اجرا با عامل هوش مصنوعی کار کند تا "حفاظت از انطباق" را با توجه به "اقدامات ایمنی و امنیتی" برای یک شرکت بهبود بخشد.
بهروزرسانی و کسب تواناییهای جدید
هدف از NeMo این است که مدلها به طور مکرر از طریق microserviceهای مختلف عبور کنند تا بهروزرسانی شوند و تواناییهای جدیدی کسب کنند، چیزی که انویدیا از آن به عنوان "چرخ طیار" یاد میکند.
NeMo microservices با نرمافزار زیرساخت انویدیا برای استقرار عوامل، به نام NIM، مخفف Nvidia Inference Microservices، جفت میشود. NIM یک مدل هوش مصنوعی در یک ظرف برنامه است که روی یک مدیر ظرف، مانند Kubernetes، اجرا میشود و توسعهدهندگان از طریق یک API به آن دسترسی دارند.
کانوی از انویدیا گفت: نرمافزار NeMo بسیاری از وظایف آموزش، پس از آموزش، ارزیابی و تجدیدنظر را که توسعهدهندگان در صورت کار مستقیم با کد پایتون و چارچوبهای هوش مصنوعی باید انجام دهند، بسیار ساده میکند.
کانوی گفت: "تمرکز NeMo microservices این است که بتوان این microserviceها را ساخت تا بقیه اکوسیستم بتوانند خیلی سریعتر شروع به کار کنند." او با اشاره به توسعه مدلها و عوامل هوش مصنوعی و استقرار آنها، گفت: "از تجربه ما، دیدهایم که اینها میتوانند بسیار پیچیده باشند."
او افزود: "قبلاً، بسیاری از مشتریان پیشرفته ما مجبور بودند به کتابخانههای مختلف منبع باز تکیه کنند، که اغلب بهترین تلاش هستند و همیشه درست نیستند." "ما توانستهایم تمام آن نرمافزار را بگیریم، آن را زیر NeMo Evaluator قرار دهیم، آخرین تکنیکها را اضافه کنیم و سپس تعامل را ساده کنیم، بنابراین چند فراخوانی API ساده است."