اعتبار: تصویر تولید شده توسط VentureBeat با FLUX-pro-1.1-ultra
اعتبار: تصویر تولید شده توسط VentureBeat با FLUX-pro-1.1-ultra

فراتر از RAG: چگونه مدل‌های زنجیره تأمین Articul8 به دقت ۹۲٪ دست می‌یابند، جایی که هوش مصنوعی عمومی شکست می‌خورد

در رقابت برای پیاده‌سازی هوش مصنوعی در عملیات تجاری، بسیاری از شرکت‌ها متوجه می‌شوند که مدل‌های عمومی اغلب با وظایف تخصصی صنعتی که نیازمند دانش عمیق دامنه و استدلال متوالی هستند، مشکل دارند.

در حالی که تنظیم دقیق (fine-tuning) و بازیابی اطلاعات افزوده (Retrieval Augmented Generation - RAG) می‌توانند کمک‌کننده باشند، این روش‌ها اغلب برای موارد استفاده پیچیده مانند زنجیره تأمین کافی نیستند. این چالشی است که استارت‌آپ Articul8 به دنبال حل آن است. امروز، این شرکت مجموعه‌ای از مدل‌های هوش مصنوعی ویژه دامنه را برای زنجیره‌های تأمین تولیدی با نام A8-SupplyChain معرفی کرد. این مدل‌های جدید با ModelMesh شرکت Articul8 همراه هستند که یک لایه هماهنگ‌سازی پویا مبتنی بر هوش مصنوعی عاملی (agentic AI) است و تصمیمات بلادرنگ در مورد اینکه کدام مدل‌های هوش مصنوعی برای وظایف خاص استفاده شوند را اتخاذ می‌کند.

Articul8 ادعا می‌کند که مدل‌هایش در گردش‌کارهای صنعتی به دقت ۹۲٪ دست می‌یابند و در وظایف استدلال متوالی پیچیده از مدل‌های هوش مصنوعی عمومی عملکرد بهتری دارند.

Articul8 به عنوان یک تیم توسعه داخلی در اینتل (Intel) شروع به کار کرد و در سال ۲۰۲۴ به عنوان یک کسب‌وکار مستقل جدا شد. این فناوری از کارهای انجام شده در اینتل پدید آمد، جایی که تیم قبل از عرضه ChatGPT، مدل‌های هوش مصنوعی چندوجهی را برای مشتریان، از جمله گروه مشاوره بوستون (Boston Consulting Group)، ساخته و مستقر کرده بود.

این شرکت بر اساس یک فلسفه اصلی ساخته شده است که با بسیاری از رویکردهای فعلی بازار به هوش مصنوعی سازمانی در تضاد است.

آرون سوبرامانیان، مدیرعامل و بنیانگذار Articul8 در مصاحبه‌ای اختصاصی با VentureBeat گفت: «ما بر این باور اصلی بنا شده‌ایم که هیچ مدل واحدی شما را به نتایج سازمانی نمی‌رساند، شما واقعاً به ترکیبی از مدل‌ها نیاز دارید.» وی افزود: «شما به مدل‌های ویژه دامنه نیاز دارید تا واقعاً بتوانید موارد استفاده پیچیده در صنایع تحت نظارت مانند هوافضا، دفاع، تولید، نیمه‌هادی‌ها یا زنجیره تأمین را هدف قرار دهید.»

چالش هوش مصنوعی در زنجیره تأمین: زمانی که توالی و زمینه، موفقیت یا شکست را تعیین می‌کنند

زنجیره‌های تأمین تولیدی و صنعتی چالش‌های منحصر به فردی را برای هوش مصنوعی ایجاد می‌کنند که مدل‌های عمومی در مدیریت مؤثر آن‌ها دچار مشکل هستند. این محیط‌ها شامل فرآیندهای پیچیده چند مرحله‌ای هستند که در آن‌ها توالی، منطق انشعاب و وابستگی‌های متقابل بین مراحل، حیاتی هستند.

سوبرامانیان توضیح داد: «در دنیای زنجیره تأمین، اصل اساسی این است که همه چیز مجموعه‌ای از مراحل است.» وی افزود: «همه چیز مجموعه‌ای از مراحل مرتبط است و این مراحل گاهی اوقات ارتباطاتی دارند و گاهی اوقات بازگشتی (recursion) هستند.»

به عنوان مثال، فرض کنید کاربری در حال مونتاژ یک موتور جت است؛ اغلب چندین دفترچه راهنما وجود دارد. هر یک از این دفترچه‌ها حداقل چند صد، اگر نه چند هزار، مرحله دارد که باید به ترتیب دنبال شوند. این اسناد فقط اطلاعات ثابت نیستند - آن‌ها در واقع داده‌های سری زمانی هستند که فرآیندهای متوالی را نشان می‌دهند و باید دقیقاً دنبال شوند. سوبرامانیان استدلال کرد که مدل‌های هوش مصنوعی عمومی، حتی زمانی که با تکنیک‌های بازیابی تقویت شوند، اغلب در درک این روابط زمانی شکست می‌خورند.

این نوع استدلال پیچیده - ردیابی به عقب در یک رویه برای شناسایی محل وقوع خطا - یک چالش اساسی است که مدل‌های عمومی برای مدیریت آن ساخته نشده‌اند.

ModelMesh: یک لایه هوشمند پویا، نه فقط یک هماهنگ‌کننده دیگر

در قلب فناوری Articul8، ModelMesh قرار دارد که فراتر از چارچوب‌های معمول هماهنگ‌سازی مدل‌ها عمل می‌کند تا آنچه را که شرکت به عنوان «عاملی از عامل‌ها» (an agent of agents) برای کاربردهای صنعتی توصیف می‌کند، ایجاد نماید.

سوبرامانیان توضیح داد: «ModelMesh در واقع یک لایه هوشمند است که همزمان با پیشرفت کار، مرحله به مرحله، به اتصال و تصمیم‌گیری و رتبه‌بندی موارد ادامه می‌دهد.» وی افزود: «این چیزی است که ما مجبور شدیم کاملاً از ابتدا بسازیم، زیرا هیچ یک از ابزارهای موجود حتی نزدیک به انجام کاری که ما باید انجام دهیم، یعنی اتخاذ صدها، گاهی حتی هزاران، تصمیم در زمان اجرا، نمی‌شوند.»

برخلاف چارچوب‌های موجود مانند LangChain یا LlamaIndex که گردش‌کارهای از پیش تعریف‌شده ارائه می‌دهند، ModelMesh سیستم‌های بیزی (Bayesian systems) را با مدل‌های زبانی تخصصی ترکیب می‌کند تا به صورت پویا تعیین کند که آیا خروجی‌ها صحیح هستند، اقدامات بعدی چه باید باشند و چگونه سازگاری در فرآیندهای صنعتی پیچیده حفظ شود.

این معماری چیزی را امکان‌پذیر می‌سازد که Articul8 آن را هوش مصنوعی عاملی درجه صنعتی توصیف می‌کند—سیستم‌هایی که نه تنها می‌توانند در مورد فرآیندهای صنعتی استدلال کنند، بلکه فعالانه آن‌ها را هدایت نمایند.

فراتر از RAG: رویکردی بنیادی به هوش صنعتی

در حالی که بسیاری از پیاده‌سازی‌های هوش مصنوعی سازمانی برای اتصال مدل‌های عمومی به داده‌های شرکتی به بازیابی اطلاعات افزوده (RAG) متکی هستند، Articul8 رویکرد متفاوتی برای ایجاد تخصص دامنه اتخاذ می‌کند.

سوبرامانیان توضیح داد: «ما در واقع داده‌های زیربنایی را گرفته و آن‌ها را به عناصر تشکیل‌دهنده‌شان تجزیه می‌کنیم.» وی افزود: «ما یک PDF را به متن، تصاویر و جداول تجزیه می‌کنیم. اگر صدا یا ویدیو باشد، آن را به عناصر تشکیل‌دهنده زیربنایی‌اش تجزیه می‌کنیم و سپس آن عناصر را با استفاده از ترکیبی از مدل‌های مختلف توصیف می‌کنیم.»

این شرکت با Llama 3.2 به عنوان پایه شروع می‌کند، که عمدتاً به دلیل مجوزهای سهل‌گیرانه‌اش انتخاب شده است، اما سپس آن را از طریق یک فرآیند چند مرحله‌ای پیچیده تغییر می‌دهد. این رویکرد چند لایه به مدل‌های آن‌ها اجازه می‌دهد تا درک بسیار غنی‌تری از فرآیندهای صنعتی نسبت به بازیابی صرف تکه‌های مرتبط داده، توسعه دهند.

مدل‌های SupplyChain مراحل متعددی از اصلاح را طی می‌کنند که به طور خاص برای زمینه‌های صنعتی طراحی شده‌اند. برای وظایف کاملاً تعریف‌شده، از تنظیم دقیق نظارت‌شده (supervised fine-tuning) استفاده می‌کنند. برای سناریوهای پیچیده‌تر که نیاز به دانش تخصصی دارند، حلقه‌های بازخوردی را پیاده‌سازی می‌کنند که در آن کارشناسان دامنه پاسخ‌ها را ارزیابی کرده و اصلاحات را ارائه می‌دهند.

چگونه شرکت‌ها از Articul8 استفاده می‌کنند

اگرچه هنوز برای مدل‌های جدید زود است، این شرکت در حال حاضر ادعا می‌کند که تعدادی مشتری و شریک از جمله iBase-t، Itochu Techno-Solutions Corporation، Accenture و Intel دارد.

مانند بسیاری از سازمان‌ها، اینتل سفر هوش مصنوعی مولد (gen AI) خود را با ارزیابی مدل‌های عمومی آغاز کرد تا بررسی کند چگونه می‌توانند از عملیات طراحی و تولید پشتیبانی کنند.

سرینیواس لینگام، معاون شرکت و مدیر کل گروه شبکه، لبه و هوش مصنوعی در اینتل، به VentureBeat گفت: «در حالی که این مدل‌ها در وظایف باز چشمگیر هستند، ما به سرعت محدودیت‌های آن‌ها را هنگام اعمال در محیط نیمه‌هادی بسیار تخصصی خود کشف کردیم.» وی افزود: «آن‌ها در تفسیر اصطلاحات خاص نیمه‌هادی، درک زمینه از لاگ‌های تجهیزات، یا استدلال در سناریوهای پیچیده و چند متغیره از کار افتادگی، مشکل داشتند.»

اینتل در حال استقرار پلتفرم Articul8 برای ساختن چیزی است که لینگام آن را – دستیار حوادث تولید (Manufacturing Incident Assistant) – نامید؛ یک سیستم هوشمند مبتنی بر زبان طبیعی که به مهندسان و تکنسین‌ها در تشخیص و حل رویدادهای از کار افتادگی تجهیزات در کارخانه‌های اینتل (fabs) کمک می‌کند. او توضیح داد که این پلتفرم و مدل‌های ویژه دامنه هم داده‌های تولیدی تاریخی و هم بلادرنگ، از جمله لاگ‌های ساختاریافته، مقالات ویکی بدون ساختار و مخازن دانش داخلی را دریافت می‌کنند. این سیستم به تیم‌های اینتل در انجام تحلیل علل ریشه‌ای (RCA)، توصیه اقدامات اصلاحی و حتی خودکارسازی بخش‌هایی از تولید دستور کار کمک می‌کند.

این به چه معناست برای استراتژی هوش مصنوعی سازمانی

رویکرد Articul8 این فرض را به چالش می‌کشد که مدل‌های عمومی با RAG برای تمام موارد استفاده شرکت‌هایی که هوش مصنوعی را در زمینه‌های تولیدی و صنعتی پیاده‌سازی می‌کنند، کافی خواهند بود. شکاف عملکرد بین مدل‌های تخصصی و عمومی نشان می‌دهد که تصمیم‌گیرندگان فنی باید رویکردهای ویژه دامنه را برای کاربردهای حیاتی که در آن‌ها دقت از اهمیت بالایی برخوردار است، در نظر بگیرند.

همانطور که هوش مصنوعی از مرحله آزمایش به تولید در محیط‌های صنعتی حرکت می‌کند، این رویکرد تخصصی ممکن است بازگشت سرمایه (ROI) سریع‌تری را برای موارد استفاده خاص با ارزش بالا فراهم کند، در حالی که مدل‌های عمومی همچنان به نیازهای گسترده‌تر و کمتر تخصصی خدمت می‌کنند.