آمازون وب سرویسها (AWS) از در دسترس بودن لنز جدید هوش مصنوعی مولد Well-Architected خبر داده است که بر ارائه بهترین شیوهها برای طراحی و بهرهبرداری از حجمهای کاری هوش مصنوعی مولد تمرکز دارد. این لنز برای رهبران تجاری، دانشمندان داده، معماران و مهندسانی در نظر گرفته شده است که مسئول ارائه راهحلهای قوی و مقرونبهصرفه با استفاده از هوش مصنوعی مولد هستند. این سند بهترین شیوههای مستقل از ابر، راهنماییهای پیادهسازی و پیوندهایی به منابع اضافی ارائه میدهد.
لنز هوش مصنوعی مولد به هوش مصنوعی مسئولانه میپردازد و چالشهای جدیدی را که با ظهور قابلیتهای مبتنی بر هوش مصنوعی ارائه میشوند، تصدیق میکند و مجموعهای از ملاحظات را برای مشتریان برای بررسی و رسیدگی به آنها ارائه میدهد. این مقاله بر نیاز به اطمینان از صحت و استحکام (یعنی دستیابی به خروجیهای صحیح سیستم، حتی با ورودیهای غیرمنتظره یا خصمانه) در مقایسه با راهحلهای یادگیری ماشینی سنتی تأکید میکند.
این لنز یک فرآیند تکراری برای طراحی، ارائه و بهرهبرداری از راهحلهای هوش مصنوعی مولد ترویج میکند. شش مرحله چرخه حیات هوش مصنوعی مولد شامل تعیین دامنه تأثیر، انتخاب و سفارشیسازی مدل، ادغام مدل در برنامههای موجود و استقرار قابلیت جدید مبتنی بر هوش مصنوعی است. مرحله نهایی شامل تکرار و بهبود قابلیت، بستن حلقه تکراری است.
این مقاله همچنین چالشهای بیشتری را برای معماری داده که با ارائه راهحلهای هوش مصنوعی مولد ایجاد میشود، پوشش میدهد. این سند بر سه مورد استفاده اصلی تمرکز دارد: پیشآموزش مدل، تنظیم دقیق مدل و تولید تقویتشده با بازیابی (RAG). هر یک از این موارد استفاده الزامات متفاوتی دارند، اما به طور کلی، آنها نیازمند رویکردهای بالغ و سازگار هستند که بتوانند از مجموعههای داده بزرگ و زیرساختهای پیچیده پشتیبانی کنند.
نویسندگان این اطلاعیه ارزش ارائه شده توسط این لنز را برجسته میکنند:
لنز هوش مصنوعی مولد یک رویکرد سازگار برای مشتریان فراهم میکند تا معماریهایی را ارزیابی کنند که از مدلهای زبانی بزرگ (LLM) برای دستیابی به اهداف تجاری خود استفاده میکنند. این لنز به ملاحظات رایج مربوط به انتخاب مدل، مهندسی سریع، سفارشیسازی مدل، یکپارچهسازی حجم کاری و بهبود مستمر میپردازد.
این سند تمام شش رکن چارچوب Well-Architected را پوشش میدهد و بسیاری از زمینههای خاص برای ارائه راهحلهای هوش مصنوعی مولد را مورد بحث قرار میدهد. همچنین مجموعهای از اصول طراحی را برای گردشهای کاری هوش مصنوعی مولد ایجاد شده در AWS ارائه میدهد، به طور خاص بر نیاز به خودمختاری کنترلشده تأکید میکند، که به ویژه برای حجمهای کاری هوش مصنوعی مرتبط است.
دانیلو پوچیا، مبلغ ارشد (EMEA) در AWS، این اطلاعیه را در پست X خود خلاصه کرد:
این لنز بر شیوههای هوش مصنوعی مسئولانه با ابعاد واضح برای انصاف، توضیحپذیری، حریم خصوصی، ایمنی و شفافیت تأکید میکند و مسئولیتهای مشترک بین تولیدکنندگان، ارائهدهندگان و مصرفکنندگان مدل را به رسمیت میشناسد.
درباره نویسنده
رافال گانکارز یک رهبر فناوری و متخصص با تجربه است. او در حال حاضر به استارباکس کمک میکند تا پلتفرم تجاری خود را مقیاسپذیر، انعطافپذیر و مقرونبهصرفه کند. پیش از این، رافال در طراحی و ساخت سیستمهای توزیعشده و مبتنی بر ابر در مقیاس بزرگ برای سیسکو، اکسنچر، کاپیتا، ICE، کال ساین و دیگران مشارکت داشته است. علایق او شامل معماری و طراحی، ارائه مداوم، مشاهدهپذیری و قابلیت عملیاتی، و همچنین جنبههای اجتماعی-فنی و سازمانی ارائه نرمافزار است.