Anthropic برای اولین بار قدرتمندترین مدل هوش مصنوعی خود را با محافظتهای لازم در دسترس عموم قرار میدهد.
روز سهشنبه، شرکت هوش مصنوعی Anthropic، مدل Claude Fable 5 را عرضه کرد که اولین نسخه عمومی از مدل Mythos این شرکت است. Anthropic میگوید Fable 5 در مهندسی نرمافزار، کارهای دانشی و بینایی برتری دارد، اما با محدودیتهای ایمنی سختگیرانه همراه است. در حوزههای پرخطر مانند امنیت سایبری، زیستشناسی، شیمی و تقطیر، این مدل از پاسخدهی جلوگیری کرده و به Claude Opus 4.8 بازمیگردد.
Mythos که در ماه آوریل به عنوان نسخه پیشنمایش معرفی شد، در ابتدا به دلیل نگرانیهای امنیتی سایبری به تعداد محدودی از شرکا محدود بود. هفته گذشته، Anthropic دسترسی به آن را برای صدها سازمان در ۱۵ کشور گسترش داد، که باز هم بر سازمانهایی که زیرساختهای حیاتی را مدیریت میکنند، متمرکز بود.
اکنون، نسخهای از این فناوری از طریق API Claude و طرحهای سازمانی (Enterprise plans) مبتنی بر مصرف Anthropic برای همه در دسترس است. دسترسی به اشتراکها به صورت مرحلهای خواهد بود: تا ۲۲ ژوئن، Fable 5 بدون هزینه اضافی در طرحهای Pro، Max، Team و طرحهای سازمانی مبتنی بر صندلی گنجانده میشود. از ۲۳ ژوئن، Anthropic مدل Fable 5 را از این طرحها خارج کرده و استفاده از آن نیاز به اعتبار مصرف خواهد داشت، با برنامهریزی برای بازگرداندن آن به عنوان یک ویژگی استاندارد اشتراک در اسرع وقت.
Anthropic همچنین نسخه جدیدی از Mythos، به نام Mythos 5، را برای سازمانهایی که قبلاً مجوز دسترسی به مدل پیشرفته را دریافت کردهاند، منتشر میکند.
عرضه Fable در حالی صورت میگیرد که Anthropic آماده ورود به بازارهای عمومی میشود، در کنار OpenAI و SpaceX ایلان ماسک. این اتفاق پس از درخواست شرکت هوش مصنوعی برای ایجاد یک مکانیزم توقف هماهنگ در توسعه هوش مصنوعیهای پیشگامانه توسط آزمایشگاههای بزرگ جهانی هوش مصنوعی صورت میگیرد. Anthropic هشدار داد که سیستمها به سرعت در حال پیشرفت هستند و ممکن است به زودی به خودبهبودی بازگشتی (RSI) دست یابند، یعنی به طور خودمختار و بدون دخالت انسان خود را بهبود بخشند.
Anthropic که نگران کارهایی است که یک مدل در کلاس Mythos میتواند در دست افراد نادرست انجام دهد، میگوید قبل از انتشار Fable 5، طبقهبندیکنندههای خود را با تلاشهای جیلبریک (فرار از محدودیتها) مورد آزمایش قرار داده است.
«در داخل، ما یک برنامه جایزه باگ خارجی را اجرا کردیم که در بیش از ۱۰۰۰ ساعت آزمایش، هیچ جیلبریک جهانی پیدا نکرد. سپس با سازمانهای خارجی "تیم قرمز" همکاری کردیم که آنها نیز در یافتن جیلبریکهای جهانی شکست خوردند.»
با این حال، حملات جدید همچنان ممکن است رخ دهند. در نتیجه، با عرضه Fable 5 و Mythos 5، Anthropic اعلام کرده که نیاز به حفظ ۳۰ روزه تمام ترافیک خواهد داشت، حتی اگر سازمانها قبلاً توافقنامه عدم نگهداری اطلاعات (zero-retention) داشتند. Anthropic گفت که از این دادهها برای آموزش استفاده نخواهد کرد، بلکه تنها برای «دفاع در برابر حملات پیچیده و جدید، از جمله جیلبریکهای جدید» و «شناسایی و کاهش مثبت کاذب» استفاده میکند. این سیاست میتواند یک رویه صنعتی جدید را ایجاد کند که در آن دسترسی به مدلهای قدرتمندتر با سیاستهای اجباری نگهداری دادهها همراه باشد که به عنوان یک اقدام ایمنی توجیه میشوند.
برای کسانی که همچنان از این مدل استفاده میکنند، هر سوالی با پاسخ Fable 5 دریافت نخواهد شد. Anthropic میگوید مواردی که Fable باید به Opus 4.8 ارجاع دهد نادر هستند، و دادههای اولیه نشان میدهد که حداقل ۹۵٪ از جلسات Fable به طور کامل با پاسخهای خود این مدل انجام میشوند.
در تستهای شخص ثالث، شرکت تجزیه و تحلیل Hex در بیانیهای گفت که Fable اولین مدلی بود که در معیار اصلی تجزیه و تحلیل خود برای کارهای تحلیلی پیچیده و طولانیمدت، نمره ۹۰٪ را کسب کرد.
Hex اظهار داشت: «در سختترین سوالات، قضاوت قوی و توجه به ظرافتها را نشان میدهد.»
پلتفرم کدنویسی Base44 در بیانیهای اشاره کرد که Fable در «ساخت سریع اپلیکیشنهای کامل» بهتر عمل میکند و دارای قابلیتهای عالی در فراخوانی ابزارها است. Genspark، پلتفرم فضای کاری و عامل مبتنی بر هوش مصنوعی، گفت که Fable در ارزیابیهای آنها تمام مدلهای دیگر را شکست داده و در کارهایی مانند طراحی رابط کاربری و کدنویسی بازی به طور قابل توجهی بهتر عمل کرده است.
قیمتگذاری برای هر دو Fable 5 و Mythos 5 به ازای هر میلیون توکن ورودی ۱۰ دلار و به ازای هر میلیون توکن خروجی ۵۰ دلار است که دو برابر قیمت Opus 4.8 است. این قیمت به تنهایی ممکن است مانعی برای استفاده گسترده باشد.
بسیاری از سازمانها پس از دریافت صورتحسابها یا زودتر از موعد به اتمام رساندن بودجه سالانه هوش مصنوعی خود، نسبت به هزینههای هوش مصنوعی انتقادی شدهاند. مدلهای پیشرفته مانند Opus 4.8 میتوانند این مشکلات را تشدید کنند، با مهارتهای استدلال پیشرفتهای که میتوانند یک درخواست واحد را به چندین وظیفه تقسیم کنند.
Anthropic اعلام کرد که انتظار دارد تقاضا برای Fable 5 بسیار بالا و پیشبینی آن دشوار باشد. و البته برخی، مانند پلتفرم پاداش خرید Rakuten، ممکن است فکر کنند که مزایای آن ارزش قیمت را دارد.
Rakuten در بیانیهای گفت: «در بالاترین سطح تلاش، Fable کار خود را بازتاب داده و اعتبارسنجی میکند. برای ما، این چیزی است که عملیات بسیار خودمختار را ممکن میسازد – این تفکر اضافی، هزینههای خود را جبران میکند.»