آیبیام نسل بعدی خانواده مدلهای زبانی بزرگ Granite خود، Granite 3.2 را عرضه کرده است که به گفته این شرکت، هوش مصنوعی چندمدلی و استدلالی و همچنین ویژگیهای انعطافپذیری برای بهبود بهرهوری هزینه را ارائه میدهد.
این مدل بهروزرسانی شده بخشی از هدف آیبیام برای ارائه "هوش مصنوعی سازمانی کوچک، کارآمد و کاربردی" برای کسبوکارها و جامعه منبع باز است که به گفته این شرکت، پذیرش آن آسانتر و مقرونبهصرفهتر است.
کاربردهای جدید در Granite 3.2 شامل یک مدل زبان بصری برای پردازش اسناد، طبقهبندی و استخراج دادهها است. به گفته آیبیام، VLM با مدلهای بسیار بزرگتر مانند Llama 3.2 11B و Pixtral 12B در برابر معیارهای اساسی مطابقت دارد یا از آنها فراتر میرود.
علاوه بر این، آیبیام گفت که سایر تکنیکهای استدلال در این ارتقا، مانند مقیاسبندی استنتاج، نشان میدهد که مدل Granite 3.2 8B در این سری میتواند با عملکرد مدلهای بسیار بزرگتر در معیارهای استاندارد استدلال ریاضی مطابقت داشته باشد یا از آنها فراتر رود.
برخی از مدلها در Granite 3.2 همچنین شامل قابلیتهای زنجیره تفکر برای استدلال پیشرفته هستند، جایی که مراحل استدلال میانی روشن میشوند. به عنوان بخشی از تلاش آیبیام برای مقرونبهصرفهتر بودن، این ویژگی که نیاز به قدرت محاسباتی قابل توجهی دارد، میتواند در صورت عدم نیاز خاموش یا روشن شود تا کارایی بهینه شود و هزینههای کلی کاهش یابد.
معاون تحقیقات هوش مصنوعی آیبیام، سریرام راگاوان، معاون تحقیقات آیبیام در این اطلاعیه گفت: «عصر بعدی هوش مصنوعی در مورد کارایی، یکپارچگی و تأثیر دنیای واقعی است، جایی که شرکتها میتوانند بدون صرف هزینههای گزاف برای محاسبات به نتایج قدرتمندی دست یابند.»
او گفت: «آخرین تحولات Granite آیبیام بر روی راهحلهای باز متمرکز است و گام دیگری رو به جلو در دسترستر، مقرونبهصرفهتر و ارزشمندتر کردن هوش مصنوعی برای شرکتهای مدرن نشان میدهد.»
Granite همچنین گزینههای اندازه کاهش یافتهای را برای مدلهای ایمنی Granite Guardian ارائه میدهد که عملکرد نسخههای قبلی Granite 3.1 را با 30٪ کاهش حفظ میکند. علاوه بر این، قابلیتی که آیبیام آن را اطمینان کلامی مینامد، ارزیابی ریسک دقیقتری را ارائه میدهد که ابهام را در نظارت بر ایمنی تشخیص میدهد.
این مدل بهروزرسانیشده روی جعبهابزار منبع باز Docling آیبیام آموزش داده شده است که به توسعهدهندگان اجازه میدهد اسناد را به دادههای تخصصی برای سفارشیسازی مدلهای هوش مصنوعی سازمانی تبدیل کنند. این مدل 85 میلیون PDF و 26 میلیون جفت سؤال-پاسخ مصنوعی تولید شده را برای افزایش توانایی VLM در رسیدگی به گردشهای کاری پیچیده و سنگین سند پردازش کرد.
مدیر ارشد فناوری CrushBank، یک شریک که از توسعه آن پشتیبانی کرد، در این اطلاعیه گفت: «Granite 3.2 با قابلیتهای استدلال جدید آن را فراتر میبرد، و ما هیجانزده هستیم که آنها را در ساخت راهحلهای نمایندگی جدید کشف کنیم.»
همه مدلها تحت مجوز Apache 2.0 مجاز در Hugging Face در دسترس هستند و مدلهای انتخابی اکنون در IBM watsonx.ai، Ollama، Replicate و LM Studio در دسترس هستند و انتظار میرود به زودی در RHEL AI 1.5 در دسترس باشند.
آیبیام علاوه بر بهروزرسانی Granite، نسل بعدی مدلهای TinyTimeMixers (TTM) خود را نیز عرضه میکند، مدلهای فشرده از پیش آموزشدیده برای پیشبینی سریهای زمانی چندمتغیره، با قابلیتهایی از جمله پیشبینی بلندمدت تا دو سال آینده.