تصاویر گتی
تصاویر گتی

آی‌بی‌ام مدل هوش مصنوعی کوچکتر با استدلال بهبود یافته را عرضه کرد

کاربردهای جدید در Granite 3.2 شامل یک مدل زبان بصری برای پردازش اسناد، طبقه‌بندی و استخراج داده‌ها است

آی‌بی‌ام نسل بعدی خانواده مدل‌های زبانی بزرگ Granite خود، Granite 3.2 را عرضه کرده است که به گفته این شرکت، هوش مصنوعی چندمدلی و استدلالی و همچنین ویژگی‌های انعطاف‌پذیری برای بهبود بهره‌وری هزینه را ارائه می‌دهد.

این مدل به‌روزرسانی شده بخشی از هدف آی‌بی‌ام برای ارائه "هوش مصنوعی سازمانی کوچک، کارآمد و کاربردی" برای کسب‌وکارها و جامعه منبع باز است که به گفته این شرکت، پذیرش آن آسان‌تر و مقرون‌به‌صرفه‌تر است.

کاربردهای جدید در Granite 3.2 شامل یک مدل زبان بصری برای پردازش اسناد، طبقه‌بندی و استخراج داده‌ها است. به گفته آی‌بی‌ام، VLM با مدل‌های بسیار بزرگتر مانند Llama 3.2 11B و Pixtral 12B در برابر معیارهای اساسی مطابقت دارد یا از آنها فراتر می‌رود.

علاوه بر این، آی‌بی‌ام گفت که سایر تکنیک‌های استدلال در این ارتقا، مانند مقیاس‌بندی استنتاج، نشان می‌دهد که مدل Granite 3.2 8B در این سری می‌تواند با عملکرد مدل‌های بسیار بزرگتر در معیارهای استاندارد استدلال ریاضی مطابقت داشته باشد یا از آنها فراتر رود.

برخی از مدل‌ها در Granite 3.2 همچنین شامل قابلیت‌های زنجیره تفکر برای استدلال پیشرفته هستند، جایی که مراحل استدلال میانی روشن می‌شوند. به عنوان بخشی از تلاش آی‌بی‌ام برای مقرون‌به‌صرفه‌تر بودن، این ویژگی که نیاز به قدرت محاسباتی قابل توجهی دارد، می‌تواند در صورت عدم نیاز خاموش یا روشن شود تا کارایی بهینه شود و هزینه‌های کلی کاهش یابد.

معاون تحقیقات هوش مصنوعی آی‌بی‌ام، سریرام راگاوان، معاون تحقیقات آی‌بی‌ام در این اطلاعیه گفت: «عصر بعدی هوش مصنوعی در مورد کارایی، یکپارچگی و تأثیر دنیای واقعی است، جایی که شرکت‌ها می‌توانند بدون صرف هزینه‌های گزاف برای محاسبات به نتایج قدرتمندی دست یابند.»

او گفت: «آخرین تحولات Granite آی‌بی‌ام بر روی راه‌حل‌های باز متمرکز است و گام دیگری رو به جلو در دسترس‌تر، مقرون‌به‌صرفه‌تر و ارزشمندتر کردن هوش مصنوعی برای شرکت‌های مدرن نشان می‌دهد.»

Granite همچنین گزینه‌های اندازه کاهش یافته‌ای را برای مدل‌های ایمنی Granite Guardian ارائه می‌دهد که عملکرد نسخه‌های قبلی Granite 3.1 را با 30٪ کاهش حفظ می‌کند. علاوه بر این، قابلیتی که آی‌بی‌ام آن را اطمینان کلامی می‌نامد، ارزیابی ریسک دقیق‌تری را ارائه می‌دهد که ابهام را در نظارت بر ایمنی تشخیص می‌دهد.

این مدل به‌روزرسانی‌شده روی جعبه‌ابزار منبع باز Docling آی‌بی‌ام آموزش داده شده است که به توسعه‌دهندگان اجازه می‌دهد اسناد را به داده‌های تخصصی برای سفارشی‌سازی مدل‌های هوش مصنوعی سازمانی تبدیل کنند. این مدل 85 میلیون PDF و 26 میلیون جفت سؤال-پاسخ مصنوعی تولید شده را برای افزایش توانایی VLM در رسیدگی به گردش‌های کاری پیچیده و سنگین سند پردازش کرد.

مدیر ارشد فناوری CrushBank، یک شریک که از توسعه آن پشتیبانی کرد، در این اطلاعیه گفت: «Granite 3.2 با قابلیت‌های استدلال جدید آن را فراتر می‌برد، و ما هیجان‌زده هستیم که آنها را در ساخت راه‌حل‌های نمایندگی جدید کشف کنیم.»

همه مدل‌ها تحت مجوز Apache 2.0 مجاز در Hugging Face در دسترس هستند و مدل‌های انتخابی اکنون در IBM watsonx.ai، Ollama، Replicate و LM Studio در دسترس هستند و انتظار می‌رود به زودی در RHEL AI 1.5 در دسترس باشند.

آی‌بی‌ام علاوه بر به‌روزرسانی Granite، نسل بعدی مدل‌های TinyTimeMixers (TTM) خود را نیز عرضه می‌کند، مدل‌های فشرده از پیش آموزش‌دیده برای پیش‌بینی سری‌های زمانی چندمتغیره، با قابلیت‌هایی از جمله پیش‌بینی بلندمدت تا دو سال آینده.