گوگل در حال انتشار یک مدل هوش مصنوعی جدید است که برای ارائه عملکرد قوی با تمرکز بر کارایی طراحی شده است.
این مدل، Gemini 2.5 Flash، به زودی در Vertex AI، پلتفرم توسعه هوش مصنوعی گوگل، راهاندازی خواهد شد. این شرکت میگوید که این مدل محاسبات "پویا و قابل کنترل" را ارائه میدهد و به توسعهدهندگان اجازه میدهد زمان پردازش را بر اساس پیچیدگی پرسشها تنظیم کنند.
گوگل در یک پست وبلاگی که در اختیار تککرانچ قرار داد، نوشت: «[شما میتوانید] سرعت، دقت و تعادل هزینه را برای نیازهای خاص خود تنظیم کنید. این انعطافپذیری کلید بهینهسازی عملکرد Flash در برنامههای پرحجم و حساس به هزینه است.»
Gemini 2.5 Flash در حالی عرضه میشود که هزینه مدلهای هوش مصنوعی شاخص همچنان روند صعودی دارد. مدلهای ارزانتر و با عملکرد بالا مانند 2.5 Flash، جایگزین جذابی برای گزینههای گرانقیمت و درجه یک با هزینه کاهش اندکی در دقت هستند.
Gemini 2.5 Flash یک مدل "استدلال" در راستای o3-mini اوپنایآی و R1 دیپسیک است. این بدان معناست که پاسخ دادن به سؤالات کمی بیشتر طول میکشد تا خود را بررسی کند.
گوگل میگوید که 2.5 Flash برای برنامههای "پر حجم" و "بلادرنگ" مانند خدمات مشتری و تجزیه اسناد ایدهآل است.
گوگل در پست وبلاگ خود گفت: «این مدل سختکوش بهطور خاص برای تأخیر کم و کاهش هزینه بهینه شده است. این موتور ایدهآل برای دستیارهای مجازی پاسخگو و ابزارهای خلاصهسازی بیدرنگ است، جایی که کارایی در مقیاس کلیدی است.»
گوگل گزارش ایمنی یا فنی برای Gemini 2.5 Flash منتشر نکرد، که دیدن نقاط قوت و ضعف مدل را چالشبرانگیزتر میکند. این شرکت قبلاً به تککرانچ گفته بود که برای مدلهایی که آنها را "تجربی" میداند، گزارش منتشر نمیکند.
گوگل همچنین روز چهارشنبه اعلام کرد که قصد دارد مدلهای Gemini مانند 2.5 Flash را از سهماهه سوم سال جاری به محیطهای داخل سازمانی بیاورد. مدلهای Gemini این شرکت در Google Distributed Cloud (GDC)، راهکار داخل سازمانی گوگل برای مشتریانی با الزامات سختگیرانه حاکمیت داده، در دسترس خواهند بود. گوگل میگوید که با Nvidia همکاری میکند تا مدلهای Gemini را به سیستمهای Nvidia Blackwell سازگار با GDC بیاورد که مشتریان میتوانند از طریق گوگل یا کانالهای ترجیحی خود خریداری کنند.