مدل جدید Gemini هوش مصنوعی گوگل بر کارایی تمرکز دارد

گوگل در حال انتشار یک مدل هوش مصنوعی جدید است که برای ارائه عملکرد قوی با تمرکز بر کارایی طراحی شده است.

این مدل، Gemini 2.5 Flash، به زودی در Vertex AI، پلتفرم توسعه هوش مصنوعی گوگل، راه‌اندازی خواهد شد. این شرکت می‌گوید که این مدل محاسبات "پویا و قابل کنترل" را ارائه می‌دهد و به توسعه‌دهندگان اجازه می‌دهد زمان پردازش را بر اساس پیچیدگی پرسش‌ها تنظیم کنند.

گوگل در یک پست وبلاگی که در اختیار تک‌کرانچ قرار داد، نوشت: «[شما می‌توانید] سرعت، دقت و تعادل هزینه را برای نیازهای خاص خود تنظیم کنید. این انعطاف‌پذیری کلید بهینه‌سازی عملکرد Flash در برنامه‌های پرحجم و حساس به هزینه است.»

Gemini 2.5 Flash در حالی عرضه می‌شود که هزینه مدل‌های هوش مصنوعی شاخص همچنان روند صعودی دارد. مدل‌های ارزان‌تر و با عملکرد بالا مانند 2.5 Flash، جایگزین جذابی برای گزینه‌های گران‌قیمت و درجه یک با هزینه کاهش اندکی در دقت هستند.

Gemini 2.5 Flash یک مدل "استدلال" در راستای o3-mini اوپن‌ای‌آی و R1 دیپ‌سیک است. این بدان معناست که پاسخ دادن به سؤالات کمی بیشتر طول می‌کشد تا خود را بررسی کند.

گوگل می‌گوید که 2.5 Flash برای برنامه‌های "پر حجم" و "بلادرنگ" مانند خدمات مشتری و تجزیه اسناد ایده‌آل است.

گوگل در پست وبلاگ خود گفت: «این مدل سخت‌کوش به‌طور خاص برای تأخیر کم و کاهش هزینه بهینه شده است. این موتور ایده‌آل برای دستیارهای مجازی پاسخگو و ابزارهای خلاصه‌سازی بی‌درنگ است، جایی که کارایی در مقیاس کلیدی است.»

گوگل گزارش ایمنی یا فنی برای Gemini 2.5 Flash منتشر نکرد، که دیدن نقاط قوت و ضعف مدل را چالش‌برانگیزتر می‌کند. این شرکت قبلاً به تک‌کرانچ گفته بود که برای مدل‌هایی که آن‌ها را "تجربی" می‌داند، گزارش منتشر نمی‌کند.

گوگل همچنین روز چهارشنبه اعلام کرد که قصد دارد مدل‌های Gemini مانند 2.5 Flash را از سه‌ماهه سوم سال جاری به محیط‌های داخل سازمانی بیاورد. مدل‌های Gemini این شرکت در Google Distributed Cloud (GDC)، راهکار داخل سازمانی گوگل برای مشتریانی با الزامات سختگیرانه حاکمیت داده، در دسترس خواهند بود. گوگل می‌گوید که با Nvidia همکاری می‌کند تا مدل‌های Gemini را به سیستم‌های Nvidia Blackwell سازگار با GDC بیاورد که مشتریان می‌توانند از طریق گوگل یا کانال‌های ترجیحی خود خریداری کنند.

این گزارش ترجمه و بازنویسی خبری با موتور هوش مصنوعی افق آبی است و برای خوانندهٔ فارسی‌زبان بازتنظیم شده. منبع اصلی: techcrunch