تصویر تولید شده توسط Gemini 2.5 Flash: پلیکان سوار بر دوچرخه
تصویر تولید شده توسط Gemini 2.5 Flash: پلیکان سوار بر دوچرخه

Gemini 2.5 Flash: یک مدل زبانی جدید از گوگل

یک پلیکان سوار بر دوچرخه با غیرفعال بودن تفکر
تصویر تولید شده توسط Gemini 2.5 Flash با غیرفعال بودن تفکر: پلیکان سوار بر دوچرخه
یک پلیکان سوار بر دوچرخه با حداکثر بودجه تفکر
تصویر تولید شده توسط Gemini 2.5 Flash با حداکثر بودجه تفکر: پلیکان سوار بر دوچرخه
تصویر صفحه نمایش یک جدول که رتبه بندی مدل هوش مصنوعی را از LM Arena نشان می دهد
تصویر صفحه نمایش یک جدول که رتبه‌بندی مدل هوش مصنوعی را از LM Arena نشان می‌دهد.

شروع به ساخت با Gemini 2.5 Flash ( از طریق ) آخرین مدل گوگل Gemini، مدل Gemini 2.5 Flash است که به صورت پیش‌نمایش (پولی) با نام gemini-2.5-flash-preview-04-17 در دسترس است.

این نسخه جدید که بر پایه محبوب 2.0 Flash ساخته شده است، ارتقاء قابل توجهی در قابلیت‌های استدلال ارائه می‌دهد، در حالی که همچنان سرعت و هزینه را در اولویت قرار می‌دهد. Gemini 2.5 Flash اولین مدل استدلال کاملاً ترکیبی ما است که به توسعه‌دهندگان این امکان را می‌دهد که تفکر را روشن یا خاموش کنند. این مدل همچنین به توسعه‌دهندگان اجازه می‌دهد تا بودجه‌های تفکر را تنظیم کنند تا تعادل مناسب بین کیفیت، هزینه و تأخیر را پیدا کنند.

مدیر محصول Gemini AI Studio، لوگان کیلپاتریک می‌گوید :

این یک نسخه اولیه از 2.5 Flash است، اما در حال حاضر دستاوردهای بزرگی نسبت به 2.0 Flash نشان می‌دهد.

در صورت نیاز می‌توانید تفکر را به طور کامل خاموش کنید و از این مدل به عنوان جایگزینی برای 2.0 Flash استفاده کنید.

من از مدل جدید در llm-gemini 0.18 پشتیبانی کردم. در اینجا نحوه امتحان کردن آن آمده است:

llm install -U llm-gemini
llm -m gemini-2.5-flash-preview-04-17 'یک SVG از یک پلیکان سوار بر دوچرخه تولید کنید'

در اینجا اولین پلیکان، با استفاده از تنظیمات پیش‌فرض که در آن Gemini Flash 2.5 تصمیم خود را در مورد میزان تلاش "تفکر" انجام می‌دهد، آورده شده است:

در اینجا رونوشت آن موجود است. این یکی از 11 توکن ورودی و 4266 توکن خروجی استفاده کرده است که 2702 توکن آن "تفکر" بوده است.

من از مدل خواستم آن تصویر را "توصیف" کند و توانست تشخیص دهد که یک پلیکان است:

یک تصویر ساده روی یک پس‌زمینه سفید یک پلیکان سبک‌پردازی‌شده را نشان می‌دهد که سوار بر دوچرخه است. پلیکان عمدتاً خاکستری با یک چشم سیاه و یک کیسه منقار صورتی برجسته است. روی یک دوچرخه با خطوط سیاه و دو چرخ، یک قاب، فرمان و پدال قرار دارد.

نحوه قیمت‌گذاری مدل کمی پیچیده است. اگر تفکر را فعال کرده باشید، برای هر میلیون توکن ورودی 0.15 دلار و برای هر میلیون توکن خروجی 3.50 دلار هزینه دریافت می‌کنید. با غیرفعال کردن تفکر، این توکن‌های خروجی به 0.60 دلار در هر میلیون کاهش می‌یابد. من اینها را به ماشین حساب قیمت‌گذاری خود اضافه کرده‌ام .

برای مقایسه، Gemini 2.0 Flash برای هر میلیون ورودی 0.10 دلار و برای هر میلیون خروجی 0.40 دلار است.

بنابراین اولین درخواست من - 11 ورودی و 4266 خروجی (با فعال بودن تفکر)، 1.4933 سنت هزینه داشت.

بیایید 2.5 Flash را دوباره با غیرفعال کردن تفکر امتحان کنیم:

llm -m gemini-2.5-flash-preview-04-17 'یک SVG از یک پلیکان سوار بر دوچرخه تولید کنید' -o thinking_budget 0

11 ورودی، 1705 خروجی. این 0.1025 سنت است. رونوشت اینجا - هنوز هم 25 توکن تفکر را نشان می‌دهد، حتی اگر بودجه تفکر را روی 0 تنظیم کرده باشم - لوگان تأیید می‌کند که این هنوز هم با نرخ پایین‌تر محاسبه می‌شود:

در برخی موارد نادر، مدل هنوز هم کمی فکر می‌کند، حتی با بودجه تفکر = 0، ما امیدواریم این را قبل از اینکه این مدل را پایدار کنیم، برطرف کنیم و برای تفکر هزینه دریافت نخواهید کرد. بودجه تفکر = 0 چیزی است که سوئیچ صورتحساب را فعال می‌کند.

در اینجا خودتوصیفی Gemini 2.5 Flash از آن تصویر آمده است:

یک تصویر مینیمالیستی یک پرنده زرد روشن را نشان می‌دهد که سوار بر دوچرخه است. این پرنده دارای یک بدن گرد ساده، بال‌های کوچک، یک چشم سیاه و یک منقار نارنجی باز است. روی یک قاب دوچرخه سیاه ساده با دو چرخ سیاه دایره‌ای بزرگ قرار دارد. این دوچرخه همچنین دارای فرمان سیاه و پدال‌های سیاه و زرد است. صحنه روی یک پس‌زمینه آبی روشن با یک نوار سبز ضخیم در امتداد پایین تنظیم شده است که چمن یا زمین را نشان می‌دهد.

و در نهایت، بیایید بودجه تفکر را به حداکثر برسانیم:

llm -m gemini-2.5-flash-preview-04-17 'یک SVG از یک پلیکان سوار بر دوچرخه تولید کنید' -o thinking_budget 24576

من فکر می‌کنم این یکی بیش از حد فکر کرده است. رونوشت - 5174 توکن خروجی که 3023 توکن آن تفکر بوده است. یک هزینه سنگین 1.8111 سنت!

یک نقاشی ساده به سبک کارتونی یک فیگور شبیه پرنده را نشان می‌دهد که سوار بر دوچرخه است. این فیگور دارای یک سر خاکستری گرد با یک چشم سیاه و یک منقار نارنجی بزرگ و صاف با یک نوار زرد در بالا است. بدن آن با یک شکل خاکستری روشن منحنی نشان داده می‌شود که از سر تا یک شکل خاکستری کوچکتر که نشان دهنده تنه یا عقب است، امتداد دارد. دارای پاهای چوبی نارنجی ساده با پاهای گرد یا اتصالات در پدال‌ها است. این فیگور در یک موقعیت دوچرخه‌سواری به سمت جلو روی فرمان خم شده است. دوچرخه با خطوط سیاه ضخیم کشیده شده است و دارای دو چرخ بزرگ، یک قاب و پدال‌های متصل به پاهای نارنجی است. پس‌زمینه سفید ساده است و یک خط خاکستری تیره در پایین نشان‌دهنده زمین است.

یکی از چیزهایی که من واقعاً در مورد رویکرد Gemini 2.5 Flash به SVG قدردانی می‌کنم این است که سلیقه بسیار خوبی در CSS، نظرات و ساختار کلی کلاس SVG نشان می‌دهد. در اینجا یک عصاره بریده شده وجود دارد - من بسیاری از این تست‌های SVG را در برابر مدل‌های مختلف اجرا می‌کنم و این یکی دارای سبک کدنویسی است که من به ویژه از آن لذت می‌برم. (Gemini 2.5 Pro همین کار را می‌کند ).

تابلوی امتیازات LM Arena اکنون Gemini 2.5 Flash را در رتبه دوم مشترک ، درست پس از Gemini 2.5 Pro و برابر با ChatGPT-4o-latest، Grok-3 و GPT-4.5 Preview قرار داده است.