شروع به ساخت با Gemini 2.5 Flash
(
از طریق
) آخرین مدل گوگل Gemini، مدل Gemini 2.5 Flash است که به صورت پیشنمایش (پولی) با نام
gemini-2.5-flash-preview-04-17
در دسترس است.
این نسخه جدید که بر پایه محبوب 2.0 Flash ساخته شده است، ارتقاء قابل توجهی در قابلیتهای استدلال ارائه میدهد، در حالی که همچنان سرعت و هزینه را در اولویت قرار میدهد. Gemini 2.5 Flash اولین مدل استدلال کاملاً ترکیبی ما است که به توسعهدهندگان این امکان را میدهد که تفکر را روشن یا خاموش کنند. این مدل همچنین به توسعهدهندگان اجازه میدهد تا بودجههای تفکر را تنظیم کنند تا تعادل مناسب بین کیفیت، هزینه و تأخیر را پیدا کنند.
مدیر محصول Gemini AI Studio، لوگان کیلپاتریک میگوید :
این یک نسخه اولیه از 2.5 Flash است، اما در حال حاضر دستاوردهای بزرگی نسبت به 2.0 Flash نشان میدهد.
در صورت نیاز میتوانید تفکر را به طور کامل خاموش کنید و از این مدل به عنوان جایگزینی برای 2.0 Flash استفاده کنید.
من از مدل جدید در llm-gemini 0.18 پشتیبانی کردم. در اینجا نحوه امتحان کردن آن آمده است:
llm install -U llm-gemini
llm -m gemini-2.5-flash-preview-04-17 'یک SVG از یک پلیکان سوار بر دوچرخه تولید کنید'
در اینجا اولین پلیکان، با استفاده از تنظیمات پیشفرض که در آن Gemini Flash 2.5 تصمیم خود را در مورد میزان تلاش "تفکر" انجام میدهد، آورده شده است:
در اینجا رونوشت آن موجود است. این یکی از 11 توکن ورودی و 4266 توکن خروجی استفاده کرده است که 2702 توکن آن "تفکر" بوده است.
من از مدل خواستم آن تصویر را "توصیف" کند و توانست تشخیص دهد که یک پلیکان است:
یک تصویر ساده روی یک پسزمینه سفید یک پلیکان سبکپردازیشده را نشان میدهد که سوار بر دوچرخه است. پلیکان عمدتاً خاکستری با یک چشم سیاه و یک کیسه منقار صورتی برجسته است. روی یک دوچرخه با خطوط سیاه و دو چرخ، یک قاب، فرمان و پدال قرار دارد.
نحوه قیمتگذاری مدل کمی پیچیده است. اگر تفکر را فعال کرده باشید، برای هر میلیون توکن ورودی 0.15 دلار و برای هر میلیون توکن خروجی 3.50 دلار هزینه دریافت میکنید. با غیرفعال کردن تفکر، این توکنهای خروجی به 0.60 دلار در هر میلیون کاهش مییابد. من اینها را به ماشین حساب قیمتگذاری خود اضافه کردهام .
برای مقایسه، Gemini 2.0 Flash برای هر میلیون ورودی 0.10 دلار و برای هر میلیون خروجی 0.40 دلار است.
بنابراین اولین درخواست من - 11 ورودی و 4266 خروجی (با فعال بودن تفکر)، 1.4933 سنت هزینه داشت.
بیایید 2.5 Flash را دوباره با غیرفعال کردن تفکر امتحان کنیم:
llm -m gemini-2.5-flash-preview-04-17 'یک SVG از یک پلیکان سوار بر دوچرخه تولید کنید' -o thinking_budget 0
11 ورودی، 1705 خروجی. این 0.1025 سنت است. رونوشت اینجا - هنوز هم 25 توکن تفکر را نشان میدهد، حتی اگر بودجه تفکر را روی 0 تنظیم کرده باشم - لوگان تأیید میکند که این هنوز هم با نرخ پایینتر محاسبه میشود:
در برخی موارد نادر، مدل هنوز هم کمی فکر میکند، حتی با بودجه تفکر = 0، ما امیدواریم این را قبل از اینکه این مدل را پایدار کنیم، برطرف کنیم و برای تفکر هزینه دریافت نخواهید کرد. بودجه تفکر = 0 چیزی است که سوئیچ صورتحساب را فعال میکند.
در اینجا خودتوصیفی Gemini 2.5 Flash از آن تصویر آمده است:
یک تصویر مینیمالیستی یک پرنده زرد روشن را نشان میدهد که سوار بر دوچرخه است. این پرنده دارای یک بدن گرد ساده، بالهای کوچک، یک چشم سیاه و یک منقار نارنجی باز است. روی یک قاب دوچرخه سیاه ساده با دو چرخ سیاه دایرهای بزرگ قرار دارد. این دوچرخه همچنین دارای فرمان سیاه و پدالهای سیاه و زرد است. صحنه روی یک پسزمینه آبی روشن با یک نوار سبز ضخیم در امتداد پایین تنظیم شده است که چمن یا زمین را نشان میدهد.
و در نهایت، بیایید بودجه تفکر را به حداکثر برسانیم:
llm -m gemini-2.5-flash-preview-04-17 'یک SVG از یک پلیکان سوار بر دوچرخه تولید کنید' -o thinking_budget 24576
من فکر میکنم این یکی بیش از حد فکر کرده است. رونوشت - 5174 توکن خروجی که 3023 توکن آن تفکر بوده است. یک هزینه سنگین 1.8111 سنت!
یک نقاشی ساده به سبک کارتونی یک فیگور شبیه پرنده را نشان میدهد که سوار بر دوچرخه است. این فیگور دارای یک سر خاکستری گرد با یک چشم سیاه و یک منقار نارنجی بزرگ و صاف با یک نوار زرد در بالا است. بدن آن با یک شکل خاکستری روشن منحنی نشان داده میشود که از سر تا یک شکل خاکستری کوچکتر که نشان دهنده تنه یا عقب است، امتداد دارد. دارای پاهای چوبی نارنجی ساده با پاهای گرد یا اتصالات در پدالها است. این فیگور در یک موقعیت دوچرخهسواری به سمت جلو روی فرمان خم شده است. دوچرخه با خطوط سیاه ضخیم کشیده شده است و دارای دو چرخ بزرگ، یک قاب و پدالهای متصل به پاهای نارنجی است. پسزمینه سفید ساده است و یک خط خاکستری تیره در پایین نشاندهنده زمین است.
یکی از چیزهایی که من واقعاً در مورد رویکرد Gemini 2.5 Flash به SVG قدردانی میکنم این است که سلیقه بسیار خوبی در CSS، نظرات و ساختار کلی کلاس SVG نشان میدهد. در اینجا یک عصاره بریده شده وجود دارد - من بسیاری از این تستهای SVG را در برابر مدلهای مختلف اجرا میکنم و این یکی دارای سبک کدنویسی است که من به ویژه از آن لذت میبرم. (Gemini 2.5 Pro همین کار را میکند ).
تابلوی امتیازات LM Arena اکنون Gemini 2.5 Flash را در رتبه دوم مشترک ، درست پس از Gemini 2.5 Pro و برابر با ChatGPT-4o-latest، Grok-3 و GPT-4.5 Preview قرار داده است.