مدلهای هوش مصنوعی منتشر شده در سال ۲۰۲۵
OpenAI o3-mini
این آخرین مدل استدلالی OpenAI است و برای وظایف مرتبط با STEM مانند کدنویسی، ریاضیات و علوم بهینه شده است. این قویترین مدل OpenAI نیست، اما از آنجایی که کوچکتر است، شرکت میگوید هزینه آن به طور قابل توجهی کمتر است. به صورت رایگان در دسترس است، اما برای کاربران پرمصرف نیاز به اشتراک دارد.
OpenAI Deep Research
Deep Research اوپن ای آی برای انجام تحقیقات عمیق در مورد یک موضوع با استنادهای واضح طراحی شده است. این سرویس فقط با اشتراک ۲۰۰ دلار در ماه Pro ChatGPT در دسترس است. OpenAI آن را برای همه چیز از علم گرفته تا تحقیقات خرید توصیه میکند، اما مراقب باشید که توهمات همچنان یک مشکل برای هوش مصنوعی است.
Mistral Le Chat
Mistral نسخههای اپلیکیشنی Le Chat، یک دستیار شخصی هوش مصنوعی چندوجهی را منتشر کرده است. Mistral ادعا میکند که Le Chat سریعتر از هر چتبات دیگری پاسخ میدهد. همچنین دارای یک نسخه پولی با روزنامهنگاری بهروز از AFP است. آزمایشهای Le Monde عملکرد Le Chat را چشمگیر نشان داد، اگرچه اشتباهات بیشتری نسبت به ChatGPT داشت.
OpenAI Operator
اپراتور OpenAI به این معناست که یک کارآموز شخصی باشد که میتواند کارهایی را به طور مستقل انجام دهد، مانند کمک به شما در خرید مواد غذایی. این نیاز به اشتراک ChatGPT pro با قیمت ۲۰۰ دلار در ماه دارد. عوامل هوش مصنوعی نویدهای زیادی دارند، اما هنوز آزمایشی هستند: یک بازبین واشنگتن پست میگوید که اپراتور به تنهایی تصمیم گرفت یک دوجین تخممرغ به قیمت ۳۱ دلار سفارش دهد و با کارت اعتباری بازبین پرداخت کرد.
Google Gemini 2.0 Pro Experimental
مدل شاخص مورد انتظار Google Gemini میگوید که در کدنویسی و درک دانش عمومی عالی است. همچنین دارای یک پنجره زمینه فوقالعاده طولانی ۲ میلیون توکنی است که به کاربرانی که نیاز به پردازش سریع تکههای بزرگ متن دارند، کمک میکند. این سرویس (حداقل) به اشتراک Google One AI Premium به قیمت ۱۹.۹۹ دلار در ماه نیاز دارد.
مدلهای هوش مصنوعی منتشر شده در سال ۲۰۲۴
DeepSeek R1
این مدل هوش مصنوعی چینی دره سیلیکون را طوفانی کرد. R1 DeepSeek در کدنویسی و ریاضیات عملکرد خوبی دارد، در حالی که ماهیت متنباز آن به این معنی است که هر کسی میتواند آن را به صورت محلی اجرا کند. به علاوه، رایگان است. با این حال, R1 سانسور دولت چین را ادغام میکند و با ممنوعیتهای فزایندهای به دلیل احتمال ارسال دادههای کاربر به چین مواجه است.
Gemini Deep Research
Deep Research نتایج جستجوی گوگل را در یک سند ساده و مستند خلاصه میکند. برای دانشآموزان و هر کس دیگری که به یک خلاصه تحقیق سریع نیاز دارد مفید است. با این حال، کیفیت آن به خوبی یک مقاله بررسیشده توسط همتایان نیست. Deep Research به اشتراک Google One AI Premium به قیمت ۱۹.۹۹ دلار نیاز دارد.
Meta Llama 3.3 7B
این جدیدترین و پیشرفتهترین نسخه از مدلهای هوش مصنوعی Llama منبع باز متا است. متا این نسخه را به عنوان ارزانترین و کارآمدترین نسخه خود تا به امروز، بهویژه برای ریاضیات، دانش عمومی و پیروی از دستورالعملها معرفی کرده است. رایگان و منبع باز است.
OpenAI Sora
Sora مدلی است که ویدیوهای واقعی را بر اساس متن ایجاد میکند. در حالی که میتواند صحنههای کامل را به جای فقط کلیپ ایجاد کند، OpenAI اذعان میکند که اغلب «فیزیک غیرواقعی» تولید میکند. در حال حاضر فقط در نسخههای پولی ChatGPT، با شروع از Plus که ۲۰ دلار در ماه است، در دسترس است.
Alibaba Qwen QwQ-32B-Preview
این مدل یکی از معدود مدلهایی است که با o1 OpenAI در برخی از معیارهای صنعت رقابت میکند و در ریاضیات و کدنویسی برتری دارد. به طرز عجیبی برای یک «مدل استدلالی»، «جایی برای بهبود در استدلال عقل سلیم» دارد, Alibaba میگوید. آزمایشهای تککرانچ نشان میدهد که سانسور دولت چین را نیز در خود جای داده است. رایگان و منبع باز است.
Anthropic’s Computer Use
هدف استفاده از کامپیوتر Claude کنترل رایانه شما برای انجام وظایفی مانند کدنویسی یا رزرو بلیط هواپیما است و آن را به پیشساز اپراتور OpenAI تبدیل میکند. با این حال، استفاده از رایانه هنوز در مرحله بتا است. قیمتگذاری از طریق API است: ۰.۸۰ دلار به ازای هر میلیون توکن ورودی و ۴ دلار به ازای هر میلیون توکن خروجی.
x.AI’s Grok 2
x.AI، شرکت هوش مصنوعی متعلق به ایلان ماسک، یک نسخه پیشرفته از چتبات Grok 2 شاخص خود را راهاندازی کرده است که ادعا میکند «سه برابر سریعتر است». کاربران رایگان به ۱۰ سؤال در هر دو ساعت در Grok محدود میشوند، در حالی که مشترکین طرحهای Premium و Premium+ X از محدودیتهای استفاده بالاتری برخوردار هستند. x.AI همچنین یک تولیدکننده تصویر، Aurora را راهاندازی کرد که تصاویر بسیار واقعی، از جمله برخی محتوای گرافیکی یا خشونتآمیز تولید میکند.
OpenAI o1
خانواده o1 OpenAI قرار است با «فکر کردن» از طریق پاسخها از طریق یک ویژگی استدلالی پنهان، پاسخهای بهتری تولید کند. OpenAI ادعا میکند که این مدل در کدنویسی، ریاضیات و ایمنی برتری دارد، اما در فریب دادن انسانها نیز مشکلاتی دارد. O1 نیاز به اشتراک در ChatGPT Plus دارد که ۲۰ دلار در ماه است.
Anthropic’s Claude Sonnet 3.5
Claude Sonnet 3.5 مدلی است که Anthropic ادعا میکند بهترین در کلاس خود است. به دلیل قابلیتهای کدنویسی خود شناخته شده است و به عنوان چتبات منتخب افراد داخلی فناوری در نظر گرفته میشود. این مدل را میتوان به صورت رایگان در Claude به دست آورد، اگرچه کاربران پرمصرف به اشتراک Pro ماهانه ۲۰ دلاری نیاز دارند. در حالی که میتواند تصاویر را درک کند، نمیتواند آنها را تولید کند.
OpenAI GPT 4o-mini
OpenAI GPT 4o-mini را به دلیل اندازه کوچکش به عنوان مقرونبهصرفهترین و سریعترین مدل خود تا به امروز معرفی کرده است. این مدل قرار است طیف گستردهای از وظایف مانند پشتیبانی از چتباتهای خدمات مشتری را فعال کند. این مدل در سطح رایگان ChatGPT در دسترس است. در مقایسه با وظایف پیچیدهتر، برای وظایف ساده با حجم بالا مناسبتر است.
Cohere Command R+
مدل Command R+ Cohere در برنامههای پیچیده تولید افزوده بازیابی (یا RAG) برای شرکتها عالی است. این بدان معناست که میتواند قطعات خاصی از اطلاعات را به خوبی پیدا کرده و به آن استناد کند. (مخترع RAG در واقع در Cohere کار میکند.) با این حال، RAG مشکل توهم هوش مصنوعی را به طور کامل حل نمیکند.