سری Falcon 3 معیارهای جدیدی برای LLMهای متن‌باز بر روی یک GPU تعیین می‌کند

Falcon 3 Image — تصویر: موسسه نوآوری فناوری

موسسه نوآوری فناوری ابوظبی (TII) سری Falcon 3 را منتشر کرده است که معیارهای عملکرد جدیدی برای سیستم‌های هوش مصنوعی که بر روی سخت‌افزار مصرف‌کننده اجرا می‌شوند، تعیین می‌کند.

سری جدید Falcon 3 بر روی ۱۴ تریلیون توکن آموزش دیده است - بیش از دو برابر ۵.۵ تریلیون توکن که برای آموزش نسخه قبلی، Falcon 2، استفاده شده بود. TII می‌گوید داده‌های آموزشی گسترده‌تر به Falcon 3 کمک کرده است تا عملکرد پیشرو در چندین معیار، به ویژه در میان مدل‌هایی که برای اجرا بر روی یک GPU طراحی شده‌اند، به دست آورد.

در معیارهای کلیدی، Falcon 3 مدل‌های رقیب با اندازه مشابه از Mistral، Alibaba، Meta و Google را شکست می‌دهد. در زمان راه‌اندازی، مدل در رتبه‌بندی مدل‌های زبان شخص ثالث Hugging Face به بالاترین جایگاه دست یافت و از دیگر مدل‌های متن‌باز از جمله Meta's Llama-3.1-8B، Qwen2.5-7B، Mistral's NeMo-12B و Google's Gemma2-9B پیشی گرفت.

Benchmark Comparison — مقایسه معیار: موسسه نوآوری فناوری

مدل‌های مختلف برای نیازهای مختلف

این سری شامل چهار اندازه مدل مختلف است: Falcon-3-1B، -3B، -7B و -10B. هر مدل در یک نسخه پایه برای وظایف عمومی و یک نسخه Instruct برای برنامه‌های مکالمه‌ای در دسترس است.

در حالی که TII نسخه‌های تخصصی برای زبان‌های انگلیسی، فرانسوی، اسپانیایی و پرتغالی ارائه می‌دهد، همه مدل‌ها می‌توانند اکثر زبان‌های رایج را مدیریت کنند.

موسسه مدل‌ها را برای یکپارچه‌سازی آسان طراحی کرده است و آنها را با APIها و کتابخانه‌های استاندارد سازگار کرده است. برای تنظیمات سخت‌افزاری تخصصی، TII نسخه‌های کم‌مصرف و کم‌حجم نیز ارائه می‌دهد.

قابلیت‌های چندرسانه‌ای در سال ۲۰۲۵

اوایل سال ۲۰۲۵، TII قصد دارد سری Falcon 3 را با مدل‌هایی که بر قابلیت‌های چندرسانه‌ای، از جمله پردازش تصویر، ویدئو و صدا تمرکز دارند، گسترش دهد. در حال حاضر، همه مدل‌های فعلی برای دانلود در Hugging Face در دسترس هستند و جزئیات کامل معیارها در وب‌سایت رسمی TII موجود است.

موسسه همچنین یک چت‌بات رایگان منتشر کرده است که کاربران، توسعه‌دهندگان و محققان می‌توانند مدل‌های مختلف را امتحان کنند و بازخورد ارائه دهند. از نظر طراحی، TII به وضوح از ChatGPT الهام گرفته است و ویژگی‌های مشابهی مانند پوشه‌های پروژه و آثار را پیاده‌سازی کرده است.

مدل‌ها تحت مجوز TII Falcon، یک مجوز متن‌باز بر اساس Apache 2.0 با دستورالعمل‌هایی برای ترویج استفاده مسئولانه از هوش مصنوعی، مجوز دارند.

Falcon Chatbot — تصویر: اسکرین‌شات توسط THE DECODER