سری Falcon 3 معیارهای جدیدی برای LLMهای متنباز بر روی یک GPU تعیین میکند
نویسنده: Jonathan Kemper
موسسه نوآوری فناوری ابوظبی (TII) سری Falcon 3 را منتشر کرده است که معیارهای عملکرد جدیدی برای سیستمهای هوش مصنوعی که بر روی سختافزار مصرفکننده اجرا میشوند، تعیین میکند.
سری جدید Falcon 3 بر روی ۱۴ تریلیون توکن آموزش دیده است - بیش از دو برابر ۵.۵ تریلیون توکن که برای آموزش نسخه قبلی، Falcon 2، استفاده شده بود. TII میگوید دادههای آموزشی گستردهتر به Falcon 3 کمک کرده است تا عملکرد پیشرو در چندین معیار، به ویژه در میان مدلهایی که برای اجرا بر روی یک GPU طراحی شدهاند، به دست آورد.
در معیارهای کلیدی، Falcon 3 مدلهای رقیب با اندازه مشابه از Mistral، Alibaba، Meta و Google را شکست میدهد. در زمان راهاندازی، مدل در رتبهبندی مدلهای زبان شخص ثالث Hugging Face به بالاترین جایگاه دست یافت و از دیگر مدلهای متنباز از جمله Meta's Llama-3.1-8B، Qwen2.5-7B، Mistral's NeMo-12B و Google's Gemma2-9B پیشی گرفت.
مدلهای مختلف برای نیازهای مختلف
این سری شامل چهار اندازه مدل مختلف است: Falcon-3-1B، -3B، -7B و -10B. هر مدل در یک نسخه پایه برای وظایف عمومی و یک نسخه Instruct برای برنامههای مکالمهای در دسترس است.
در حالی که TII نسخههای تخصصی برای زبانهای انگلیسی، فرانسوی، اسپانیایی و پرتغالی ارائه میدهد، همه مدلها میتوانند اکثر زبانهای رایج را مدیریت کنند.
موسسه مدلها را برای یکپارچهسازی آسان طراحی کرده است و آنها را با APIها و کتابخانههای استاندارد سازگار کرده است. برای تنظیمات سختافزاری تخصصی، TII نسخههای کممصرف و کمحجم نیز ارائه میدهد.
قابلیتهای چندرسانهای در سال ۲۰۲۵
اوایل سال ۲۰۲۵، TII قصد دارد سری Falcon 3 را با مدلهایی که بر قابلیتهای چندرسانهای، از جمله پردازش تصویر، ویدئو و صدا تمرکز دارند، گسترش دهد. در حال حاضر، همه مدلهای فعلی برای دانلود در Hugging Face در دسترس هستند و جزئیات کامل معیارها در وبسایت رسمی TII موجود است.
موسسه همچنین یک چتبات رایگان منتشر کرده است که کاربران، توسعهدهندگان و محققان میتوانند مدلهای مختلف را امتحان کنند و بازخورد ارائه دهند. از نظر طراحی، TII به وضوح از ChatGPT الهام گرفته است و ویژگیهای مشابهی مانند پوشههای پروژه و آثار را پیادهسازی کرده است.
مدلها تحت مجوز TII Falcon، یک مجوز متنباز بر اساس Apache 2.0 با دستورالعملهایی برای ترویج استفاده مسئولانه از هوش مصنوعی، مجوز دارند.