تصویر: VentureBeat با Midjourney ساخته شده است
تصویر: VentureBeat با Midjourney ساخته شده است

مدل جدید هوش مصنوعی Contextual.ai، GPT-4o را در دقت شکست می‌دهد—چرا این موضوع مهم است

Contextual AI امروز از مدل زبانی مبتنی بر واقعیت (GLM) خود رونمایی کرد و ادعا می‌کند که با پیشی گرفتن از سیستم‌های هوش مصنوعی پیشرو از گوگل، آنتروپیک و OpenAI در یک معیار کلیدی برای صحت، بالاترین دقت واقعی را در صنعت ارائه می‌دهد.

این استارتاپ که توسط پیشگامان فناوری تولید تقویت‌شده با بازیابی (RAG) تأسیس شده است، گزارش داد که GLM آن در معیار FACTS به امتیاز واقعی بودن 88٪ دست یافته است، در حالی که Gemini 2.0 Flash گوگل 84.6٪، Claude 3.5 Sonnet آنتروپیک 79.4٪ و GPT-4o OpenAI 78.8٪ امتیاز کسب کرده‌اند.

در حالی که مدل‌های زبانی بزرگ نرم‌افزارهای سازمانی را متحول کرده‌اند، نادرستی‌های واقعی—که اغلب توهم نامیده می‌شوند—به عنوان یک چالش اساسی برای پذیرش کسب‌وکار باقی مانده‌اند. Contextual AI قصد دارد با ایجاد مدلی که به‌طور خاص برای برنامه‌های RAG سازمانی بهینه شده است و در آن دقت از اهمیت بالایی برخوردار است، این مشکل را حل کند.

Douwe Kiela، مدیرعامل و یکی از بنیانگذاران Contextual AI، در مصاحبه‌ای اختصاصی با VentureBeat گفت: "ما می‌دانستیم که بخشی از راه‌حل تکنیکی به نام RAG—بازیابی، تولید تقویت‌شده—خواهد بود. و ما این را می‌دانستیم زیرا RAG در اصل ایده من است. هدف این شرکت واقعاً انجام RAG به روش صحیح است، تا نوعی سطح بعدی انجام RAG را داشته باشیم."

تمرکز این شرکت به طور قابل توجهی با مدل‌های همه‌منظوره مانند ChatGPT یا Claude متفاوت است که برای رسیدگی به همه چیز از نوشتن خلاقانه گرفته تا مستندات فنی طراحی شده‌اند. در عوض، Contextual AI محیط‌های سازمانی پرمخاطره‌ای را هدف قرار می‌دهد که در آن دقت واقعی بر انعطاف‌پذیری خلاقانه ارجحیت دارد.

Kiela توضیح داد: "اگر شما یک مشکل RAG دارید و در یک محیط سازمانی در یک صنعت بسیار قانونمند هستید، هیچ تحملی برای توهم ندارید. همان مدل زبانی همه‌منظوره‌ای که برای بخش بازاریابی مفید است، چیزی نیست که شما در یک محیط سازمانی بخواهید که در آن نسبت به اشتباهات بسیار حساس‌تر هستید."

مقایسه معیار که نشان می‌دهد مدل زبانی جدید مبتنی بر واقعیت (GLM) Contextual AI از رقبای گوگل، آنتروپیک و OpenAI در آزمایش‌های دقت واقعی بهتر عمل می‌کند. این شرکت ادعا می‌کند که رویکرد تخصصی آن توهمات هوش مصنوعی را در محیط‌های سازمانی کاهش می‌دهد.(اعتبار: Contextual AI)
مقایسه معیار که نشان می‌دهد مدل زبانی جدید مبتنی بر واقعیت (GLM) Contextual AI از رقبای گوگل، آنتروپیک و OpenAI در آزمایش‌های دقت واقعی بهتر عمل می‌کند. این شرکت ادعا می‌کند که رویکرد تخصصی آن توهمات هوش مصنوعی را در محیط‌های سازمانی کاهش می‌دهد.(اعتبار: Contextual AI)

چگونه Contextual AI "مبتنی بودن" را به استاندارد طلایی جدید برای مدل‌های زبانی سازمانی تبدیل می‌کند

مفهوم "مبتنی بودن"—اطمینان از اینکه پاسخ‌های هوش مصنوعی دقیقاً به اطلاعاتی که به صراحت در متن ارائه شده است پایبند هستند—به عنوان یک الزام اساسی برای سیستم‌های هوش مصنوعی سازمانی ظاهر شده است. در صنایع قانونمند مانند مالی، بهداشت و درمان یا مخابرات، شرکت‌ها به هوش مصنوعی نیاز دارند که یا اطلاعات دقیقی ارائه دهد یا به صراحت اعتراف کند که چیزی را نمی‌داند.

Kiela نمونه‌ای از نحوه عملکرد این مبتنی بودن دقیق ارائه داد: "اگر شما یک دستور غذا یا فرمول را به یک مدل زبانی استاندارد بدهید، و در جایی از آن، شما بگویید، "اما این فقط برای اکثر موارد صادق است،" بیشتر مدل‌های زبانی هنوز هم فقط به شما دستور غذا را می‌دهند و فرض می‌کنند که درست است. اما مدل زبانی ما می‌گوید، "در واقع، فقط می‌گوید که این برای اکثر موارد صادق است." این در حال گرفتن این بخش اضافی از تفاوت ظریف است."

توانایی گفتن "نمی‌دانم" نشان دهنده یک قابلیت حیاتی برای تنظیمات سازمانی است. Kiela افزود: "که واقعاً یک ویژگی بسیار قدرتمند است، اگر در یک محیط سازمانی به آن فکر کنید."

RAG 2.0 Contextual AI: راهی یکپارچه‌تر برای پردازش اطلاعات شرکت

پلتفرم Contextual AI بر اساس چیزی ساخته شده است که آنها آن را "RAG 2.0" می‌نامند، رویکردی که فراتر از صرفاً اتصال اجزای خارج از قفسه است.

بر اساس بیانیه شرکت، "یک سیستم RAG معمولی از یک مدل خارج از قفسه منجمد برای تعبیه‌ها، یک پایگاه داده برداری برای بازیابی و یک مدل زبانی جعبه سیاه برای تولید استفاده می‌کند که از طریق درخواست یا یک چارچوب ارکستراسیون به هم متصل شده‌اند. این منجر به یک "هیولای فرانکنشتاین" از هوش مصنوعی مولد می‌شود: اجزای جداگانه از نظر فنی کار می‌کنند، اما کل بسیار دور از مطلوب است."

در عوض، Contextual AI به طور مشترک تمام اجزای سیستم را بهینه می‌کند. Kiela توضیح داد: "ما این مخلوطی از اجزای بازیابنده را داریم، که واقعاً راهی برای انجام بازیابی هوشمند است. به سؤال نگاه می‌کند، و سپس فکر می‌کند، اساساً، مانند بیشتر مدل‌های نسل جدید، ابتدا استراتژی را برای انجام بازیابی برنامه‌ریزی می‌کند."

این کل سیستم در هماهنگی با چیزی کار می‌کند که Kiela آن را "بهترین رتبه‌بند در جهان" می‌نامد، که به اولویت‌بندی مرتبط‌ترین اطلاعات قبل از ارسال آن به مدل زبانی مبتنی بر واقعیت کمک می‌کند.

فراتر از متن ساده: Contextual AI اکنون نمودارها را می‌خواند و به پایگاه‌های داده متصل می‌شود

در حالی که GLM که به تازگی معرفی شده است بر تولید متن تمرکز دارد، پلتفرم Contextual AI اخیراً پشتیبانی از محتوای چندوجهی از جمله نمودارها، نمودارها و داده‌های ساختاریافته از پلتفرم‌های محبوب مانند BigQuery، Snowflake، Redshift و Postgres را اضافه کرده است.

Kiela خاطرنشان کرد: "چالش‌برانگیزترین مشکلات در شرکت‌ها در محل تلاقی داده‌های ساختارنیافته و ساختاریافته قرار دارند. چیزی که بیشتر از همه در مورد آن هیجان‌زده هستم واقعاً این محل تلاقی داده‌های ساختاریافته و ساختارنیافته است. بیشتر مشکلات واقعاً هیجان‌انگیز در شرکت‌های بزرگ دقیقاً در محل تلاقی ساختاریافته و ساختارنیافته قرار دارند، جایی که شما برخی از سوابق پایگاه داده، برخی از تراکنش‌ها، شاید برخی از اسناد خط‌مشی، شاید مجموعه‌ای از چیزهای دیگر دارید."

به گفته Kiela، این پلتفرم در حال حاضر از انواع تجسم‌های پیچیده، از جمله نمودارهای مداری در صنعت نیمه هادی پشتیبانی می‌کند.

برنامه‌های آینده Contextual AI: ایجاد ابزارهای مطمئن‌تر برای کسب‌وکار روزمره

Contextual AI قصد دارد بلافاصله پس از عرضه GLM، جزء رتبه‌بندی تخصصی خود را منتشر کند و به دنبال آن قابلیت‌های درک سند گسترده‌تری ارائه دهد. این شرکت همچنین دارای ویژگی‌های آزمایشی برای قابلیت‌های عامل‌محورتر در حال توسعه است.

Contextual AI که در سال 2023 توسط Kiela و Amanpreet Singh تأسیس شد، که قبلاً در تیم تحقیقات هوش مصنوعی بنیادی متا (FAIR) و Hugging Face کار می‌کردند، مشتریانی از جمله HSBC، Qualcomm و The Economist را به دست آورده است. این شرکت خود را به عنوان کمک به شرکت‌ها برای تحقق بازده ملموس از سرمایه‌گذاری‌های هوش مصنوعی خود قرار می‌دهد.

Kiela گفت: "این واقعاً فرصتی برای شرکت‌هایی است که شاید تحت فشار هستند تا شروع به ارائه بازده سرمایه‌گذاری از هوش مصنوعی کنند تا شروع به بررسی راه حل‌های تخصصی‌تری کنند که در واقع مشکلات آنها را حل می‌کند. و بخشی از این واقعاً داشتن یک مدل زبانی مبتنی بر واقعیت است که شاید کمی خسته‌کننده‌تر از یک مدل زبانی استاندارد باشد، اما در واقع در اطمینان از اینکه در متن ریشه دارد و می‌توانید واقعاً به آن اعتماد کنید تا کار خود را انجام دهد، بسیار خوب است."