شما RAG را اشتباه انجام می‌دهید: چگونه تولید مبتنی بر بازیابی را برای مدل‌های زبان محلی (LLM) اصلاح کنیم

چگونه RAG را به صورت محلی راه‌اندازی کنیم، از مشکلات رایج اجتناب کنیم و دقت بازیابی RAG را بهبود بخشیم.

?? می‌خواهید مستقیماً به راه‌اندازی بروید؟ به آموزش مراجعه کنید.

?? نیاز به یادآوری RAG دارید؟ مقاله قبلی من را بررسی کنید.

RAG کار می‌کند... تا زمانی که دیگر کار نکند

RAG عالی به نظر می‌رسد، تا زمانی که سعی کنید آن را پیاده‌سازی کنید. سپس شکاف‌ها شروع به نمایان شدن می‌کنند.

RAG بخش‌های نامربوط را استخراج می‌کند، ایده‌های نامرتبط را با هم ترکیب می‌کند، و با اطمینان نوشته‌های اول شخص را به اشتباه نسبت می‌دهد، و زمینه مفید را به یک آشفتگی گیج‌کننده تبدیل می‌کند.

چگونه RAG را هوشمندتر کنیم

هنگام ساخت سیستم RAG خودم با دو مشکل اساسی روبرو شدم:

  • ?? ناآگاهی از زمینه — وقتی قطعات بازیابی شده اطلاعات کافی برای مفید بودن ندارند.
  • ?? سردرگمی اول شخص — وقتی سیستم نمی‌داند "من" به چه کسی اشاره دارد.

من دقیقاً به شما نشان خواهم داد که چگونه این مشکلات را برطرف کردم، بنابراین سیستم RAG شما واقعاً می‌فهمد چه چیزی را بازیابی می‌کند.

در پایان، شما یک خط لوله RAG 100٪ محلی، 100٪ رایگان و آگاه به زمینه خواهید داشت که با LLM محلی و رابط کاربری دلخواه شما اجرا می‌شود. ما همچنین یک پایگاه دانش خودکار راه‌اندازی خواهیم کرد، بنابراین افزودن اطلاعات جدید بدون اصطکاک خواهد بود.

قبل از اینکه شروع کنیم…