طلوعی نو برای جستجو: چرا مدل‌های زبانی بزرگ (LLM) این دسته خواب‌آلود را احیا می‌کنند

جستجو اولین جایزه بزرگ اینترنت بود که در حال حاضر سالانه حدود 300 میلیارد دلار درآمد دارد. سال‌ها، شرکت‌های بزرگ از طریق مقیاس بر آن تسلط داشتند: داده‌های بیشتر کیفیت جستجو را بهبود می‌بخشد و کاربران بیشتر اهرم تبلیغاتی ایجاد می‌کنند. رقبای مصرف‌کننده مانند Neeva تلاش کردند تا پذیرش کافی کاربر را ایجاد کنند و جستجوی سازمانی به طور کلی به طور کامل شکست خورد.

اما مدل‌های زبانی بزرگ و نوآوری‌ها در استدلال عاملی - مانند DeepSeek-R1 و حالت تحقیقات عمیق اخیراً راه‌اندازی شده در Gemini و ChatGPT - آنچه را که در جستجو ممکن است تغییر می‌دهد. این پیشرفت‌ها به شرکت‌ها اجازه می‌دهند تا محصولات بسیار قدرتمندتری را با داده‌های بسیار کمتری بسازند.

در حالی که Google ناپدید نمی‌شود، بازار جستجو در شرف تغییر بسیار زیادی است - با فرصت‌های جدید هیجان‌انگیز در تبلیغات مصرف‌کننده، جستجوی خاص دامنه و زیرساخت.

نمودار گردش کار موتور جستجوی سنتی
<em>نمودارها با حسن نیت Theory Ventures.</em>

چگونه LLMها آنچه را که در جستجو ممکن است تغییر می‌دهند

موتورهای جستجوی سنتی به یک فرآیند چند مرحله‌ای از درک پرس و جو، اجرای پرس و جو و تولید پاسخ متکی هستند.

اندی تریدمن از تئوری ونچرز
اندی تریدمن از Theory Ventures

گوگل سال‌هاست که از مدل‌سازی زبان - به‌ویژه، تعبیه‌های برداری معنایی و ترانسفورماتورها - در جستجو استفاده می‌کند. اما LLMهای مدرن که از قبل بر روی کل اینترنت آموزش داده شده‌اند، قابلیت‌های جدیدی در زمینه درک زبان، بازیابی اطلاعات و استدلال اساسی دارند.

آنها به موتورهای جستجو اجازه می‌دهند تا:

  • پرس و جوهای پیچیده فراتر از کلمات کلیدی کوتاه را درک کنند.
  • نتایج را بدون نمودارهای دانش پیچیده که به میلیاردها کاربر متکی هستند، ارزیابی و رتبه‌بندی کنند، در عوض از مدل جهانی LLM برای تعیین اینکه کدام داده بهترین است، استفاده کنند.
  • پاسخ‌ها را به منظور پاسخ مستقیم به سؤال کاربر به جای ارائه منابع متعدد، ترکیب کنند. و
  • جستجوی عاملی ایجاد کنید، که یک سؤال کاربر را به چندین پرس و جو تجزیه می‌کند، به طور مکرر هر نتیجه را تجزیه و تحلیل می‌کند و یک پاسخ اصلاح شده ارائه می‌دهد. این رویکرد می‌تواند کل جریان‌های کاری تحقیقاتی را که قبلاً به جستجوهای جداگانه زیادی نیاز داشت، جایگزین کند.
نمودار موتور جستجوی قدرتمند LLM

فرصت‌های جدید بازار در جستجوی مبتنی بر LLM

جستجوی مبتنی بر LLM فرصت‌های جدید بازار را در سه حوزه کلیدی ایجاد خواهد کرد.

تبدیل جستجو و تبلیغات مصرف‌کننده: انتظارات مصرف‌کننده به سرعت تغییر می‌کند. پس از پرسیدن یک درخواست باز از یک دستیار هوش مصنوعی یا دریافت پاسخ ساده بله/خیر، بازگشت به جستجوی مبتنی بر کلمه کلیدی و پیمایش صفحه پر از لینک‌ها دردناک است. جستجوی مصرف‌کننده به زودی به طور کامل باز و چندوجهی در ورودی‌ها و خروجی‌ها خواهد بود.

شرکت‌های بزرگ از طریق وسعت و مقیاس جستجوی عمومی، داده‌های شخص اول (به عنوان مثال، Google Maps) و توزیع گسترده، برتری خود را حفظ خواهند کرد. اما اکوسیستم تبلیغات و سئو در اطراف آنها تغییر خواهد کرد.

وقتی نتیجه برای "بهترین کفش‌ها کدامند؟" از یک سری پیوند به یک توصیه تولید شده تغییر می‌کند، شرکت‌های کفش‌سازی به راه‌های جدیدی برای انجام سئو نیاز خواهند داشت. وقتی از یک دستیار می‌خواهید «برای آخر هفته برای من یک هتل رزرو کند»، برندهای هتل به رابط‌ها/اپلت‌هایی نیاز خواهند داشت تا عامل در دسترس بودن را پرس و جو کند و کاربر به عکس‌های گزینه‌های خود نگاه کند.

تکثیر جستجوی خاص دامنه و سازمانی: از آنجایی که ساخت جستجوی سنتی گرسنه داده، گران و پیچیده است، بیشتر ابزارهای جستجوی خاص دامنه و سازمانی عملکرد ضعیفی داشته‌اند. در سراسر صنایع، استارت‌آپ‌های مبتنی بر LLM می‌توانند سیستم‌های قدیمی مانند LexisNexis، FactSet و PubMed را با خودکارسازی گردش‌های کاری تحقیقاتی پیچیده مختل کنند. به عنوان مثال، در پزشکی، آنها می‌توانند ده‌ها آزمایش بالینی مرتبط را پیدا کنند، آنها را بر اساس معیارهای مطالعه فیلتر کنند و سپس یافته‌ها را ترکیب کنند.

LLMها همچنین باعث می‌شوند که جستجوی سازمانی در نهایت کار کند. Glean یک رهبر اولیه در جستجوی داخلی عمومی است، اما فرصت‌های متعددی برای ساخت راه‌حل‌های خاص گردش کار در اطراف سیستم‌های اصلی سوابق (ERP، CRM، SIEM)، توابع (امنیت، عملیات، مالی) یا برنامه‌های کاربردی مشتری (جستجوی محصول) وجود دارد.

زیرساخت جدید برای خدمت به بازار جستجوی در حال انفجار: با ساخت جستجوی مبتنی بر LLM توسط شرکت‌های بیشتر، تقاضای زیرساخت افزایش می‌یابد، از جمله در سیستم‌های بازیابی برای سایر محصولات هوش مصنوعی (نگاه کنید به: بازیابی فقط جستجوست). زمینه‌های فرصت عبارتند از:

  1. پایگاه‌های داده و موتورهای پرس و جو - بهینه‌سازی شده برای جستجوی ترکیبی و چندوجهی، با توان عملیاتی بالا و بازیابی با تأخیر کم در مقیاس؛
  2. بازیابی اطلاعات عصبی - ابزار و مدل‌هایی برای پشتیبانی از تعبیه، فهرست‌بندی و بازیابی برای موارد استفاده مختلف (به عنوان مثال، شرکت پرتفوی Theory Ventures Superlinked). و
  3. هماهنگ‌سازی جستجو - برنامه‌ریزی و تجزیه پرس و جو، هماهنگ‌سازی بازیابی چند مرحله‌ای، رتبه‌بندی/رتبه‌بندی مجدد، تأیید صحت و غیره.

تکامل جستجو در حال حاضر در جریان است، و اکنون بهترین لحظه برای استارت‌آپ‌ها برای ایجاد راه‌حل‌هایی است که نحوه دسترسی و استفاده از اطلاعات را در عصر مبتنی بر LLM بازتعریف می‌کنند.


اندی تریدمن شریک Theory Ventures است، جایی که او در شرکت‌های هوش مصنوعی، داده و ML در مراحل اولیه سرمایه‌گذاری می‌کند. پیشینه او هم به عنوان اپراتور و هم سرمایه‌گذار است: او اولین مدیر محصول در Replica بود - یک استارت‌آپ تحت حمایت Founders Fund که محصولات داده مصنوعی را برای بخش دولتی ایجاد می‌کرد - و یک سرمایه‌گذار یادگیری ماشین در Innovation Endeavors. تریدمن کار خود را در Bain & Co. آغاز کرد و علوم اعصاب محاسباتی را در دانشگاه براون مطالعه کرد، جایی که رابط‌های مغز و کامپیوتر را ساخت و الگوریتم‌های یادگیری ماشین را روی داده‌های عصبی آموزش داد.

تصویرسازی: Li-Anne Dias