اعتبار: VentureBeat، تولید شده با MidJourney
اعتبار: VentureBeat، تولید شده با MidJourney

مدل‌های کوچک به عنوان دستیاران حقوقی: LexisNexis مدل‌ها را برای ساخت دستیار هوش مصنوعی تقطیر می‌کند

هنگامی که شرکت تحقیقات حقوقی LexisNexis دستیار هوش مصنوعی خود به نام Protégé را ایجاد کرد، به دنبال یافتن بهترین راه برای استفاده از تخصص خود بدون استقرار یک مدل بزرگ بود.

هدف Protégé کمک به وکلا، همکاران و دستیاران حقوقی در نوشتن و تصحیح اسناد حقوقی و اطمینان از صحت هر چیزی است که در شکایات و خلاصه ها به آن استناد می کنند. با این حال، LexisNexis یک دستیار هوش مصنوعی حقوقی عمومی نمی خواست. آنها می خواستند دستیاری بسازند که گردش کار یک شرکت را یاد می گیرد و قابل تنظیم تر است.

جف ریل، مدیر ارشد فناوری LexisNexis Legal and Professional، به VentureBeat گفت، LexisNexis این فرصت را دید که قدرت مدل‌های زبان بزرگ (LLM) را از Anthropic و Mistral به ارمغان بیاورد و بهترین مدل‌هایی را پیدا کند که به بهترین شکل به سؤالات کاربران پاسخ می‌دهند.

ریل گفت: «ما از بهترین مدل برای مورد استفاده خاص به عنوان بخشی از رویکرد چند مدلی خود استفاده می کنیم. ما از مدلی استفاده می کنیم که بهترین نتیجه را با سریع ترین زمان پاسخ ارائه می دهد. برای برخی از موارد استفاده، این یک مدل زبانی کوچک مانند Mistral خواهد بود یا ما برای بهبود عملکرد و کاهش هزینه، تقطیر را انجام می دهیم.»

در حالی که LLM ها هنوز در ساخت برنامه های کاربردی هوش مصنوعی ارزش ارائه می دهند، برخی از سازمان ها به استفاده از مدل های زبانی کوچک (SLM) یا تقطیر LLM ها برای تبدیل شدن به نسخه های کوچک از همان مدل روی می آورند.

تقطیر، که در آن یک LLM به یک مدل کوچکتر «آموزش» می دهد، به روش محبوبی برای بسیاری از سازمان ها تبدیل شده است.

مدل های کوچک اغلب برای برنامه هایی مانند چت بات ها یا تکمیل کد ساده بهترین کارایی را دارند، که LexisNexis می خواست برای Protégé از آن استفاده کند.

این اولین بار نیست که LexisNexis برنامه های کاربردی هوش مصنوعی را ایجاد می کند، حتی قبل از راه اندازی مرکز تحقیقات حقوقی خود LexisNexis + AI در جولای 2024.

ریل گفت: «ما در گذشته از هوش مصنوعی زیادی استفاده کرده‌ایم، که بیشتر در مورد پردازش زبان طبیعی، برخی یادگیری عمیق و یادگیری ماشین بود. این واقعاً در نوامبر 2022 با راه اندازی ChatGPT تغییر کرد، زیرا قبل از آن، بسیاری از قابلیت‌های هوش مصنوعی تا حدودی پشت صحنه بودند. اما به محض اینکه ChatGPT بیرون آمد، قابلیت‌های تولیدی، قابلیت‌های مکالمه آن برای ما بسیار جذاب بود.»

مدل های کوچک، تنظیم شده و مسیریابی مدل

ریل گفت LexisNexis هنگام ساخت پلتفرم های هوش مصنوعی خود از مدل های مختلفی از اکثر ارائه دهندگان اصلی مدل استفاده می کند. LexisNexis + AI از مدل‌های Claude از Anthropic، مدل‌های GPT OpenAI و مدلی از Mistral استفاده کرده است.

این رویکرد چندوجهی به تجزیه هر وظیفه ای که کاربران می خواستند در پلتفرم انجام دهند کمک کرد. برای انجام این کار، LexisNexis مجبور شد پلتفرم خود را به گونه ای طراحی کند که بین مدل‌ها جابجا شود.

ریل گفت: «ما هر وظیفه ای را که انجام می شد به اجزای جداگانه تجزیه می کردیم و سپس بهترین مدل زبان بزرگ را برای پشتیبانی از آن مؤلفه شناسایی می کردیم. یک مثال از این این است که ما از Mistral برای ارزیابی پرس و جوی وارد شده توسط کاربر استفاده می کنیم.»

برای Protégé، این شرکت زمان‌های پاسخگویی سریع‌تر و مدل‌هایی را می‌خواست که بیشتر برای موارد استفاده حقوقی تنظیم شده باشند. بنابراین به اصطلاح «نسخه‌های تنظیم‌شده» مدل‌ها، اساساً نسخه‌های وزن کوچک‌تر LLM یا مدل‌های تقطیر شده، روی آورد.

او گفت: «شما برای ارزیابی یک پرس و جو نیازی به GPT-4o ندارید، بنابراین ما از آن برای کارهای پیچیده‌تر استفاده می‌کنیم و مدل‌ها را عوض می‌کنیم.»

وقتی کاربر از Protégé سؤالی درباره یک پرونده خاص می‌پرسد، اولین مدلی که پینگ می‌شود، یک Mistral تنظیم‌شده است «برای ارزیابی پرس و جو، سپس تعیین هدف و منظور از آن پرس و جو» قبل از تغییر به مدلی که بهترین است. مناسب برای تکمیل کار ریل گفت که مدل بعدی می تواند یک LLM باشد که پرس و جوهای جدیدی را برای موتور جستجو تولید می کند یا مدل دیگری که نتایج را خلاصه می کند.

در حال حاضر، LexisNexis بیشتر به یک مدل Mistral تنظیم شده متکی است، اگرچه ریل گفت که از یک نسخه تنظیم شده از Claude «زمانی که برای اولین بار منتشر شد استفاده کرد. ما امروز از آن در محصول استفاده نمی کنیم، بلکه به روش های دیگر.» LexisNexis همچنین علاقه مند به استفاده از سایر مدل های OpenAI است، به ویژه از آنجایی که این شرکت ابزارهای جدید تقویت تنظیم دقیق را سال گذشته ارائه کرد. LexisNexis در حال ارزیابی مدل‌های استدلال OpenAI از جمله o3 برای پلتفرم‌های خود است.

ریل اضافه کرد که ممکن است به استفاده از مدل های Gemini از Google نیز نگاه کند.

LexisNexis از تمام پلتفرم‌های هوش مصنوعی خود با نمودار دانش خود برای انجام قابلیت‌های تولید افزوده بازیابی (RAG) پشتیبانی می‌کند، به‌ویژه از آنجایی که Protégé می‌تواند به راه‌اندازی فرآیندهای عامل‌محور در آینده کمک کند.

مجموعه حقوقی هوش مصنوعی

حتی قبل از ظهور هوش مصنوعی مولد، LexisNexis امکان به کارگیری چت‌بات‌ها در صنعت حقوقی را آزمایش کرد. در سال 2017، این شرکت یک دستیار هوش مصنوعی را آزمایش کرد که با Ross با قدرت IBM و Protégé رقابت می کند و در پلتفرم LexisNexis + AI شرکت قرار دارد، که خدمات هوش مصنوعی LexisNexis را گرد هم می آورد.

Protégé به شرکت‌های حقوقی در انجام کارهایی که دستیاران حقوقی یا همکاران تمایل به انجام آن دارند کمک می‌کند. این به نوشتن خلاصه ها و شکایات قانونی کمک می کند که در اسناد و داده های شرکت ها پایه گذاری شده اند، مراحل بعدی گردش کار حقوقی را پیشنهاد می کند، اعلان های جدیدی را برای اصلاح جستجوها پیشنهاد می کند، سؤالاتی را برای بازپرسی و کشف تهیه می کند، نقل قول ها را در پرونده ها برای دقت پیوند می دهد، جدول زمانی ایجاد می کند و البته اسناد پیچیده حقوقی را خلاصه می کند.

ریل گفت: «ما Protégé را گام اولیه در شخصی‌سازی و قابلیت‌های عامل‌محور می‌دانیم. به انواع مختلف وکلا فکر کنید: M&A، دادخواهان، املاک و مستغلات. بر اساس وظیفه خاصی که انجام می دهید، شخصی تر و شخصی تر می شود. چشم انداز ما این است که هر متخصص حقوقی یک دستیار شخصی برای کمک به انجام کار خود بر اساس کاری که انجام می دهند، نه کاری که سایر وکلا انجام می دهند، داشته باشد.»

Protégé اکنون با سایر پلتفرم های تحقیقات حقوقی و فناوری رقابت می کند. تامسون رویترز مدل o1-mini OpenAI را برای دستیار حقوقی CoCounsel خود سفارشی کرد. هاروی، که $300 میلیون دلار از سرمایه گذاران از جمله LexisNexis جمع آوری کرد، نیز دارای یک دستیار هوش مصنوعی حقوقی است.