مگسی در یک گیاه ونوس مگس‌گیر (Venus flytrap) قرار دارد. رویترز/DPA/Picture Alliance
مگسی در یک گیاه ونوس مگس‌گیر (Venus flytrap) قرار دارد. رویترز/DPA/Picture Alliance

تله داده‌ای هوش مصنوعی، پرپلکسیتی را در حال جعل هویت گوگل به دام انداخت

خلاصه

  • کلودفلر تله‌ای گذاشت و پرپلکسیتی مستقیماً به آن افتاد.
  • کلودفلر دریافت که پرپلکسیتی برای دسترسی غیرمجاز به داده‌ها، هویت مرورگر کروم گوگل را جعل می‌کند.
  • متیو پرینس، مدیرعامل کلودفلر، پرپلکسیتی را با "هکرهای کره شمالی" مقایسه می‌کند.

اگر می‌خواهید در هوش مصنوعی موفق شوید، یک راهکار خوب این است که هویت گوگل را جعل کنید. فقط نباید گیر بیفتید.

این همان اتفاقی است که اخیراً برای پرپلکسیتی، استارت‌آپی که با چت‌جی‌پی‌تی، جیمنای گوگل و دیگر سرویس‌های هوش مصنوعی مولد رقابت می‌کند، افتاد.

داده‌های باکیفیت برای موفقیت در هوش مصنوعی حیاتی هستند، اما شرکت‌های فناوری نمی‌خواهند برای آن پول بپردازند، بنابراین وب را کاوش کرده و اطلاعات را به صورت رایگان، اغلب بدون اجازه، خراشه‌سازی (اسکرپ) می‌کنند. این موضوع واکنش شدید برخی از تولیدکنندگان محتوا و دیگرانی که به حفظ انگیزه‌های ایجادکننده وب علاقه‌مندند را برانگیخته است.

کلودفلر و مدیرعامل آن، متیو پرینس، با ویژگی‌های جدیدی که به وب‌سایت‌ها کمک می‌کند ربات‌های خزنده هوش مصنوعی ناخواسته را مسدود کنند، وارد این نبرد شده‌اند. کلودفلر یک شرکت زیرساخت، امنیت و نرم‌افزار است که به اجرای حدود ۲۰ درصد از اینترنت کمک می‌کند. این شرکت زمانی رشد می‌کند که وب عملکرد خوبی داشته باشد، از این رو علاقه‌مند است به سایت‌ها در کسب درآمد از محتوا کمک کند.

برخی از مشتریان کلودفلر اخیراً به این شرکت گلایه کرده بودند که پرپلکسیتی این مسدودسازی‌ها را دور می‌زند و همچنان بدون اجازه، داده‌ها را خراشه‌سازی و جمع‌آوری می‌کند.

بنابراین، کلودفلر یک تله دیجیتال گذاشت و این استارت‌آپ را به قول یک وبلاگ که روز دوشنبه این ماجرا را توصیف کرده بود، دستگیر کرد.

پرینس روز دوشنبه در X نوشت: "برخی شرکت‌های هوش مصنوعی ظاهراً 'معتبر' بیشتر شبیه هکرهای کره شمالی عمل می‌کنند." "وقت آن است که نامشان را ببریم، رسوایشان کنیم و آن‌ها را به طور کامل مسدود کنیم."

پرپلکسیتی به درخواست برای اظهارنظر پاسخی نداد.

طعمه: دامنه‌های تله‌گذاری و درهای قفل‌شده

کلودفلر وب‌سایت‌های کاملاً جدید و منتشرنشده‌ای ایجاد کرد و آن‌ها را با فایل‌های robots.txt پیکربندی کرد که به صراحت همه خزنده‌ها – از جمله ربات‌های اعلام‌شده پرپلکسیتی، PerplexityBot و Perplexity-User – را مسدود می‌کرد. این سایت‌های آزمایشی هیچ لینک عمومی، ورودی موتور جستجو یا متادیتایی نداشتند که معمولاً آن‌ها را قابل کشف کند.

با این حال، هنگامی که کلودفلر هوش مصنوعی پرپلکسیتی را با سوالاتی درباره این سایت‌های خاص مورد پرسش قرار داد، سرویس این استارت‌آپ با اطلاعات دقیقی پاسخ داد که فقط می‌توانست از آن صفحات محدود شده باشد. نتیجه‌گیری؟ پرپلکسیتی با وجود اینکه به وضوح به آن گفته شده بود که نباید دسترسی پیدا کند، به محتوا دسترسی پیدا کرده بود.

پوشش: چگونه پرپلکسیتی خزیدن خود را پنهان کرد

پرپلکسیتی در ابتدا با استفاده از رشته عامل کاربر رسمی خود، با رعایت پروتکل‌های استاندارد، این سایت‌ها را خزید. با این حال، کلودفلر اعلام کرد که پس از مسدود شدن، پرپلکسیتی به تاکتیک‌های پنهانی متوسل شد.

کلودفلر دریافت که پرپلکسیتی شروع به استقرار خزنده‌های اعلام‌نشده‌ای کرده است که در لباس مرورگرهای وب عادی پنهان شده‌اند و درخواست‌ها را از آدرس‌های IP ناشناس یا چرخشی و ASNs (شماره‌های سیستم خودگردان) غیررسمی ارسال می‌کنند، که شناساگرهای حیاتی هستند که به مسیریابی کارآمد ترافیک اینترنت کمک می‌کنند.

هنگامی که خزنده‌های رسمی آن مسدود شدند، پرپلکسیتی از یک مرورگر وب عمومی استفاده کرد که برای جعل هویت مرورگر کروم گوگل در رایانه‌های مک اپل طراحی شده بود. (بیزینس اینسایدر از گوگل پرسید که آیا به پرپلکسیتی گفته است که از جعل هویت کروم دست بردارد. گوگل پاسخی نداد).

به گفته کلودفلر، پرپلکسیتی روزانه میلیون‌ها درخواست "پنهانی" از این دست را در ده‌ها هزار دامنه وب انجام می‌دهد.

کلودفلر توضیح داد که این رفتار نه تنها استانداردهای وب را نقض می‌کند، بلکه اعتماد اساسی که عملکرد وب باز را زیربنا قرار می‌دهد را نیز زیر پا می‌گذارد.

مقایسه: چگونه اوپن‌ای‌آی درست عمل می‌کند

برای تأکید بر اینکه رفتار خوب یک ربات چگونه است، کلودفلر رفتار پرپلکسیتی را با خزنده‌های اوپن‌ای‌آی مقایسه کرد، که داده‌ها را برای توسعه چت‌جی‌پی‌تی و مدل‌های هوش مصنوعی غول‌پیکر مانند جی‌پی‌تی-۵ (GPT-5) آینده خراشه‌سازی می‌کنند.

به گفته آزمایش‌های کلودفلر، هنگامی که ربات‌های اوپن‌ای‌آی با یک فایل robots.txt یا یک مسدودسازی مشابه مواجه شدند، به سادگی عقب‌نشینی کردند. هیچ دور زدنی. هیچ پنهان‌کاری. هیچ خزیدن مخفیانه‌ای.

پیامد: لغو تأیید و مسدودسازی

در نتیجه این یافته‌ها، کلودفلر پرپلکسیتی را از فهرست ربات‌های تأییدشده خود خارج کرده و تکنیک‌های جدید تشخیص و مسدودسازی را در سراسر شبکه خود به کار گرفته است.

اقدام کلودفلر به عنوان یک درس عبرت در مسابقه تسلیحاتی هوش مصنوعی عمل می‌کند. در حالی که وب به سمت کنترل قوی‌تر بر دسترسی و استفاده از داده‌ها حرکت می‌کند، بازیگرانی که این هنجارهای در حال تکامل را نادیده می‌گیرند ممکن است نه تنها مسدود شوند، بلکه به صورت عمومی نیز افشا گردند.

در عصری که سیستم‌های هوش مصنوعی تشنه داده‌های آموزشی هستند، عملیات مخفی کلودفلر یک سیگنال به استارت‌آپ‌ها و بازیگران تثبیت‌شده به طور یکسان است: به قوانین وب احترام بگذارید، یا خطر افشا شدن را به جان بخرید.