خلاصه
- کلودفلر تلهای گذاشت و پرپلکسیتی مستقیماً به آن افتاد.
- کلودفلر دریافت که پرپلکسیتی برای دسترسی غیرمجاز به دادهها، هویت مرورگر کروم گوگل را جعل میکند.
- متیو پرینس، مدیرعامل کلودفلر، پرپلکسیتی را با "هکرهای کره شمالی" مقایسه میکند.
اگر میخواهید در هوش مصنوعی موفق شوید، یک راهکار خوب این است که هویت گوگل را جعل کنید. فقط نباید گیر بیفتید.
این همان اتفاقی است که اخیراً برای پرپلکسیتی، استارتآپی که با چتجیپیتی، جیمنای گوگل و دیگر سرویسهای هوش مصنوعی مولد رقابت میکند، افتاد.
دادههای باکیفیت برای موفقیت در هوش مصنوعی حیاتی هستند، اما شرکتهای فناوری نمیخواهند برای آن پول بپردازند، بنابراین وب را کاوش کرده و اطلاعات را به صورت رایگان، اغلب بدون اجازه، خراشهسازی (اسکرپ) میکنند. این موضوع واکنش شدید برخی از تولیدکنندگان محتوا و دیگرانی که به حفظ انگیزههای ایجادکننده وب علاقهمندند را برانگیخته است.
کلودفلر و مدیرعامل آن، متیو پرینس، با ویژگیهای جدیدی که به وبسایتها کمک میکند رباتهای خزنده هوش مصنوعی ناخواسته را مسدود کنند، وارد این نبرد شدهاند. کلودفلر یک شرکت زیرساخت، امنیت و نرمافزار است که به اجرای حدود ۲۰ درصد از اینترنت کمک میکند. این شرکت زمانی رشد میکند که وب عملکرد خوبی داشته باشد، از این رو علاقهمند است به سایتها در کسب درآمد از محتوا کمک کند.
برخی از مشتریان کلودفلر اخیراً به این شرکت گلایه کرده بودند که پرپلکسیتی این مسدودسازیها را دور میزند و همچنان بدون اجازه، دادهها را خراشهسازی و جمعآوری میکند.
بنابراین، کلودفلر یک تله دیجیتال گذاشت و این استارتآپ را به قول یک وبلاگ که روز دوشنبه این ماجرا را توصیف کرده بود، دستگیر کرد.
پرینس روز دوشنبه در X نوشت: "برخی شرکتهای هوش مصنوعی ظاهراً 'معتبر' بیشتر شبیه هکرهای کره شمالی عمل میکنند." "وقت آن است که نامشان را ببریم، رسوایشان کنیم و آنها را به طور کامل مسدود کنیم."
پرپلکسیتی به درخواست برای اظهارنظر پاسخی نداد.
طعمه: دامنههای تلهگذاری و درهای قفلشده
کلودفلر وبسایتهای کاملاً جدید و منتشرنشدهای ایجاد کرد و آنها را با فایلهای robots.txt پیکربندی کرد که به صراحت همه خزندهها – از جمله رباتهای اعلامشده پرپلکسیتی، PerplexityBot و Perplexity-User – را مسدود میکرد. این سایتهای آزمایشی هیچ لینک عمومی، ورودی موتور جستجو یا متادیتایی نداشتند که معمولاً آنها را قابل کشف کند.
با این حال، هنگامی که کلودفلر هوش مصنوعی پرپلکسیتی را با سوالاتی درباره این سایتهای خاص مورد پرسش قرار داد، سرویس این استارتآپ با اطلاعات دقیقی پاسخ داد که فقط میتوانست از آن صفحات محدود شده باشد. نتیجهگیری؟ پرپلکسیتی با وجود اینکه به وضوح به آن گفته شده بود که نباید دسترسی پیدا کند، به محتوا دسترسی پیدا کرده بود.
پوشش: چگونه پرپلکسیتی خزیدن خود را پنهان کرد
پرپلکسیتی در ابتدا با استفاده از رشته عامل کاربر رسمی خود، با رعایت پروتکلهای استاندارد، این سایتها را خزید. با این حال، کلودفلر اعلام کرد که پس از مسدود شدن، پرپلکسیتی به تاکتیکهای پنهانی متوسل شد.
کلودفلر دریافت که پرپلکسیتی شروع به استقرار خزندههای اعلامنشدهای کرده است که در لباس مرورگرهای وب عادی پنهان شدهاند و درخواستها را از آدرسهای IP ناشناس یا چرخشی و ASNs (شمارههای سیستم خودگردان) غیررسمی ارسال میکنند، که شناساگرهای حیاتی هستند که به مسیریابی کارآمد ترافیک اینترنت کمک میکنند.
هنگامی که خزندههای رسمی آن مسدود شدند، پرپلکسیتی از یک مرورگر وب عمومی استفاده کرد که برای جعل هویت مرورگر کروم گوگل در رایانههای مک اپل طراحی شده بود. (بیزینس اینسایدر از گوگل پرسید که آیا به پرپلکسیتی گفته است که از جعل هویت کروم دست بردارد. گوگل پاسخی نداد).
به گفته کلودفلر، پرپلکسیتی روزانه میلیونها درخواست "پنهانی" از این دست را در دهها هزار دامنه وب انجام میدهد.
کلودفلر توضیح داد که این رفتار نه تنها استانداردهای وب را نقض میکند، بلکه اعتماد اساسی که عملکرد وب باز را زیربنا قرار میدهد را نیز زیر پا میگذارد.
مقایسه: چگونه اوپنایآی درست عمل میکند
برای تأکید بر اینکه رفتار خوب یک ربات چگونه است، کلودفلر رفتار پرپلکسیتی را با خزندههای اوپنایآی مقایسه کرد، که دادهها را برای توسعه چتجیپیتی و مدلهای هوش مصنوعی غولپیکر مانند جیپیتی-۵ (GPT-5) آینده خراشهسازی میکنند.
به گفته آزمایشهای کلودفلر، هنگامی که رباتهای اوپنایآی با یک فایل robots.txt یا یک مسدودسازی مشابه مواجه شدند، به سادگی عقبنشینی کردند. هیچ دور زدنی. هیچ پنهانکاری. هیچ خزیدن مخفیانهای.
پیامد: لغو تأیید و مسدودسازی
در نتیجه این یافتهها، کلودفلر پرپلکسیتی را از فهرست رباتهای تأییدشده خود خارج کرده و تکنیکهای جدید تشخیص و مسدودسازی را در سراسر شبکه خود به کار گرفته است.
اقدام کلودفلر به عنوان یک درس عبرت در مسابقه تسلیحاتی هوش مصنوعی عمل میکند. در حالی که وب به سمت کنترل قویتر بر دسترسی و استفاده از دادهها حرکت میکند، بازیگرانی که این هنجارهای در حال تکامل را نادیده میگیرند ممکن است نه تنها مسدود شوند، بلکه به صورت عمومی نیز افشا گردند.
در عصری که سیستمهای هوش مصنوعی تشنه دادههای آموزشی هستند، عملیات مخفی کلودفلر یک سیگنال به استارتآپها و بازیگران تثبیتشده به طور یکسان است: به قوانین وب احترام بگذارید، یا خطر افشا شدن را به جان بخرید.