هوش مصنوعی ChatGPT در تلاش برای حدس زدن موقعیت مکانی یک عکس.
هوش مصنوعی ChatGPT در تلاش برای حدس زدن موقعیت مکانی یک عکس.

هوش مصنوعی ChatGPT در حد ترسناکی در تشخیص مکان عکس‌ها خوب عمل می‌کند و نگرانی‌های مربوط به داکسینگ را برانگیخته است

عکس‌های ساده می‌توانند مکان‌های واقعی را فاش کنند

نکته مهم: اکنون که بیشتر مردم استفاده از ChatGPT برای تبدیل خود به اکشن فیگور را متوقف کرده‌اند، به نظر می‌رسد روند بعدی مرتبط با هوش مصنوعی، استفاده از آن برای حدس زدن مکان‌ها بر اساس عکس‌ها است. در حالی که برخی این قابلیت جستجوی معکوس مکان را سرگرم‌کننده می‌دانند، این موضوع نگرانی‌های متعددی را در مورد حریم خصوصی، به‌ویژه در مورد داکسینگ (doxxing) ایجاد می‌کند.

OpenAI هفته گذشته جدیدترین مدل‌های o3 و o4-mini خود را منتشر کرد که می‌توانند تصاویر آپلود شده را "استدلال" کنند. این بدان معناست که می‌تواند عکس‌ها را برش دهد، بچرخاند و بزرگنمایی کند، حتی اگر کیفیت پایینی داشته باشند.

در ترکیب با سایر توانایی‌های مدل‌ها، مردم متوجه شده‌اند که آن‌ها به ویژه در شناسایی مکان‌ها در عکس‌های آپلود شده خوب هستند.

کاربران در حال تغذیه تصاویر o3 از همه‌چیز، از منوی رستوران‌ها گرفته تا سلفی‌ها، هستند و به مدل می‌گویند تصور کند که در حال انجام بازی حدس‌زدن آنلاین GeoGuessr است، که بازیکنان را موظف می‌کند مکان‌ها را بر اساس تصاویر Google Street View حدس بزنند.

به راحتی می‌توان این را فقط یک بازی سرگرم‌کننده تلقی کرد، اما یک جنبه تاریک بالقوه نیز وجود دارد. این جستجوی معکوس تصویر می‌تواند به راحتی به کسی اجازه دهد که داکس شود - یعنی افشای عمومی محل زندگی یا موقعیت مکانی آن‌ها - بر اساس جزئیات کوچک در یک تصویر که بیشتر انسان‌ها متوجه آن نمی‌شوند. یک سلفی ساده با چند مورد پس‌زمینه، یا یک استوری در رسانه‌های اجتماعی، می‌تواند به ChatGPT وارد شود تا مشخص شود کجا گرفته شده است.

در حالی که کاربران توانایی مدل o3 در شناسایی مکان‌ها از تصاویر را ستوده‌اند، این چیزی نیست که با آخرین نسخه‌ها ارائه شده باشد. TechCrunch اشاره می‌کند که GPT-4o، که بدون استدلال تصویر منتشر شد، توانست بیشتر از o3 به همان پاسخ‌ها برسد و این کار را در زمان کمتری انجام داد. با این حال، یک مورد در آزمایش‌های این نشریه وجود داشت که o3 توانست به درستی حدس بزند که تصویری از یک سر کرگدن بنفش که در یک بار نصب شده بود، مربوط به یک اسپیک‌ایزی در ویلیامزبورگ است - GPT-4o فکر می‌کرد که از یک میخانه در بریتانیا است.

توجه به این نکته مهم است که حتی o3 هم همیشه حدس‌هایش درست نیست و گاهی اوقات هنگام تلاش برای تعیین یک مکان، در یک حلقه گیر می‌کند.

یک سخنگوی OpenAI گفت که استدلال بصری ابزارهای آن را در زمینه‌هایی مانند دسترسی، تحقیق یا شناسایی مکان‌ها در واکنش اضطراری مفیدتر می‌کند.

در مورد جلوگیری از داکسینگ، سخنگوی این شرکت گفت که مدل‌ها درخواست‌های اطلاعات خصوصی یا حساس را رد می‌کنند و این شرکت اقدامات حفاظتی را اضافه کرده است که هدف آن جلوگیری از شناسایی افراد خصوصی در تصاویر توسط مدل‌ها است.

منبع تصویر: Alex Shuper