در عصر دیجیتال، بازیابی دادههای حذف شده یک چالش کلیدی در پزشکی قانونی دیجیتال است. با افزایش مداوم حجم دادهها و روشهای ذخیرهسازی، روشهای متداول به محدودیتهای خود رسیدهاند. اینجاست که پروژه تحقیقاتی Carve-DL وارد میشود: یک راهحل مبتنی بر هوش مصنوعی که میتواند فایلهایی را که بازسازی آنها دشوار است، با استفاده از الگوریتمهای یادگیری برای بهبود پایدار کارایی و دقت بازسازی دادههای دیجیتال بازیابی کند.
به طور سنتی، کارشناسان پزشکی قانونی از فرآیندهای استاندارد و اغلب دستی برای بازیابی دادههای حذف شده استفاده میکنند. در حالی که این روشها به امضاهای ثابت فایل یا فرادادههای سیستم فایل متکی هستند، Carve-DL مسیر جدیدی را میپیماید. با استفاده از فناوریهای پیشرفته یادگیری عمیق، به ویژه Swin Transformer V2 و ResNet، این نرمافزار نه تنها میتواند فایلهای کامل را بازیابی کند، بلکه دادههای بسیار پراکنده (fragmented) را نیز بازسازی میکند. این امر بازیابی دقیق را حتی در مواردی که تکنیکهای سنتی ناکافی هستند، ممکن میسازد.
Carve-DL برای متخصصان پزشکی قانونی دیجیتال که نیاز به بازسازی دادههای حذف شده یا پراکنده دارند، طراحی شده است. یک مثال، بازیابی دادههای کش (cache) وبسایتهاست که به طور خودکار حذف شدهاند و برای یک تحقیق اهمیت دارند. شواهد دیجیتالی دستکاری شده یا عمداً از بین رفته نیز میتوانند با استفاده از هوش مصنوعی بازسازی شوند.
مطالعه موردی: ناپدید شدن مونالیزا
ویدیوی همراه با استفاده از یک داستان جنایی تخیلی نشان میدهد که چگونه Carve-DL میتواند دادههای تصویری حذف شده را بازسازی کند. در سناریوی تخیلی، مونالیزا دزدیده میشود و تمام آثار دیجیتالی جرم پاک میشوند. این ویدیو نشان میدهد که چگونه Carve-DL رکورد اصلی نقاشی دزدیده شده را از دادههای حافظه پراکنده سارق بازسازی میکند و بدین ترتیب تحلیل پزشکی قانونی را ممکن میسازد.
این مثال برای نشان دادن مزایای عملی روشهای هوش مصنوعی توسعهیافته در نظر گرفته شده است: این سیستم میتواند قطعات تصویر حذف شده را شناسایی، طبقهبندی، گروهبندی و به درستی مرتب کند - فرآیندی که میتواند برای شواهد دیجیتالی واقعی نیز حیاتی باشد. ویدیوی کامل را میتوانید در پیوست این خبر پیدا کنید.
نقاط عطف فناورانه
از زمان شروع پروژه در نوامبر ۲۰۲۲، پیشرفتهای قابل توجهی حاصل شده است. گردش کار هوش مصنوعی به طور مداوم برای مقابله با نیازهای پیچیده پزشکی قانونی دیجیتال و بازسازی دادهها بهینه شده است:
- مدل طبقهبندی: مدلهای طبقهبندی جدید برای شناسایی انواع فایل در دادههای خام که فرآیند بازیابی را بهبود میبخشند.
- مدل تأیید: یک مدل تأیید تخصصی برای بازسازی قابل اعتماد قطعات تصویر.
- تکنیکهای خوشهبندی: تکنیکهای خوشهبندی مبتنی بر یادگیری عمیق که به طور مؤثر گروههایی از قطعات فایل را که به هم تعلق دارند، شناسایی میکنند.
- مدل مرتبسازی مجدد: یک مدل پیشرفته مرتبسازی مجدد قطعات که در حال حاضر ۹۵٪ از قطعات تصویر بازسازی شده را به درستی مونتاژ میکند.
استفاده از Swin Transformer V2 و ResNet به طور قابل توجهی کارایی سیستم را افزایش داده است. به ویژه، خوشهبندی حمایتی با یادگیری متضاد (SCCL) دقت خوشهبندی را به حدود ۸۵٪ افزایش داده است.
چالشها و راهحلهای نوآورانه
یکی از بزرگترین چالشها در طول پروژه، تعداد و ماهیت نامشخص قطعاتی بود که باید بازسازی شوند. Carve-DL این مشکل را با پردازش این عدم قطعیت در مراحل اولیه خط لوله از طریق خوشهبندی تکراری حل کرد.
مشکل دیگر، مرتبسازی مجدد مقیاسپذیر و کارآمد قطعات بود. برای پرداختن به این مسائل، ترکیبی از پردازش سیگنال دیجیتال و تقریب رتبه پایین (LoRA) به منظور استفاده بهینهتر از منابع محاسباتی، ادغام شد.
پتانسیل فراتر از پزشکی قانونی
علاوه بر تحقیقات پلیسی، Carve-DL پتانسیل امیدوارکنندهای برای سایر زمینههای کاربردی نشان میدهد:
- بازیابی دادهها در صنعت، به عنوان مثال برای بازیابی دادههای تحقیقاتی از دست رفته.
- مرمت و بایگانی دیجیتال، به عنوان مثال در حفظ اسناد تاریخی.
- امنیت سایبری، برای تجزیه و تحلیل دستکاری یا حذف هدفمند دادهها.
با توجه به اینکه پروژه Carve-DL در اکتبر ۲۰۲۵ به پایان میرسد، تیم تحقیقاتی به یک نتیجهگیری مثبت دست یافته است. فناوریهای توسعهیافته نشان میدهند که بازسازی دادهها مبتنی بر هوش مصنوعی میتواند پزشکی قانونی دیجیتال را متحول کند. از طریق روشهای نوآورانه، بازیابی دادههای حذف شده یا پراکنده با دقتی بیسابقه امکانپذیر است.