اعتبار: MirageC از طریق Getty Images
اعتبار: MirageC از طریق Getty Images

فراتر از RGB: فرمت فایل تصویری جدید، داده‌های نور نامرئی را به طور مؤثر ذخیره می‌کند

فشرده‌سازی جدید Spectral JPEG XL حجم فایل‌ها را کاهش داده و تصویربرداری طیفی را کاربردی‌تر می‌کند.

تصور کنید با دوربین‌های ویژه‌ای کار می‌کنید که نوری را که چشمان شما قادر به دیدن آن نیست، ثبت می‌کنند — پرتوهای فرابنفش که باعث آفتاب‌سوختگی می‌شوند، ردپاهای حرارتی فروسرخ که نوشته‌های پنهان را آشکار می‌سازند، یا طول موج‌های خاصی که گیاهان برای فتوسنتز از آنها استفاده می‌کنند. یا شاید از دوربین خاصی استفاده می‌کنید که برای تشخیص تفاوت‌های ظریف قابل مشاهده‌ای طراحی شده است که باعث می‌شود رنگ‌های نقاشی تحت نورپردازی خاص، دقیقاً درست به نظر برسند. دانشمندان و مهندسان هر روز این کار را انجام می‌دهند و در دریایی از داده‌های حاصل غرق شده‌اند.

یک فرمت فشرده‌سازی جدید به نام Spectral JPEG XL (JPEG XL طیفی) ممکن است بالاخره این مشکل رو به رشد را در مصورسازی علمی و گرافیک کامپیوتری حل کند. پژوهشگران آلبان فیشه و کریستوف پیترز از شرکت اینتل، جزئیات این فرمت را در مقاله‌ای جدید که در مجله تکنیک‌های گرافیک کامپیوتری (JCGT) منتشر شده است، شرح داده‌اند. این فرمت با گلوگاه جدی صنایعی که با این تصاویر تخصصی کار می‌کنند، مقابله می‌کند. این فایل‌های طیفی می‌توانند حاوی ۳۰، ۱۰۰ یا حتی تعداد بیشتری نقطه داده در هر پیکسل باشند که باعث می‌شود حجم فایل‌ها به قلمرو چند گیگابایتی برسد — و ذخیره و تجزیه و تحلیل آنها را دشوار می‌سازد.

وقتی به تصاویر دیجیتال فکر می‌کنیم، معمولاً فایل‌هایی را تصور می‌کنیم که فقط سه رنگ را ذخیره می‌کنند: قرمز، سبز و آبی (RGB). این برای عکس‌های روزمره به خوبی کار می‌کند، اما ثبت رنگ و رفتار واقعی نور به جزئیات بسیار بیشتری نیاز دارد. تصاویر طیفی (Spectral images) با ثبت شدت نور نه تنها در دسته‌بندی‌های گسترده RGB، بلکه در ده‌ها یا حتی صدها باند طول موج باریک و مشخص، به دنبال این وفاداری بالاتر هستند. این اطلاعات دقیق عمدتاً طیف مرئی را پوشش می‌دهد و اغلب به نواحی نزدیک به فروسرخ و نزدیک به فرابنفش گسترش می‌یابد که برای شبیه‌سازی دقیق نحوه تعامل مواد با نور، حیاتی هستند.

شکل ۱ از مقاله، نشان‌دهنده نرخ فشرده‌سازی نسبی برای یک تصویر طیفی.
شکل ۱ از مقاله، نشان‌دهنده نرخ فشرده‌سازی نسبی برای یک تصویر طیفی. اعتبار: اینتل
اینتل

برخلاف تصاویر استاندارد RGB با سه کانال خود، این فایل‌ها اطلاعات را در کانال‌های متعددی ذخیره می‌کنند که هر کدام نشان‌دهنده شدت نور در یک باند بسیار خاص و باریک از طول موج‌ها هستند. مقاله به کار با تصاویر طیفی حاوی ۳۱ کانال مجزا می‌پردازد و حتی نمونه‌هایی با حداکثر ۸۱ باند طیفی را نشان می‌دهد.

این کانال‌ها اغلب نیاز به ثبت دامنه بسیار وسیع‌تری از مقادیر روشنایی نسبت به عکس‌های معمولی دارند. برای مدیریت این موضوع، تصاویر طیفی اغلب از فرمت‌های با دقت بالا مانند اعداد ممیز شناور ۱۶ بیتی یا ۳۲ بیتی برای هر کانال استفاده می‌کنند که امکان ثبت داده‌های دامنه دینامیکی بالا (High Dynamic Range - HDR) را فراهم می‌کند. این بسیار متفاوت از تصاویر استاندارد ۸ بیتی است و برای نمایش دقیق مواردی مانند روشنایی شدید منابع نور در کنار عناصر تیره‌تر صحنه، کلیدی است.

کاوش در دنیایی فراتر از RGB

چرا کسی به این سطح از جزئیات طول موج در یک تصویر نیاز دارد؟ دلایل زیادی وجود دارد. خودروسازان می‌خواهند دقیقاً پیش‌بینی کنند که رنگ خودرو تحت نورپردازی‌های مختلف چگونه به نظر می‌رسد. دانشمندان از تصویربرداری طیفی برای شناسایی مواد بر اساس امضاهای نوری منحصر به فردشان استفاده می‌کنند. و متخصصان رندرینگ به آن برای شبیه‌سازی دقیق اثرات نوری دنیای واقعی مانند پاشندگی (رنگین‌کمان حاصل از منشورها، به عنوان مثال) و فلورسانس نیاز دارند.

به عنوان مثال، پوشش‌های خبری پیشین Ars Technica نشان داده‌اند که چگونه اخترشناسان خطوط انتشار طیفی یک انفجار پرتو گاما را برای شناسایی مواد شیمیایی در انفجار تجزیه و تحلیل کردند، چگونه فیزیکدانان رنگ‌های اصلی را در عکس‌های پیشگام قرن نوزدهم بازسازی کردند، و چگونه تصویربرداری چندطیفی متون و حاشیه‌نویسی‌های پنهان و چند صد ساله را در نسخه‌های خطی قرون وسطایی مانند دست‌نوشته ووینیچ آشکار کرد، گاهی اوقات حتی هویت خوانندگان یا کاتبان گذشته را از طریق حکاکی‌های کم‌رنگ روی سطح کشف نمود.

لیزا فاگین دیویس، پژوهشگر قرون وسطی، در حال بررسی تصاویر چندطیفی ۱۰ صفحه از دست‌نوشته ووینیچ.
لیزا فاگین دیویس، پژوهشگر قرون وسطی، تصاویر چندطیفی ۱۰ صفحه از دست‌نوشته ووینیچ را بررسی کرد. اعتبار: لیزا فاگین دیویس
لیزا فاگین دیویس

فرمت استاندارد فعلی برای ذخیره‌سازی این نوع داده‌ها، OpenEXR، با در نظر گرفتن این الزامات طیفی عظیم طراحی نشده است. حتی با وجود روش‌های فشرده‌سازی بدون اتلاف داخلی مانند ZIP، فایل‌ها برای کار عملی همچنان دست و پا گیر باقی می‌مانند زیرا این روش‌ها با تعداد زیاد کانال‌های طیفی دست و پنجه نرم می‌کنند.

Spectral JPEG XL از تکنیکی که در تصاویر قابل مشاهده توسط انسان استفاده می‌شود، یک ترفند ریاضی به نام تبدیل کسینوسی گسسته (discrete cosine transform - DCT)، برای کوچک‌تر کردن این فایل‌های عظیم استفاده می‌کند. به جای ذخیره شدت دقیق نور در هر طول موج (که فایل‌های عظیمی ایجاد می‌کند)، این اطلاعات را به شکل دیگری تبدیل می‌کند.

این را اینطور تصور کنید: وقتی به تغییر رنگ رنگین‌کمان نگاه می‌کنید، برای درک آنچه می‌بینید نیازی به ثبت هر طول موج ممکن ندارید. DCT با تبدیل این الگوهای طول موج صاف به مجموعه‌ای از الگوهای موج‌مانند (ضرایب فرکانس) کار می‌کند که وقتی با هم جمع شوند، اطلاعات طیفی اصلی را بازسازی می‌کنند.

این شبیه به نحوه کار MP3 برای موسیقی است—به جای ذخیره هر لرزش کوچک در یک موج صوتی، MP3 الگوهای فرکانس مهمی را که گوش ما می‌تواند تشخیص دهد نگه می‌دارد و بقیه را دور می‌ریزد. در اینجا، Spectral JPEG XL الگوهای مهمی را که نحوه تعامل نور با مواد را تعریف می‌کنند، حفظ می‌کند و جزئیات کمتر حیاتی را فشرده می‌سازد.

مهمتر از آن، سپس یک مرحله وزن‌دهی را اعمال می‌کند و ضرایب طیفی فرکانس بالاتر را بر روشنایی کلی (مؤلفه DC) تقسیم می‌کند، که اجازه می‌دهد داده‌های کم‌اهمیت‌تر با شدت بیشتری فشرده شوند. سپس این داده‌ها به کُدِک (codec) داده می‌شوند، و به جای ابداع یک نوع فایل کاملاً جدید، این روش از موتور فشرده‌سازی و ویژگی‌های فرمت تصویر استاندارد شده JPEG XL برای ذخیره داده‌های طیفیِ به‌طور ویژه آماده‌شده، استفاده می‌کند.

آسان‌تر کردن کار با تصاویر طیفی

به گفته پژوهشگران، گزارش شده است که حجم عظیم فایل‌های تصاویر طیفی، مانعی واقعی برای پذیرش در صنایعی بوده است که از دقت آنها سود می‌برند. فایل‌های کوچک‌تر به معنای زمان انتقال سریع‌تر، کاهش هزینه‌های ذخیره‌سازی و توانایی کار با این تصاویر به صورت تعاملی‌تر بدون نیاز به سخت‌افزار تخصصی است.

نتایج گزارش‌شده توسط پژوهشگران چشمگیر به نظر می‌رسد — با تکنیک آنها، حجم فایل‌های تصویر طیفی ۱۰ تا ۶۰ برابر در مقایسه با فشرده‌سازی بدون اتلاف استاندارد OpenEXR کاهش می‌یابد و آنها را به اندازه‌های قابل مقایسه با عکس‌های معمولی با کیفیت بالا می‌رساند. آنها همچنین ویژگی‌های کلیدی OpenEXR مانند فراداده (metadata) و پشتیبانی از دامنه دینامیکی بالا را حفظ می‌کنند.

در حالی که مقداری اطلاعات در فرآیند فشرده‌سازی قربانی می‌شود — که این فرمت را به یک فرمت "پُراتلاف" (lossy) تبدیل می‌کند — پژوهشگران آن را طوری طراحی کرده‌اند که ابتدا کم‌اهمیت‌ترین جزئیات را دور بریزد و مصنوعات فشرده‌سازی را در جزئیات طیفی فرکانس بالای کم‌اهمیت‌تر متمرکز کند تا اطلاعات بصری مهم حفظ شود.

البته محدودیت‌هایی نیز وجود دارد. تبدیل این نتایج پژوهشی به استفاده عملی گسترده، به توسعه و اصلاح مداوم ابزارهای نرم‌افزاری که رمزگذاری و رمزگشایی JPEG XL را انجام می‌دهند، بستگی دارد. مانند بسیاری از فرمت‌های پیشرفته، پیاده‌سازی‌های اولیه نرم‌افزار ممکن است برای باز کردن کامل هر ویژگی به توسعه بیشتری نیاز داشته باشند. این یک کار در حال پیشرفت است.

و در حالی که Spectral JPEG XL به طور چشمگیری حجم فایل‌ها را کاهش می‌دهد، رویکرد پُراتلاف آن ممکن است برای برخی کاربردهای علمی معایبی ایجاد کند. برخی از پژوهشگرانی که با داده‌های طیفی کار می‌کنند ممکن است به راحتی این بده‌بستان را برای مزایای عملی فایل‌های کوچک‌تر و پردازش سریع‌تر بپذیرند. دیگرانی که با اندازه‌گیری‌های به‌خصوص حساس سروکار دارند، ممکن است نیاز به جستجوی روش‌های جایگزین ذخیره‌سازی داشته باشند.

در حال حاضر، این تکنیک جدید عمدتاً مورد توجه حوزه‌های تخصصی مانند مصورسازی علمی و رندرینگ سطح بالا باقی می‌ماند. با این حال، از آنجایی که صنایعی از طراحی خودرو گرفته تا تصویربرداری پزشکی به تولید مجموعه داده‌های طیفی بزرگ‌تر ادامه می‌دهند، تکنیک‌های فشرده‌سازی مانند این می‌تواند به کاربردی‌تر شدن کار با آن فایل‌های عظیم کمک کند.