تصور کنید با دوربینهای ویژهای کار میکنید که نوری را که چشمان شما قادر به دیدن آن نیست، ثبت میکنند — پرتوهای فرابنفش که باعث آفتابسوختگی میشوند، ردپاهای حرارتی فروسرخ که نوشتههای پنهان را آشکار میسازند، یا طول موجهای خاصی که گیاهان برای فتوسنتز از آنها استفاده میکنند. یا شاید از دوربین خاصی استفاده میکنید که برای تشخیص تفاوتهای ظریف قابل مشاهدهای طراحی شده است که باعث میشود رنگهای نقاشی تحت نورپردازی خاص، دقیقاً درست به نظر برسند. دانشمندان و مهندسان هر روز این کار را انجام میدهند و در دریایی از دادههای حاصل غرق شدهاند.
یک فرمت فشردهسازی جدید به نام Spectral JPEG XL (JPEG XL طیفی) ممکن است بالاخره این مشکل رو به رشد را در مصورسازی علمی و گرافیک کامپیوتری حل کند. پژوهشگران آلبان فیشه و کریستوف پیترز از شرکت اینتل، جزئیات این فرمت را در مقالهای جدید که در مجله تکنیکهای گرافیک کامپیوتری (JCGT) منتشر شده است، شرح دادهاند. این فرمت با گلوگاه جدی صنایعی که با این تصاویر تخصصی کار میکنند، مقابله میکند. این فایلهای طیفی میتوانند حاوی ۳۰، ۱۰۰ یا حتی تعداد بیشتری نقطه داده در هر پیکسل باشند که باعث میشود حجم فایلها به قلمرو چند گیگابایتی برسد — و ذخیره و تجزیه و تحلیل آنها را دشوار میسازد.
وقتی به تصاویر دیجیتال فکر میکنیم، معمولاً فایلهایی را تصور میکنیم که فقط سه رنگ را ذخیره میکنند: قرمز، سبز و آبی (RGB). این برای عکسهای روزمره به خوبی کار میکند، اما ثبت رنگ و رفتار واقعی نور به جزئیات بسیار بیشتری نیاز دارد. تصاویر طیفی (Spectral images) با ثبت شدت نور نه تنها در دستهبندیهای گسترده RGB، بلکه در دهها یا حتی صدها باند طول موج باریک و مشخص، به دنبال این وفاداری بالاتر هستند. این اطلاعات دقیق عمدتاً طیف مرئی را پوشش میدهد و اغلب به نواحی نزدیک به فروسرخ و نزدیک به فرابنفش گسترش مییابد که برای شبیهسازی دقیق نحوه تعامل مواد با نور، حیاتی هستند.
برخلاف تصاویر استاندارد RGB با سه کانال خود، این فایلها اطلاعات را در کانالهای متعددی ذخیره میکنند که هر کدام نشاندهنده شدت نور در یک باند بسیار خاص و باریک از طول موجها هستند. مقاله به کار با تصاویر طیفی حاوی ۳۱ کانال مجزا میپردازد و حتی نمونههایی با حداکثر ۸۱ باند طیفی را نشان میدهد.
این کانالها اغلب نیاز به ثبت دامنه بسیار وسیعتری از مقادیر روشنایی نسبت به عکسهای معمولی دارند. برای مدیریت این موضوع، تصاویر طیفی اغلب از فرمتهای با دقت بالا مانند اعداد ممیز شناور ۱۶ بیتی یا ۳۲ بیتی برای هر کانال استفاده میکنند که امکان ثبت دادههای دامنه دینامیکی بالا (High Dynamic Range - HDR) را فراهم میکند. این بسیار متفاوت از تصاویر استاندارد ۸ بیتی است و برای نمایش دقیق مواردی مانند روشنایی شدید منابع نور در کنار عناصر تیرهتر صحنه، کلیدی است.
کاوش در دنیایی فراتر از RGB
چرا کسی به این سطح از جزئیات طول موج در یک تصویر نیاز دارد؟ دلایل زیادی وجود دارد. خودروسازان میخواهند دقیقاً پیشبینی کنند که رنگ خودرو تحت نورپردازیهای مختلف چگونه به نظر میرسد. دانشمندان از تصویربرداری طیفی برای شناسایی مواد بر اساس امضاهای نوری منحصر به فردشان استفاده میکنند. و متخصصان رندرینگ به آن برای شبیهسازی دقیق اثرات نوری دنیای واقعی مانند پاشندگی (رنگینکمان حاصل از منشورها، به عنوان مثال) و فلورسانس نیاز دارند.
به عنوان مثال، پوششهای خبری پیشین Ars Technica نشان دادهاند که چگونه اخترشناسان خطوط انتشار طیفی یک انفجار پرتو گاما را برای شناسایی مواد شیمیایی در انفجار تجزیه و تحلیل کردند، چگونه فیزیکدانان رنگهای اصلی را در عکسهای پیشگام قرن نوزدهم بازسازی کردند، و چگونه تصویربرداری چندطیفی متون و حاشیهنویسیهای پنهان و چند صد ساله را در نسخههای خطی قرون وسطایی مانند دستنوشته ووینیچ آشکار کرد، گاهی اوقات حتی هویت خوانندگان یا کاتبان گذشته را از طریق حکاکیهای کمرنگ روی سطح کشف نمود.
فرمت استاندارد فعلی برای ذخیرهسازی این نوع دادهها، OpenEXR، با در نظر گرفتن این الزامات طیفی عظیم طراحی نشده است. حتی با وجود روشهای فشردهسازی بدون اتلاف داخلی مانند ZIP، فایلها برای کار عملی همچنان دست و پا گیر باقی میمانند زیرا این روشها با تعداد زیاد کانالهای طیفی دست و پنجه نرم میکنند.
Spectral JPEG XL از تکنیکی که در تصاویر قابل مشاهده توسط انسان استفاده میشود، یک ترفند ریاضی به نام تبدیل کسینوسی گسسته (discrete cosine transform - DCT)، برای کوچکتر کردن این فایلهای عظیم استفاده میکند. به جای ذخیره شدت دقیق نور در هر طول موج (که فایلهای عظیمی ایجاد میکند)، این اطلاعات را به شکل دیگری تبدیل میکند.
این را اینطور تصور کنید: وقتی به تغییر رنگ رنگینکمان نگاه میکنید، برای درک آنچه میبینید نیازی به ثبت هر طول موج ممکن ندارید. DCT با تبدیل این الگوهای طول موج صاف به مجموعهای از الگوهای موجمانند (ضرایب فرکانس) کار میکند که وقتی با هم جمع شوند، اطلاعات طیفی اصلی را بازسازی میکنند.
این شبیه به نحوه کار MP3 برای موسیقی است—به جای ذخیره هر لرزش کوچک در یک موج صوتی، MP3 الگوهای فرکانس مهمی را که گوش ما میتواند تشخیص دهد نگه میدارد و بقیه را دور میریزد. در اینجا، Spectral JPEG XL الگوهای مهمی را که نحوه تعامل نور با مواد را تعریف میکنند، حفظ میکند و جزئیات کمتر حیاتی را فشرده میسازد.
مهمتر از آن، سپس یک مرحله وزندهی را اعمال میکند و ضرایب طیفی فرکانس بالاتر را بر روشنایی کلی (مؤلفه DC) تقسیم میکند، که اجازه میدهد دادههای کماهمیتتر با شدت بیشتری فشرده شوند. سپس این دادهها به کُدِک (codec) داده میشوند، و به جای ابداع یک نوع فایل کاملاً جدید، این روش از موتور فشردهسازی و ویژگیهای فرمت تصویر استاندارد شده JPEG XL برای ذخیره دادههای طیفیِ بهطور ویژه آمادهشده، استفاده میکند.
آسانتر کردن کار با تصاویر طیفی
به گفته پژوهشگران، گزارش شده است که حجم عظیم فایلهای تصاویر طیفی، مانعی واقعی برای پذیرش در صنایعی بوده است که از دقت آنها سود میبرند. فایلهای کوچکتر به معنای زمان انتقال سریعتر، کاهش هزینههای ذخیرهسازی و توانایی کار با این تصاویر به صورت تعاملیتر بدون نیاز به سختافزار تخصصی است.
نتایج گزارششده توسط پژوهشگران چشمگیر به نظر میرسد — با تکنیک آنها، حجم فایلهای تصویر طیفی ۱۰ تا ۶۰ برابر در مقایسه با فشردهسازی بدون اتلاف استاندارد OpenEXR کاهش مییابد و آنها را به اندازههای قابل مقایسه با عکسهای معمولی با کیفیت بالا میرساند. آنها همچنین ویژگیهای کلیدی OpenEXR مانند فراداده (metadata) و پشتیبانی از دامنه دینامیکی بالا را حفظ میکنند.
در حالی که مقداری اطلاعات در فرآیند فشردهسازی قربانی میشود — که این فرمت را به یک فرمت "پُراتلاف" (lossy) تبدیل میکند — پژوهشگران آن را طوری طراحی کردهاند که ابتدا کماهمیتترین جزئیات را دور بریزد و مصنوعات فشردهسازی را در جزئیات طیفی فرکانس بالای کماهمیتتر متمرکز کند تا اطلاعات بصری مهم حفظ شود.
البته محدودیتهایی نیز وجود دارد. تبدیل این نتایج پژوهشی به استفاده عملی گسترده، به توسعه و اصلاح مداوم ابزارهای نرمافزاری که رمزگذاری و رمزگشایی JPEG XL را انجام میدهند، بستگی دارد. مانند بسیاری از فرمتهای پیشرفته، پیادهسازیهای اولیه نرمافزار ممکن است برای باز کردن کامل هر ویژگی به توسعه بیشتری نیاز داشته باشند. این یک کار در حال پیشرفت است.
و در حالی که Spectral JPEG XL به طور چشمگیری حجم فایلها را کاهش میدهد، رویکرد پُراتلاف آن ممکن است برای برخی کاربردهای علمی معایبی ایجاد کند. برخی از پژوهشگرانی که با دادههای طیفی کار میکنند ممکن است به راحتی این بدهبستان را برای مزایای عملی فایلهای کوچکتر و پردازش سریعتر بپذیرند. دیگرانی که با اندازهگیریهای بهخصوص حساس سروکار دارند، ممکن است نیاز به جستجوی روشهای جایگزین ذخیرهسازی داشته باشند.
در حال حاضر، این تکنیک جدید عمدتاً مورد توجه حوزههای تخصصی مانند مصورسازی علمی و رندرینگ سطح بالا باقی میماند. با این حال، از آنجایی که صنایعی از طراحی خودرو گرفته تا تصویربرداری پزشکی به تولید مجموعه دادههای طیفی بزرگتر ادامه میدهند، تکنیکهای فشردهسازی مانند این میتواند به کاربردیتر شدن کار با آن فایلهای عظیم کمک کند.