Intelの研究者が、従来のRGB画像よりも広範囲の光波長データを効率的に保存できる新しい画像圧縮フォーマット「Spectral JPEG XL」を開発した。この技術により、科学的可視化やコンピュータグラフィックスなどの分野で、近年増大している膨大なデータサイズが最大60分の1に削減され、スペクトル画像処理の実用性が大幅に向上する見込みだ。
スペクトル画像とは:可視光を超えたデータの記録
通常のデジタル画像は、赤、緑、青(RGB)の3色の情報のみを格納している。この方式は日常的な写真には適しているが、光の真の色と挙動を捉えるにはより詳細な情報が必要となる。
スペクトル画像はこの高忠実度を目指し、光の強度をRGBという広いカテゴリーだけでなく、数十から数百の非常に狭く特定の波長バンドごとに記録する。この詳細な情報は主に可視スペクトルをカバーし、しばしば光と物質の相互作用を正確にシミュレートするために重要な近赤外線や近紫外線領域にまで拡張している。論文では、31チャンネルや81チャンネルといった多数のチャンネルを持つスペクトル画像の例が示されている。
さらに、スペクトル画像は、例えば太陽光のような非常に明るい光源から、物体の影になるような暗い部分まで、幅広い明るさの範囲を正確に記録する必要があることが多い。そのため、各チャンネルのデータは、標準的な8ビット整数ではなく、16ビットや32ビットの浮動小数点数を用いて表現されることが一般的である。これにより、高ダイナミックレンジ(HDR: High Dynamic Range) の情報を保持することが可能となる。
このような詳細な光の情報を記録するスペクトル画像は、様々な分野でその価値を発揮している。
- 産業応用: 自動車メーカーが、様々な照明条件下で車体塗装がどのように見えるかを正確に予測する。
- 科学研究: 物質には固有のスペクトル(分光)シグネチャが存在するため、それを利用して材料を特定したり、化学組成を分析したりする(例:天文学における星間物質の同定)。リモートセンシングによる地質調査や植生分析などにも利用される。
- コンピュータグラフィックス (CG): 現実世界の光と物質の相互作用をより忠実にシミュレーションする。プリズムによる光の分散(虹色に見える現象)や蛍光といった複雑な光学現象の再現には、スペクトル情報が不可欠である。
- 文化財保護: 古文書に書かれた文字や絵画の下層にある隠された情報を、異なる波長の光を照射して撮影するマルチスペクトルイメージングによって明らかにする。
巨大ファイルサイズの壁:既存フォーマットの限界
スペクトル画像は豊富な情報をもたらす一方で、そのデータ量の膨大さが大きな課題であった。1ピクセルあたり数十以上のデータ点を持つため、画像1枚あたりのファイルサイズは容易に数ギガバイト(GB)に達してしまう。
これまで、HDR画像やCG業界ではOpenEXRというファイルフォーマットが標準的に利用されてきた。OpenEXRはHDRデータを扱うのに適しており、ロスレス(可逆)圧縮機能も備えている。しかし、このフォーマットは元々、スペクトル画像のようにチャンネル数が極端に多いデータを効率的に圧縮することを主眼に設計されたものではない。
OpenEXRに組み込まれているZIPやPIZといったロスレス圧縮アルゴリズムを適用しても、チャンネル数が多いために圧縮効果は限定的であり、ファイルサイズは依然として巨大なままとなるケースが多い。例えば、81チャンネルのスペクトル画像(非圧縮状態に近い)は、ロスレス圧縮後でも約300メガバイト(MiB)ものサイズになっている。

この扱いにくい巨大なファイルサイズは、スペクトルデータの保存に必要なストレージ容量を増大させ、ネットワーク経由での転送に時間を要し、解析や処理にも高性能な計算機環境を要求する。結果として、スペクトル技術の利便性を損ない、その普及を妨げる一因となっていたと研究者らは指摘している。
Spectral JPEG XLの仕組み:コサイン変換とJPEG XLの融合
新たに提案された規格「Spectral JPEG XL」は、離散コサイン変換(DCT)と呼ばれる人間が見える画像で使用される技術を活用し、これらの巨大なファイルをより小さくしている。各波長での正確な光強度をすべて格納する(巨大なファイルを作成する)代わりに、この情報を異なる形式に変換する。
この手法の核心は、最新の画像圧縮規格であるJPEG XLを基盤としつつ、スペクトルデータ特有の性質を利用して前処理を行う点にある。そのプロセスは以下の通りである。
- 波長領域でのコサイン変換:
まず、ピクセルごとに記録された多数の波長チャンネルのデータ(=スペクトル)に対し、コサイン変換(Cosine Transform)と呼ばれる数学的な処理を施す。これは、波長に対する光強度の変化パターンを、異なる周波数成分の重ね合わせとして表現し直す操作である。一般に、自然界の物体のスペクトルは滑らかに変化することが多く、重要な情報は低周波成分に集中する傾向がある。コサイン変換により、この情報の偏りを圧縮に利用しやすくなる。これは、JPEG圧縮で空間的な冗長性を減らすために使われる離散コサイン変換(DCT)と考え方が似ている。 - DC成分によるAC成分の正規化:
コサイン変換によって得られた係数のうち、周波数がゼロの成分(DC成分と呼ばれる)は、そのスペクトル全体の平均的な明るさ(輝度)に相当する。一方、それ以外のゼロでない周波数の成分(AC成分と呼ばれる)は、スペクトルの形状や色味に関する情報を持つ。画像内で明るさが大きく変動する場合、DC成分だけでなくAC成分も大きな値を取り、圧縮しにくくなる。そこで、Spectral JPEG XLでは、各AC成分を、対応するDC成分の値で割ることで正規化(Normalization)を行う(Fichet & Peters, 2025, Sec 3.1)。これにより、AC成分の変動範囲(ダイナミックレンジ)が効果的に抑制され、後段の圧縮処理がより効率的に行えるようになる。 - JPEG XLによる圧縮・格納:
上記の前処理によって変換・正規化されたDC成分とAC成分のデータは、それぞれJPEG XLフォーマットを用いて圧縮され、ファイルに格納される。JPEG XLは、高い圧縮効率、ロスレス圧縮とロッシー(非可逆)圧縮の両方に対応、HDRおよび広色域のサポート、アルファチャンネルや追加チャンネルの格納能力、メタデータの埋め込み機能など、多くの先進的な特徴を持つ最新の画像圧縮規格である[ISO 2024]。Spectral JPEG XLは、これらのJPEG XLの機能を最大限に活用することで、スペクトルデータの大幅な圧縮を実現する。
重要な点として、この圧縮プロセスはロッシー(非可逆)圧縮である。つまり、ファイルサイズを削減するために、元データの一部情報が失われる。開発チームは、圧縮による劣化が視覚的に目立ちにくいように、主にスペクトルの高周波成分(細かな変動を示す成分)の情報から削減していくように設計したと述べている。圧縮の度合い(ファイルサイズと品質のトレードオフ)は、JPEG XLの「距離レベル(distance level)」と呼ばれるパラメータによって制御可能である。研究論文では、DC成分とAC成分で異なる圧縮レベルを設定したり、AC成分の空間解像度を削減するクロマサブサンプリング(Chroma Subsampling)を適用したりすることで、さらなる圧縮率向上を図る方法も検討されている。
この方法は音楽用のMP3と似ている—音波の細かな振動をすべて格納するのではなく、MP3は耳が検知できる重要な周波数パターンを保持し、残りを破棄する。同様に、Spectral JPEG XLは光が物質とどのように相互作用するかを定義する重要なパターンを保持し、あまり重要でない詳細を圧縮する。
驚異的な圧縮効果:ファイルサイズを最大1/60に
Spectral JPEG XLがもたらす圧縮効果は顕著である。研究論文によれば、提案手法を用いることで、スペクトル画像のファイルサイズを、OpenEXR形式(ZIPロスレス圧縮)と比較して10分の1から60分の1にまで削減できることが示されている。
論文中で示された具体的な比較例では、元データは81のスペクトルバンドを持つレンダリング画像で、OpenEXR(ZIP圧縮)でのファイルサイズは299.95 MiBだった。
- これをSpectral JPEG XL(クロマサブサンプリング無し、ロッシー圧縮)で圧縮すると、ファイルサイズは6.32 MiBとなった。これは約47分の1のサイズである。
- さらに、AC成分に対して1:2のクロマサブサンプリング(水平・垂直解像度を半分にする)を適用すると、ファイルサイズは3.90 MiBにまで削減された。これは元サイズの約77分の1に相当する。
これらの圧縮後のファイルサイズは、一般的なデジタルカメラで撮影された高品質なJPEG画像と同程度であり、スペクトルデータが格段に扱いやすくなることを示唆している。
圧縮による品質の劣化については、RMSE(二乗平均平方根誤差)などの指標で評価されているが、研究者らは、視覚的に重要な情報は保持されるように設計されており、適切なパラメータ設定を行えば、多くの応用において許容可能な品質を保ちつつ、大幅なファイルサイズ削減の恩恵を受けられるとしている。ただし、どの程度の劣化が許容されるかは、具体的な用途によって異なるため、利用者は圧縮レベルを適切に選択する必要がある。
将来の展望と課題:専門分野から幅広い採用へ
圧縮過程でいくつかの情報が犠牲になる(「ロッシー」フォーマットにする)が、研究者はこれを最初に最も気づきにくい詳細を破棄するように設計し、重要な視覚情報を保存するために高周波スペクトル詳細のあまり重要でない部分に圧縮アーティファクトを集中させている。
もちろん、いくつかの制限もある。JPEG XLエンコーディングとデコーディングを処理するソフトウェアツールの継続的な開発と改良に依存しており、多くの最先端フォーマットと同様に、初期のソフトウェア実装はあらゆる機能を完全に解放するためにさらなる開発が必要かもしれない。
「Spectral JPEG XLは劇的にファイルサイズを縮小するが、そのロッシーアプローチはいくつかの科学的応用にとっては欠点となる可能性がある」とArs Technicaは指摘している。スペクトルデータを扱う研究者の中には、より小さなファイルと高速処理の実用的な利点のためにトレードオフを喜んで受け入れる人もいるだろう。特に敏感な測定を扱う他の研究者は、代替の保存方法を探す必要があるかもしれない。
現在、この新技術は主に科学的可視化や高度なレンダリングなどの専門分野で関心を持たれている。しかし、自動車設計から医療イメージングまでの産業がより大きなスペクトルデータセットを生成し続けるにつれて、このような圧縮技術はそれらの巨大なファイルをより実用的に扱うのに役立つ可能性がある。
論文
- The Journal of Computer Graphics Techniques: Compression of Spectral Images using Spectral JPEG XL
参考文献