Citation

@InProceedings{10.1007/978-3-030-00665-5_161,
author="Ayoobkhan, Mohamed Uvaze Ahamed
and Chikkannan, Eswaran
and Ramakrishnan, Kannan
and Balasubramanian, Saravana Balaji",
editor="Pandian, Durai
and Fernando, Xavier
and Baig, Zubair
and Shi, Fuqian",
title="Prediction-Based Lossless Image Compression",
booktitle="Proceedings of the International Conference on ISMAC in Computational Vision and Bio-Engineering 2018 (ISMAC-CVB)",
year="2019",
publisher="Springer International Publishing",
address="Cham",
pages="1749--1761",
abstract="In this paper, a lossless image compression technique using prediction errors is proposed. To achieve better compression performance, a novel classifier which makes use of wavelet and Fourier descriptor features is employed. Artificial neural network (ANN) is used as a predictor. An optimum ANN configuration is determined for each class of the images. In the second stage, an entropy encoding is performed on the prediction errors which improve the compression performance further. The prediction process is made lossless by making the predicted values as integers both at the compression and decompression stages. The proposed method is tested using three types of datasets, namely CLEF med 2009, COREL1 k and standard benchmarking images. It is found that the proposed method yields good compression ratio values in all these cases and for standard images, the compression ratio values achieved are higher compared to those obtained by the known algorithms.",
isbn="978-3-030-00665-5"
}

どんなもの?

画像の可逆圧縮。機械学習でピクセルの値を予測する予測器を作り、予測との誤差を出力とする。

先行研究と比べてどこがすごい?

従来の手法は、 transformation, data-to-symbol mapping, encoding という流れだった。例えば、 DCT, Run-length, Huffman みたいな。

本論文では、分類、予測、エンコード、の流れとする。

って書いてあるけど、参考文献に挙げている心電図信号に対する圧縮手法が、まんまこの論文のやり方な気するんだが?

技術や手法のキモはどこ?

  • 特徴抽出: 形状検出系
    • コンターレット変換 (要調査)
    • フーリエ記述子 (画像ひとつに対してグローバルな形状っぽい)
  • 分類器: Fuzzy c-Means (要調査)
  • 予測器: 周辺ピクセルを入力とした3層ニューラルネット
  • エンコード: ハフマン符号化

どうやって有効だと検証した?

(評価の情報量が少なすぎて、まったくわからん)

Size of original image (Bytes) / Size of compressed image (Bytes)

いったい original とは? BMP なのか JPEG なのか? ヘッダーは含まれるのか? compressed に学習済みモデルは含まれるのか?

比較対象

  • CALIC: 「水平,垂直の勾配により予測式を選択」らしい
  • ETC: 暗号化後に圧縮することを考慮した圧縮アルゴリズムなので、ハンデでしょ。
  • RPC: これも暗号化込み。めちゃくちゃ低解像度の画像から送り付けるプログレッシブ方式。

議論はある?

グレースケールでしか試していないらしい。

次に読むべき論文は?