物体の質感予想に使えるGLCM

2019年10月07日

4年の岡部です。夏が終わりようやく涼しくなってきた近頃、皆様はいかがお過ごしでしょうか。

私は現在「画像認識による触覚の予想」をテーマに卒業研究に取り組んでいます。 研究を進めていくにあたって、コンピュータに画像の触覚を予想させるために重要と思われる同時生起行列(Gray Level Co-occurrence Matrix, 以下GLCM)について勉強したので、ここで紹介したいと思います。

木目やタイル、砂利などの規則的パターンによって構成される画像のことをテクスチャと呼びますが、そのテクスチャが持っている性質を表す指標の一つがGLCMです。

img 図1:テクスチャの例

GLCMは、グレースケール化(RGBの色素の値をそれぞれ決められた値によって重みづけし、カラー画像をモノクロ化する処理)を行った画像に対して明るさのレベルを段階分けして、画素同士の位置関係を行列に表すことによって求められます。

img 図2:GLCMのイメージ

図2のサンプルフィルタウィンドウにおける1~4の数字は、画素ごとの光の強さを示す256段階の数値を4分割(0~63をレベル1、64~127をレベル2…といった感じ)したグレーレベルを示しています。 画像内の各画素について、該当する画素のグレーレベルと指定の位置関係(図2左側においては右隣)にある画素のグレーレベルをそれぞれ行列内にカウントしていきます。図2において、グレーレベル2の画素の右隣にグレーレベル3の画素が位置しているのは4箇所あるので2行3列の値は4になっています。 さらに同様の手順を各画素の左隣に対して行った結果を加えたものが図2の右側になります。 これによって画像内のx軸方向においてどれくらいの頻度で似たようなグレーレベルの変化が表れているかを知ることができます。

img 図3:確率表記されたx軸方向の同時生起行列

また、得られた同時生起行列の各要素について総カウント数で割って確率表記することでよりわかりやすくなります。 同時生起行列を使った研究の数が多く、自分の研究にも役立つ部分が大きいです。現在はこれをプログラムによって出力することを目標にしています。