F-nameのブログ

はてなダイアリーから移行し、更に独自ドメイン化しました。

画像処理(マルチメディア情報処理第5回)

私の友人の研究分野であるが、恐ろしいほどややこしいのがよく分かる。

 

柳沼良知。画像処理。コンピュータ上の色や画像の表現。
画像の表現の前に色とは。人が目で見ることの出来る光は可視光。電磁波の一種。電場と磁場が伝播していく。可視光は波長が長い方から赤橙黃などと変化。虹の7色。赤外線やテレビの電波。紫外線やX線。これらは電磁波の一種。光をどのように知覚?眼で見る。人の目には水晶体があり網膜上に光が。細胞。桿体は明るさを感じる。錐体、色を感じる。色を感じるための錐体には赤と緑と青の光に。3つの錐体からの信号の大小で色を感じる。たとえ周波数スペクトルが変わっていても同じ色であると認識。3つの光を使って制御すれば任意の色を感じさせることが出来る。全ての色を作り出せる光の三原色。赤と緑で黄色に。出力が同時にあった場合には黄色と感じる。色が変わっていく。赤と緑で黄色に。同様に緑と青でシアンに。青と赤でマゼンタに。赤と緑と青が合わさると白に。同時に出力がある状態。黄色と青を足すと白を作り出せる。黄色プラス青は赤と緑と青になる。2つの色を合わせて白に。補色。白を挟んで反対側に。赤はシアンの補色。緑はマゼンタの補色。光の三原色は重ねると明るくなる。多孔混色。コンピュータ上での扱い。通常は色を表す場合強度を1バイトで。256段階の情報の表現を。0から255。通常コンピュータでフルカラーの場合は256×256×256。最も鮮やかな赤は最大255。3つを並べて255、0、0。緑は0、255、0と。同様に青は0、0、255。黄色は赤と緑。255、255、0。シアンは緑と青。0、255、255。マゼンタ。青と赤。255、0、255。無彩色。白は赤と緑と青。255、255、255。プロは全て無いということで0、0、0。白と黒の中間を。127、127、127。明るい赤や暗い赤。赤が大きな値を取り緑や青が一定。255、127、127。全体的に数値が大きい。赤の値が小さく。127、0、0。
画像の表現。色を表す点を。hとw並べたものが画像に。点の集合として画像が。画素、ピクセル。画像データはデータ量が大きい。3バイトのデータで。フルハイビジョン。非圧縮で保存。1920×1080×3で6Mバイト。大きい。画像を保存する際にはしばしば圧縮処理が。白と黒の2色とする。左上から描画。4×5。データが並ぶ。白を0、黒を1とする。0と1で表現される。一方で別の表現方法も。画像の場合、最初に0が幾つか並ぶ。7個だったり6個だったり。0と1の数を交互に書くことで7652と表現できる。白や黒が長く続く場合には圧縮効果が高くなる。数を交互に書くような圧縮を行う場合完全に復元。可逆圧縮。色数を減らすことで画像のデータ量を減らすことも。フルカラーの色数を256に。3バイトを1バイトで。この場合はそれぞれの色番号に対応する表は別個保存する必要がある。データ量をほぼ3分の1に圧縮できる。本来存在していない院覚が出てしまう場合がある。非可逆圧縮。画像には様々な圧縮方式が。保存形式フォーマットも様々。画像のフォーマット。GIF。256色。色番号の部分は圧縮方式で。フルカラーを扱える。可逆圧縮。JPEG。元の画像を変えても、非可逆圧縮。主に画像の細かい構造の情報を落とすことで圧縮が。低周波成分。大まかな構造。元の画像の高周波成分。割り当てる情報量を削減することで圧縮。完全には復元できないが圧縮率が高い。分離するにはフーリエ変換を。音声波形を変換することで強度を。逆変換で元の信号に戻る。低周波成分のみを逆変換。画像でも同様に二次元のフーリエ変換。低周波成分に対応する部分のみをフーリエ逆変換。高周波成分を抽出。JPEGの場合は実際には違う変換。折り返し。上下左右に対象となる。コサインの定数のみで表現できる。画像フォーマットの使い分け。文字の色数は256色以下。文字のようなシャープな画像を保存するとノイズが。自然の風景をフルカラーで保存する場合。GIF形式だと色数を落とすことが必要。擬似的な輪郭が。通常はJPEGなどを。
画像の解像度。解像度とは画像のきめ細かさを。スキャナやプリンタ。画素数で。単位はGPI。一般に解像度が高いほど画質が良くなる。反面データ量は大きくなる。プリンタやスキャナの解像度。300や600。コンピュータのモニターで解像度は点の数。640×480。1024×768。フルHD。画像を画素の集合として。ラスタデータ。画像の表現形式。ベクタデータ。ベクトルデータ。図形は特徴的な点と線で。拡大や変形をしても滑らかさが保たれる。ドローソフトで利用。扱うソフトとして。UnixというOSで動作。グラフの作成でも利用。グラフの作成を行うソフト。
画像の処理。デジタルカメラやスキャナで。撮影時の照明などの条件でコントラストなどが再現できない場合が。画像の修正が必要。フォトレタッチソフト。商用のものやオープンソース。画像処理の例。色や明るさを変える。値を書き換えることで色や明るさを変える。ある画素の。値を変更。値を大きくすれば画像を明るく。値を小さくすれば画像を全体的に暗く。値をRの値のみ大きくすれば赤っぽくなる。RGBの値を直接。コンピュータ上の処理は容易に。色合いを表す。メイド。明るさ。彩度。色の鮮やかさ。色素への変換。変換の正確さを優先したものなど様々。色空間。コンピュータ上で簡単に計算。より複雑な変換式を使い人間の感覚に近いものを。色空間の中で色の修正を行いRGBに戻す。カラー画像を白黒の濃淡を持った画像に変換。濃淡画像。グレースケール画像。各画素の明るさを。画像を白と黒の2色の画像に変換。グレースケール画像を2値化して白と黒だけに。フォトレタッチソフトを行い変換できる。ソフトのバージョンなどで操作方法が変わる場合があるが、開くを選ぶことで画像の読み込みを行える。画像の表示の後にグレースケールにするとグレースケール画像に変換。色メニューの。2値化するための閾値を。エクスポートで保存形式を指定して保存を。どのような傾向があるか。ヒストグラム。画素の明るさなどを。グレースケール画像を対象とする場合に。画像が明るい方に暗い方に偏ると判断。明るさなどの補正を。トーンカーブ。斜め45度の線であったとする。明るさの変換を行う場合に元の明るさが100だった場合にぶつかったところが100。変化しないことを示す。トーンカーブがL字型。横軸が100のところを上に上がりぶつかると100より小さい。暗い部分がより暗く。横軸が150の場合は150より大。より明るくなる。L字型のトーンカーブで変換した場合はコントラストを強く出来る。
画像処理のもう少し複雑な。空間フィルタリング。ある画素の周辺の画素値を書き換える。画像は2次元に広がるが狭い範囲の情報を使い書き換えを。グレースケール画像を例に。明るさは0から255で。明るさを書き換える。X座標とY座標。周辺の画素の明るさを利用。全体で9画素が処理の対象に。ある画素の左上の明るさなどを足していった9画素分を足し合わせる。足したものを9で割る。ある画素の係数である9分の1。係数のみを取り出し行列で表現できる。フィルターを使うと処理の結果、どのような画像が。画素値の平均化を。平均化フィルター。3回繰り返す結果。平滑化されぼかしがかかっている状態に。繰り返しかけることでボカシが強くなる。空間フィルタリングの別の例。3×3で。係数を変えるフィルター。用いてどのような画像処理を?出力の絶対値。大きな値や小さな値。抽出フィルターとして働く。フィルターを掛けた結果の絶対値を取って。H抽出。画像検索などで。
コンピュータ上での色や画像の表現。トーンカーブや空間フィルタリングを用いた画像の処理手段。画像検索をイメージを表現できる場合と出来ない場合の検索手法や検索システムについて。

 

マルチメディア情報処理 (放送大学大学院教材)

マルチメディア情報処理 (放送大学大学院教材)

  • 作者:柳沼 良知
  • 発売日: 2020/02/01
  • メディア: 単行本(ソフトカバー)