実践OpenCV 4 for Python
画像映像情報処理と機械学習
著者 | 永田 雅人/豊沢 聡 |
---|---|
判型 | B5変型、400頁 |
ISBN | 978-4-87783-460-9 |
価格 | 本体4,200円 |
発行日 | 2021年1月20日(初版 第1刷発行) |
備考 | ダウンロードサービス:学習に使えるサンプルファイル |
本書について
OpenCV(Open Source Computer Vision Library)は、コンピュータビジョン技術を扱いやすいプログラミングライブラリとして提供するオープンソースソフトウェアです。シンプルなので、初学者でも容易にプログラムを作成できます。高水準なAPIにより、拡張や保守が楽になる簡潔なコードが書けます。しかも、おなじ機能を自分で実装するよりたいていは高速です。先進技術をつねに追っているので、ディープラーニングのような旬な技術も利用できます。画像認識の研究開発者なら、基本的な処理はOpenCVに任せ、問題解決に本質的なアルゴリズムに専念できます。
OpenCVにはC++インタフェースもありますが、本書のターゲットはPythonです。処理速度はC++にかないませんが、C++でできることはほとんどPythonでもできます。そして、スクリプト言語であるPythonのほうが気楽に始められます。
本書では、Python版OpenCVをサンプルプログラムに沿って学びます。各節は、冒頭で設定した課題を達成することを目指したシンプルなサンプルを中心に構成しています。コードはいずれも全行を掲載してあるので、わからなくてもとりあえず動かして楽しめます。どんなに長くても100行もありませんから、読むのもそうむずかしくはありません。そのあとは、プログラムの調整や改良をつうじて、OpenCVの扱いかた、各種アルゴリズムの利用方法、リファレンスマニュアルに慣れ親しんでください。本書を読み終えれば、ユニークなコンピュータビジョンアプリケーションが作成できるようになっているでしょう。
コンピュータビジョンの対象は何気なく接している身近なシーンが主なので、結果がわかりやすく、趣味のプログラミングとしても、より深い研究テーマとしても楽しめるテーマだと思います。本書がコンピュータビジョンやプログラミングの入り口となれば幸いです。
電子書籍は下記のサイトからご購入できます
目次
- 第1章 OpenCVについて
- 1.1 OpenCVとは
- 1.2 OpenCVの応用例
- 1.3 画像の構造
- 1.4 映像の構造
- 第2章 画像・映像の入出力
- 2.1 画像ファイルの表示
- 2.2 エッジ検出と画像の保存
- 2.3 NumPy配列の作成
- 2.4 ビデオファイルの表示
- 2.5 ビデオファイルの2値化処理と保存
- 2.6 カメラ映像の反転表示
- 2.7 カメラ映像の平滑化と保存
- 2.8 ビデオ属性とビデオシャッフリング
- 第3章 ユーザインタフェース
- 3.1 グラフィックス描画
- 3.2 キーボード操作とコマ撮り
- 3.3 トラックバー操作
- 3.4 マウス操作とペイントアプリ
- 3.5 マウス操作とミニチュア風映像
- 3.6 マウス操作と射影変換
- 3.7 処理時間とモルフォロジー演算
- 第4章 チャンネルとマスクの処理
- 4.1 色の分離と合成
- 4.2 HSVとポスタリゼーション
- 4.3 マスクとクロマキー映像合成
- 第5章 画像の演算
- 5.1 ピクセル操作と点描化
- 5.2 浮動小数点数型画像
- 5.3 移動物体の抽出
- 5.4 畳み込み演算
- 5.5 トランジション
- 第6章 画像情報の取得
- 6.1 ヒストグラム
- 6.2 DFTと周波数フィルタリング
- 6.3 DCT情報圧縮
- 6.4 オプティカルフロー
- 第7章 画像情報による物体認識
- 7.1 テンプレートマッチング
- 7.2 2次元ヒストグラムと類似画像検出
- 7.3 特徴点抽出と特徴量のマッチング
- 第8章 ディープラーニングによる物体認識
- 8.1 概要
- 8.2 画像のクラス分類
- 8.3 顔の領域推定
- 8.4 一般物体のクラス分類と領域推定
- 付 録
- 付録A Windows OpenCV環境構築
- 付録B Mac OpenCV環境構築
- 付録C Visual Studio Codeのインストール
- 付録D モデルファイル
- 付録E ディープラーニングモデル作成プログラム
- 付録F 参考文献