京都大学ELCAS(エルキャス)

実施レポート

[専修コース]映像情報処理

情報学研究科 知能情報学専攻

2016年7月24日 14:30〜18:00

  • 実施場所

    吉田キャンパス 学術情報メディアセンター南館4階

  • 当日の講師

    飯山将晃 准教授

  • チューター

    薗頭元春、岡田真太郎

  • 実習の内容

    人物追跡ロボットの評価実験を行う。実験で撮影した動画像を編集してデモビデオを作成する。発表に備えて研究の要点をまとめ、スライド資料を作成する。

  • 映像情報処理_実習風景デモビデオを作成する
  • 映像情報処理_実習風景研究の内容をスライドにまとめる

受講生の感想

  • 自宅で完成させてきたロボットのデモを、無事撮影することができて安心しました。自分はどうやら自宅での作業が一番得意な方ではないかと最近思い始めました。また、プレゼンスライドの宿題を飯山先生にチェックしていただきました。研究発表のスライドを作る上での注意をいろいろいただくことができたので、本当に勉強になりました。その後は、スライドの手直しと今後の打ち合わせを行いました。8月の発表と論文締め切りまで、スライドと論文の完成を目指して頑張りたいと思います。今日で合宿を除いて最後のELCASでしたが、やはりたったの半年間ですから、一瞬で過ぎてしまったように感じました。短い期間でしたが、本当に多くのことを学ばせていただいた、濃い半年だったように思います。ありがとうございました。
  • 今回は、プレゼンテーションのまとめ方について学んだ。プレゼンテーションでは、できるだけわかりやすく簡潔にまとめることが大切だ。何も知らない他人が見てもわかるような文章を書くのは難しい。このことは、意識していないとつい見落としてしまう。あと1ヶ月もたたないうちに成果発表会があるので、わかりやすい発表を目指して練習していきたい。

2016年7月16日 14:30〜18:00

  • 実施場所

    吉田キャンパス 学術情報メディアセンター南館4階

  • 当日の講師

    飯山将晃 准教授

  • チューター

    薗頭元春、岡田真太郎

  • 実習の内容

    成果発表に向けて,研究の背景・目的・技術的問題点・解決策・評価方法を整理する.プレゼンテーションの構成を検討する.評価に向けて,人物追跡ロボットの調整を行う.

  • 映像情報処理_実習風景発表のために研究の要点をまとめる
  • 映像情報処理_実習風景ロボットを動かしつつ調整する

受講生の感想

  • 今回は、プレゼンや論文の構成について学んだあと、ロボットのプログラムを改良していった。今まで学校の授業などでスライドを作るときは何も考えずに書いていたが、どんな内容をどれだけ書くのかをしっかり考えてから書くと良いというのがわかった。プログラムでは、主に人物の識別を行っていった。今までは視野の中に一人しかいないことを前提としてプログラムを書いていたが、今回は複数の人が現れた時の対処法について考えた。まだロボットに実装できていないが、次回までに実装して、検証を行っていきたい。
  • 前半は、プレゼンと論文に向けて、今日までの研究の整理をしました。技術的困難さ、目的、研究背景などは、ある程度スムーズに固めることが出来ました。研究用に作ったノートに、定期的に研究を整理していたので、役に立ったと思います。
    プレゼンを作るために必要な、評価の部分ができていなかったので、後半は、プログラムの完成と評価を目指して作業を行いました。自宅でほぼ完成したプログラムを作ってきていたので、あとはルンバに対応させて完成だと考えていたのですが、普段ソフトウェアプログラムばかりしているからか、ハードウェア特有のバグに阻まれて、あまりうまくいきませんでした。アルゴリズム自体は完成しているので、次回最終回に向けて、今回はルンバも持って帰って、しっかしデバグしてきたいです。
    また、プレゼンの技術的困難さのスライドの草案を作る担当になったので、これまでの研究をもう一度深く振り返っておきたいと思います。

2016年6月26日 14:30〜18:00

  • 実施場所

    吉田キャンパス 学術情報メディアセンター南館4階

  • 当日の講師

    飯山将晃 准教授

  • チューター

    薗頭元春

  • 実習の内容

    全方位カメラを用いたパノラマ画像の生成と,その画像を用いた人物追跡の頑健化について検討する.全方位カメラを搭載することでロボットを拡張し,パノラマ画像を利用して人物追跡アルゴリズムを改良する.研究発表について計画を立てる.

  • 映像情報処理_実習風景全方位カメラによるパノラマ画像撮影について学習する
  • 映像情報処理_実習風景全方位カメラを人物追跡ロボットに搭載する

受講生の感想

  • 発表と論文に向けて、研究をまとめていこうという段階になりました。ASUSのカメラを使った顔認識が成功した時の処理はほぼ完成したので、RICHOの360度カメラを使って、人物を見失った時のプログラムを完成させていきたいです。自分は、魚眼レンズで撮影した画像の歪みを補正する手間が惜しかったので、元画像の特性を活かしたプログラムを組むことにしました。次回まで少し時期があるので、家でできる部分はしっかり完成させておきたいです。
  • 今回は全天球カメラを使って、ロボットの視野を広げることを目標とした。全天球カメラは、本来球形であるはずの被写体を2枚の円形の画像に投影しているので、プログラムで補正をかけなければいけなかった。紙の上で数式を立てて実際にプログラムを作ってみたが、思ったように補正されなかった。最終的にはロボットの周りにいる人の存在がわかれば良いので、わざわざ補正する必要はないかもしれない。次回までに、人の方向がわかるくらいにはしておきたい。

2016年6月18日 14:30〜18:00

  • 実施場所

    吉田キャンパス 学術情報メディアセンター南館4階

  • 当日の講師

    飯山将晃 准教授

  • チューター

    薗頭元春、岡田真太郎

  • 実習の内容

    プログラミング言語Pythonによって,動画像に基づく人物追跡を実装する.カメラ付きラップトップPCとRoombaを組み合わせたロボットを用いて,実装したアルゴリズムを検証する.ロボットの最適な動作のためにアルゴリズムのパラメータを調整する.

  • 映像情報処理_実習風景人物追跡のためのアルゴリズムについて議論する
  • 映像情報処理_実習風景ロボットによる人物追跡を行う

受講生の感想

  • 今回はPID制御を使ってルンバを制御し、人の顔を追跡するプログラムを作った。前回は単なるタイヤのON/OFFだけで制御していたが、今回は速さの調節も行った。PID制御では、比例・積分・微分の性質を利用している。比例制御だけでもある程度正確に追跡でき、積分制御を加えると更に正確になった。しかし、微分制御は、少し定数を変えるだけで動作が大きく変わった。どの制御においても、定数の見極めは難しかった。次回からは全方位カメラを使って新たな制御方法を考えていきたい。
  • ルンバとカメラを組み合わせた本格的な人物追跡のプログラムを書き始めました。前回の最後に、顔認識を利用して、回転するプログラムと、前進後進するプログラムを作っていたので、その2つを組み合わせれば、ほぼ完成するだろうと思っていましたが、やはり、それぞれのプログラムの精度を向上させなければ、全く思い通りに動きませんでした。
    そのため、今回は、プログラムの改良で終わり、あまり進みませんでした。

2016年5月21日 17:30〜19:00

  • 実施場所

    吉田キャンパス 学術情報メディアセンター南館4階

  • 当日の講師

    飯山将晃 准教授

  • チューター

    薗頭元春、岡田真太郎

  • 実習の内容

    プログラミング言語Pythonによるロボット制御について学ぶ.RoombaとラップトップPCを組み合わせてロボットを構築する.作成したロボットを遠隔的に操作したり,プログラムに基づいて自律的に動かす実習を行う.

  • 映像情報処理_実習風景RoombaとラップトップPCを組み合わせてロボットを作る
  • 映像情報処理_実習風景ロボットを手元のPCから遠隔的に操作する

受講生の感想

  • ルンバの制御を学び、これまでの人物認識などのカメラ制御との組み合わせを試しました。人物の顔の位置をもとにその方向を向くプログラムと、顔の距離をもとに近づいたり遠ざかったりするプログラムを組みました。カメラの角度が少しずれただけで全く見当違いの動きをしてしまい、細かいところに気を配る必要があると感じました。総合的にどういったものを作るかはまだ検討中ですが、専修コースの開始当初に比べると、実際にモノを触ってみた分、何か面白いものが思いつけそうな気がします。
  • 今回はパソコンを使ってルンバを動かした。電子工作をするときにシリアル通信を使ったことはあったが、ルンバとの通信にも使えるというのは驚きだ。オンライン上でパソコンの同期をとるのは慣れないところもあったが、使えるようになると便利だった。今回は誤作動が多かったが、ロボット制御ではちょっとしたプログラムの工夫でうまく動くことも多々あるので、いろいろな方法を試していきたい。

2016年5月7日 14:30〜18:00

  • 実施場所

    吉田キャンパス 学術情報メディアセンター南館4階

  • 当日の講師

    飯山将晃 准教授

  • チューター

    薗頭元春、岡田真太郎

  • 実習の内容

    HOG特徴量による人物検出について学ぶ.Haar特徴量による顔検出について学ぶ.Pythonによるプログラミング実習を行う.

  • 映像情報処理_実習風景HOG特徴量について学ぶ
  • 映像情報処理_実習風景顔検出のプログラミング実習を行う

受講生の感想

  • 画像から人物や猫を検出する仕組みを学びました大量のデータを元に高次元空間に超平面の境界を設定する話と、次元を増やして境界が引けるように工夫する話が面白かったです何年前の技術はどうこうだったけど今はこうで、のような話が度々出てきたので、今進歩している分野なんだと感じました。人物・顔検出を使ってどんなことができるか楽しみです。pythonでOpenCVを使って進めていますが、C++の方でも練習しようと思います。
  • 画像から人物を検出するとき、微分や勾配の考え方を使うのは、実用的で応用が効く方法だと思う。ただ、コンピュータに求める計算量が相当な量なので、やや力技のような気もする。ある一枚の画像から検出するときの計算量は筆算では一日かかっても終わらないくらいだ。この方法はコンピュータの性能の向上があってのことだったのだろう。
    また、顔の検出の精度の高さには驚いた。紙に書いた似顔絵にも反応できた。しっかりとした機能をプログラミングすれば、監視カメラも簡単にできるだろう。監視カメラが一家に一台という日も来るかもしれない。今日学んだことを使って家で遊んでみたい。

2016年4月16日 14:30〜18:00

  • 実施場所

    吉田キャンパス 学術情報メディアセンター南館4階

  • 当日の講師

    美濃導彦 教授、飯山将晃 准教授

  • チューター

    薗頭元春、岡田真太郎

  • 実習の内容

    計算機による映像情報処理の基礎について学ぶ.プログラミング言語としてPythonを用いて,RGB・深度カメラを用いた基礎的な映像情報処理の実習を行う.画像特徴に基づく人物検出について学ぶ.

  • 映像情報処理_実習風景Pythonによるプログラミングを学ぶ
  • 映像情報処理_実習風景計算機上でカメラからの映像の取得を行う

受講生の感想

  • 映像情報処理の基本や,いくつかの技術を学んで,技術の選択が重要だと思った.色情報を用いるのか,遠近の距離情報を用いるのか,逆に用いない方がベターなのか.また,機会に学習させるという選択もあって,よく考えて練ってから研究する必要があると思った.PythonとOpenCVはほぼ使ったことがなかったので,早く慣れられるように練習したい。
  • 普段私たちが何も考えずに行っている「見る」という動作は機会にとってはすごく難しいことがわかった.画像処理の中では微分が非常に有効だった.遠さを調べるカメラも使いやすそうだった.変わりゆくものの中に不変を見つける画像処理は,まさに「情報」の核心をつく技術だと思った。

平成28年度 実施レポート

過去の実施レポート