茶屋ストレージ

プログラミングの成果物を紹介するサイト

機械学習を使ってO-map風画像を生成するプログラムを作ってみた結果,ヌード画像の話,機械学習の勉強方法など

Lena&O-mapped-image

Style Transfer(画風変換)技術を使ったO-map風画像の生成

結論:任意の画像をO-map風に書き換える人工知能を作ってみた.

この記事に関する結論と成果物は上述の見出しと掲載画像に尽きる.

ただ,何点かこれに関して得た気づきや話のネタになるようなことがいくつかあるなと思ったのでそれをまとめてみようと思った次第. GWの暇つぶしにどうぞ.

 

この人工知能は何をしているの???

この人工知能がやっていることは「学習用の画像から画風を学習し,その画風に従って入力画像を書き替えている」と言うことである.(厳密なアルゴリズムではなく抽象的な表現になってしまうのはご了承いただきたい.)

元の研究ではピカソ葛飾北斎といった世界的な画家の作品から画風を学んだ後,風景画像などにその画風を適用してあたかもその画家に書かれた作品のような画像を出力している.今回取り組んだことは世界的な画家の作品ではなく実存するO-map画像を学習用データとして与えてみたというものである.

特に下段中列に設置した画像はO-map独特の緑色,A藪を彷彿とさせる白色の領域,等高線を彷彿とさせる茶色の曲線が画像全体に分布しててO-mapっぽい.(ものすごく走りにくそう...)

上に掲載した3パターンの出力の元になったO-mapはそれぞれ異なったものを使っている.学習に使うO-mapによって出力されるものは全然違うなということがわかる.

参考:

qiita.com

 

この人工知能はどうやって実装したの???

論文を読み解いて自分で1からアルゴリズム実装と機械学習用のデータ収集,機械学習に必要なスペックを兼ね備えたマシン調達など諸々四苦八苦して作りました!と言えればドヤ顔できるかもしれないけど,実は全くそんなことない.

誰もが無料でアクセス可能なインターネット上にある機械学習の実行プラットフォームにアクセスし,そこに用意されていたサンプルコードを動かした,というだけである.

例えて言うなら前者が原材料を揃えるところから始めるラーメン作り,後者はお湯を注いで作るインスタントラーメン作りといった具合.(少しカスタマイズしているので厳密にはお湯を注ぐだけでは無い.チキンラーメンに生卵をトッピングするくらいの工夫はしている.)

 

「小麦から作るのか?」   日本テレビ,鉄腕DASHより引用

「小麦から作るのか?」 日本テレビ鉄腕DASHより引用

 

「なーんだ,インスタントラーメン作ってるだけか」と興醒めされるかもしれないけど見方を変えれば「こんなことが誰でも簡単にできる時代になってるの?!」とも言える.

 

突然だが「Google Scholar」というGoogleのサービスを使ったことがある人はいるだろうか?これはパプリックインターネット上にある学術論文あるいはそれに類する情報を検索するサービスで人類の未知に挑戦する現代の科学者にとってはなくてはならないサービスである.そのGoogle Scholarのミニマルなトップページにアクセスするとこんな一文が書いてある.

巨人の肩の上に立つ

これは誰もが知る科学者アイザック・ニュートンが1676年にロバート・フックに宛てた書簡で用いたとされる言葉である.偉大な先人たちの業績,先行研究などを巨人に喩えて,現在の学術研究の新たな知見や視座,学問の進展といったものもそれらの積み重ねの上に構築され,新しい知の地平線が開かれることを端的に示した言葉とされている.世界中にある論文のデータベースとも言えるGoogle Scholarにこの一文が添えてある意味はGoogle Scholarが科学者たちにとっての巨人としての役割を果たすぞ!という姿勢が現れているんじゃないだろうか.この姿勢にあやかると,今回のインスタントラーメン作りも先人の知恵を拝借した新たな地の開拓ともいえなくもない.

 

参考:

www.tensorflow.org

Google Scholar : https://scholar.google.co.jp/

 

この人工知能は何に使えるの?

わからない.正直,エンターテイメントの域を超えた実用的な用途は無いだろうなというのが個人的な考え.

 

ただ,「Google Mapから切り出した市街地の地図及び航空画像などの地理データを入力として与えたら,その地帯のO-mapを出力する」みたいなことができるとO-mapの半自動生成といった実用的用途が生まれるかもしれない.

ただしこれは今回の「学習画像の画風を移植する」というアイデアだけで実現するのは難しく,実際は「どこに何が写っているのか」といったアノテーションを追加付与する工夫が必要そうである.

日本の矢板など広範囲な領域がO-map化された地帯は世界中にたくさんあるので,現存するそれら地帯の地理データとO-mapを使って学習すれば未開の地のO-map自動生成ができるようになるかもしれない.(訓練データとして,ある地帯Xに関する地理データ+地帯XのO-mapデータを与え,テストデータとしてある地帯Yの地理データを与えることで地帯YのO-mapデータを生成するということは理論上可能なはず)

また,画像処理研究の成果の一つ,自己位置推定と周辺環境認識を組み合わせたSLAMと呼ばれる技術は3D空間のマッピングをすることができる.十分な地理データが存在せず,航空写真もほぼ使えない鬱蒼とした山林でもカメラ一つ片手に歩き回るだけで,その地帯の3Dマッピングができる,という未来も来るかもしれない.

 

jp.mathworks.com

 

そもそもこの画像って何よ?

この画像はLena(レナ)と呼ばれる女性のヌード写真を切り取ったもので画像処理研究の世界では慣習的に使われている画像である.

「なんでこの写真データが画像処理研究において慣習的に使われるようになったか?」というとどうやらある研究機関で画像データが欲しかった時に,手元にあった週刊誌から人の顔が写った画像を拝借したものがこれだったという経緯らしい.

歴史はちょっとしたことから作られるんだなあという一例だと思う.

 

ここ数年で高度な画像処理技術が日常生活でも使われるようになっており,その枚挙にはいとまがない.例えば現代のデジタルカメラは被写体の表情を認識するし,今流行のリモート会議ツールZoomでは「バーチャル背景を設定する」という機能を実現するために「Zoom会議参加者が写っている領域と背景領域を区別する」という技術が使われている.VTuberは”中の人”の挙動や顔の表情を認識してそれを仮想的なキャラクターに再投影する技術が使われている.(映像は画像が連結したもの捉えると画像処理の問題である.)

画像処理に関する数々の基礎研究・応用研究と社会実装には女性のヌード写真が絶大な貢献をしていたのである.ちなみにGoogleで検索すると元になった全身画像を見つけることができるがなかなかセクシーである.

ja.wikipedia.org

 

機械学習の勉強は鮮度が大事

趣味・暇つぶしとして機械学習ができたら面白いなと思い何冊か本を買ってトライしてみたが「サンプルコードを実行できない」という壁に何度もぶつかりそれを乗り越えるのに非常に非常に苦労してしまった.自分の手で動かして試すことができないというのはこの手の勉強においてはモチベーション維持に致命的に影響することであり無視できない問題である.

これは機械学習に限った話ではなくIT全般に当てはまる話であるが,コンピュータプログラムの実装と実行には利用するハードウェア,OS,ライブラリ,直接利用はしないけど依存関係上必要なライブラリ,それらのバージョンといった様々な要素が揃っていないとうまくいかないことが多く,技術の進展が早い機械学習分野ではそれがとても顕著に現れていると感じた.

 

機械学習の勉強,特に実装に関する勉強は情報のアップデートについていけない書籍ではなくインターネット上にあるコンテンツをうまく使ったほうが良いということを今回痛感した.ただ,機械学習の歴史や基礎的な前提,先端技術の基礎となったアルゴリズムなどを知るという意味では書籍もそれなりに有用である.

www.asakura.co.jp

ICMR2018で観客を釘付けにしたGPSトラッキングシステムを作りました.

 

f:id:ch-antifragile:20190320173818p:plain

インカレリレー当日のGPS中継の様子
 
はじめに
今般,GPSラッキングシステム「O-GPS Tracker」を開発し2019年3月のインカレリレー(ICMR2018)にて使っていただきました.
私はエンドユーザの触れるウェブページの設計と実装、GPS端末から取得したデータの情報処理を担当しました。
インカレリレーが本番稼働だったのですが,当日は大きなトラブルもなく会場にいた多くの方や遠隔で競技を観戦していた方は本システムを通じたインカレ観戦を楽しんでいただけたのではないでしょうか.
 
この記事ではこのGPSラッキングシステムを簡単に紹介し,ついでにICMR2018の時のことを振り返ろうかなと思います.
 

オリエンテーリング競技 中継補助ツール 「O-Live Supporter」(MacOS版)

f:id:ch-antifragile:20180922172300p:plain

インカレスプリント・ロング2018で使われた

オリエンテーリング競技 中継補助ツール「O-Live Supporter」の紹介です.

 

従来のプラスチックボードを使った結果速報ボードを廃止,また,大型ディスプレイの使用を演出の軸としていた今大会では,競技者の速報や選手権クラスのフィニッシュ情報(ランキング)の発信に使われました.

 

今回のツールはMacOS用に開発されていますが,過去にはWindows版で同様のツールも作っていました.

ツールに興味があるという方は,管理人までご連絡くださいませ.

 

◆ツール利用例

f:id:ch-antifragile:20180921055021p:plain

 

続きを読む