8月, 2018 | SEO対策・ホームページ制作なら

こんにちは。株式会社マックスネット　人工知能・AI開発チームのIsoです。
今回は入門編からやや飛んで、強化学習にディープラーニングをプラスした「深層強化学習」の環境構築をしてみましょう。

＊＊＊＊＊＊＊＊＊＊

さて、今回はWindows環境で深層強化学習の環境を作るだ。

ディープラーニングを学習するのに最適な環境は、専用のubuntuマシンを作って、その中で動かしていく方法だ。
できれば、CPUではなくGPU。
ただ、簡単なコードであれば、多少時間はかかるが、CPUでも問題なく動くことが多いので、予算の少ない方やお試しで学んでみたい方にはCPU搭載マシンでも大丈夫だろう。

CPUマシンでいくのなら、昨今のＰＣスペックの増加により、あるOSの上に仮想環境を作って、その中でubuntuを回す方法でも十分に対処できる。

そこで、今回はwinマシンに仮想環境を作り、そこにubuntuを入れて、ゲームなどを自動で学習する深層強化学習の環境構築をしてみたい。

まず用意するのはWindowsパソコンの６４ビット。
３２ビットだとディープラーニングのフレームワークであるTensorFlowや Chainerなどを動かすのに手間がかかるので、ここは素直に６４ビットマシンを用意しよう。

そして、仮想化ソフトはvirtialBox、VMwareなどの有名どころのどちらかを用意する。

今回はVMwareを使用。

最新のバージョン14だとubuntu16のインストール時に画面が乱れてしまい、先に進むのに手間がかかりそうだったので、VMwareのバージョン12を選択して入れてみた。

まずOSであるubuntu16.04を公式サイトよりダウンロードして、パソコンのＣドライブ辺りに置いておく。

続いて、仮想化ソフトのVMwareをインストール。
ソフトのインストールが終わったら、ubntu16.04を指定して、OSのインストールを行う。

終了後にubuntuを起動してみよう。
VMwareを起動して、「仮想マシンの再生」をクリック。

すると、下記のようなubuntuのデスクトップ画面が現れる。

この画面上で、Ctrl + Alt + Ｔの同時押しをする。
すると、真っ黒のコンソール画面が現れるので、ここに各種コマンドを入れて進行していく。

まずpwdを打ち込んでみよう。ubuntu上での、今いる階層がわかる。
/home/ユーザ名
が表示されるはずだ。

お次に簡単なコマンドを、それぞれ入力してみよう。
mkdir
新しいディレクトリィを作る

mkdir test1
カレントディレクトリィにtest1フォルダができる。

cd test1
test1フォルダの中に移動する。

ls
フォルダの中のファイルなどを表示する。

ls -al
上記の内容を更に細かく表示。

vi sample.txt
sample.txtという名前のテキストファイルを作る。

このviとは、Linux系では有名なテキストを編集するソフトで、独特な編集コマンドがある。
詳しくは「vi 使い方」などで検索するべし。

cat sample.txt
先ほど作ったsample.txtの内容のみを表示する。編集はできないので、中身を見たい時だけ安心して見れる。

この辺のコマンドは結構頻繁に使う。
他にもいろいろなコマンドがあるので、ネットで検索しながら使ってみてほしい。

続きは次回へ。

2018年8月11日2018年8月27日

ニューラルネットワークをpythonで実装してみよう

>>> 本サイトのTOPはこちら。

こんにちは。株式会社マックスネット　人工知能・AI開発チームのIsoです。
今回はディープラーニングのニューラルネットワークを実装してみましょう。

＊＊＊＊＊＊＊＊＊＊

さて、今回はニューラルネットワークの順方向での最初の部分を実装してみよう。
まずはお決まりのニューラルネットワークの参照図です。

上記画像の赤枠の中を実装します。

x1とx2から出ている水色の線は「重み」を表しています。
これをW1とします。

また、オレンジの線はバイアスから出ているもので、これをB1とします。

Xからの入力値を２層目で受け取り、入力値と重みを乗じたものの総和を取り、バイアスを加えて、シグモイド関数を通して出力する。
この部分をpythonで実装してみましょう。

では、pythonコードです。

#シグモイド関数
def sigmoid(x):
    return 1 / (1 + np.exp(-x))

# Xに入力値を入れる
X = np.array([1.0,2.0])
# 重みに値を入れる
W1 = np.array([[0.1,0.3,0.5],[0.2,0.4,0.6]])
# バイアスに値を入れる
B1 = np.array([0.2,0.3,0.4])

# Xと重みの内積を出して、バイアスを加える
A = np.dot(X,W1)+B1
# Aをシグモイド関数に通す
Z = sigmoid(A)

#シグモイド関数

def sigmoid(x):

return 1 / (1 + np.exp(-x))

# Xに入力値を入れる

X = np.array([1.0,2.0])

# 重みに値を入れる

W1 = np.array([[0.1,0.3,0.5],[0.2,0.4,0.6]])

# バイアスに値を入れる

B1 = np.array([0.2,0.3,0.4])

# Xと重みの内積を出して、バイアスを加える

A = np.dot(X,W1)+B1

# Aをシグモイド関数に通す

Z = sigmoid(A)

どうでしょう。
上記を繰り返していけば、何層にも渡って、順方向のニューラルネットワークを作ることができます。
（最終層である出力層のところは、関数を通さずに、そのまま出力することが多いです。ここら辺はまた後ほど）

まずは上記のコードをよく読んで、ニューラルネットワークの基礎を習得しましょう。

2018年8月10日2018年8月10日

OpenCVで顔画像を切り取る

>>> 本サイトのTOPはこちら。

こんにちは。株式会社マックスネット　人工知能・AI開発チームのIsoです。
今回はディープラーニングの画像処理に使う、手元の画像データから顔認識をして、切り出す作業をやってみましょう。

＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊

さて、今回はOpenCVで顔画像を切り取ってみよう。

以前のブログでOpenCVで顔認識のpythonコードを書いてみたが、今回は描画された矩形の通りに顔画像を切り出してみたい。

切り出す画像はこちら。
画像処理のコードを書いている人にはおなじみのレナさん。

まずpythonコードはこちら。
わかりやすいように、行数を減らして最低限にしてみた。

# -*- coding: utf-8 -*-
import cv2

#読み込む画像
in_jpg = "./lena.jpg"
#切り取って保存する画像名
out_jpg = "./lenaCut001.jpg"

#画像を読み込み
image1 = cv2.imread(in_jpg)

#グレースケールに変換
image_gs = cv2.cvtColor(image1, cv2.COLOR_BGR2GRAY)

# 「./haarcascade_frontalface_alt.xml」をカレントディレクトリィに置くと確実
cascade = cv2.CascadeClassifier("./haarcascade_frontalface_alt.xml")

#引数についてはcascade.detectMultiScaleで検索
face_list = cascade.detectMultiScale(image_gs,scaleFactor=1.1,minNeighbors=3)

#ここで切り出し
if len(face_list) > 0:
    for rect in face_list:
        image_cut = image1[rect[1]:rect[1]+rect[3],rect[0]:rect[0]+rect[2]]

else:
    print("no face")

#切り出した画像を保存
cv2.imwrite(out_jpg, image_cut)

# -*- coding: utf-8 -*-

import cv2

#読み込む画像

in_jpg = "./lena.jpg"

#切り取って保存する画像名

out_jpg = "./lenaCut001.jpg"

#画像を読み込み

image1 = cv2.imread(in_jpg)

#グレースケールに変換

image_gs = cv2.cvtColor(image1, cv2.COLOR_BGR2GRAY)

# 「./haarcascade_frontalface_alt.xml」をカレントディレクトリィに置くと確実

cascade = cv2.CascadeClassifier("./haarcascade_frontalface_alt.xml")

#引数についてはcascade.detectMultiScaleで検索

face_list = cascade.detectMultiScale(image_gs,scaleFactor=1.1,minNeighbors=3)

#ここで切り出し

if len(face_list) > 0:

for rect in face_list:

image_cut = image1[rect[1]:rect[1]+rect[3],rect[0]:rect[0]+rect[2]]

else:

print("no face")

#切り出した画像を保存

cv2.imwrite(out_jpg, image_cut)

大筋で処理手順を書いてみると、
１, 画像を読み込み
２, グレースケールに変換（処理を軽くするため）
３, カスケード分類器にかける
４, 顔認識できた矩形を、カラー画像の方で切り取る
５, 切り取った画像を保存する

一般的には最後にMatplotlibなどを使って、画像を表示させることが多いのだが、AmazonのAWSなどを使っていると、遠隔で操作しているので、画像の表示作業が面倒になる。
そこで、画像を一旦保存して、その画像を手元のＰＣにダウンロードし、表示させる手順を想定している。

では、上記のコードを適当な名前で (testGazou.py) 保存して実行してみよう。

$ python testGazou.py

実行後、保存されたlenaCut001.jpgをダウンロードして、表示してみる。

どうでしょうか。見事に表示されましたか。

こういった画像を大量のデータにして、ディープラーニングを動かすわけですね。

2018年8月7日

ReLU関数をpythonで表示してみる

>>> 本サイトのTOPはこちら。

こんにちは。株式会社マックスネット　人工知能・AI開発チームのIsoです。
今回はディープラーニングによく出てくる、ReLU関数と呼ばれるものをグラフ化してみます。

＊＊＊＊＊＊＊＊＊＊

前々回にシグモイド関数というのが出てきたが、
今回はReLU関数というものを紹介しよう。

ニューラルネットワークの各層の出力部分には、非線形関数を入れるのだが、この関数はそのうちの１種。

このReLU関数を入れることで、シグモイド関数とは違う値を出力することができる。

まずこの関数をグラフ化したものがこちら。

ご覧の通り、０以下の値は全て０で出力され、０より大きい値は、入力した値がそのままグラフに出力される。

このReLU関数のpythonコードはこちら。

def relu(x):
... return np.maximum(0,x)

1 2	def relu(x): ... return np.maximum(0,x)

非常にシンプルなコードだ。

では、上記のグラフを書くためのコードを実装してみよう。
下記をpythonのインタプリタで実行する。

>>> import numpy as np
>>> import matplotlib.pyplot as plt
>>>
>>> def relu(x):
...     return np.maximum(0,x)
...
>>>
>>> x = np.array([-5,-4,-3,-2,-1,0,1,2,3,4,5,6,7])
>>> y= relu(x)
>>>
>>> plt.plot(x, y)
>>> plt.show()