ニューラルネットワーク損失関数の数値微分vs誤差逆伝搬法速度比較！ & 損失関数を「正解率」にしてみた！

検証内容
数値微分vs誤差逆伝搬法速度比較！
- 数値微分
- 誤差逆伝搬法
損失関数を「1-正解率」にしたらどうなるか！
結論

検証内容

書籍『ゼロから作るDeepLearning』で気になった内容を検証します！

ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装

作者:斎藤康毅
オライリージャパン

Amazon

書籍サンプルコード：

GitHub - oreilly-japan/deep-learning-from-scratch: 『ゼロから作る Deep Learning』(O'Reilly Japan, 2016)

データ：MNIST手書き文字 train:1000, test:300件に絞り込み

実行ファイル：deep-learning-from-scratch\ch04\train_neuralnet.py

変数gradで呼び出す関数を変更して検証！

数値微分vs誤差逆伝搬法速度比較！

数値微分

損失関数の微分算出：two_layer_net.py\def numerical_gradient(self, x, t)

【計算速度】

4080秒/30iters = 136秒/iter

【性能】

test acc：38.7% @30iters

誤差逆伝搬法

損失関数の微分算出：two_layer_net.py\def gradient(self, x, t)

【計算速度】

1秒/100iters = 0.01秒/iter

【性能】

test acc：39.7% @30iters

【実行結果】

損失関数を「1-正解率」にしたらどうなるか！

書籍4.2.5章「なぜ損失関数を設定するのか？」の内容について検証します！

損失関数の微分算出：two_layer_net.py\def numerical_gradient_acc(self, x, t)（自作）

def numerical_gradient_acc(self, x, t):
#正解率を損失関数にしてみる
loss_W = lambda W: self.loss_acc(x, t)
grads = {}
grads['W1'] = numerical_gradient(loss_W, self.params['W1'])
grads['b1'] = numerical_gradient(loss_W, self.params['b1'])
grads['W2'] = numerical_gradient(loss_W, self.params['W2'])
grads['b2'] = numerical_gradient(loss_W, self.params['b2'])
return grads

def loss_acc(self, x, t):
y = self.predict(x)
return accuracy(y, t)

def accuracy(y, t):
y = np.argmax(y, axis=1)
t = np.argmax(t, axis=1)
accuracy = np.sum(y == t) / float(y.shape[0])
return 1 - accuracy

【性能】

test acc：8.0% @30iters

結論

・誤差逆伝搬法は数値微分と比べて計算速度が一万倍以上！

・損失関数を「1-正解率」にすると学習が進まない

検証内容

数値微分vs誤差逆伝搬法 速度比較！

数値微分

誤差逆伝搬法

損失関数を「1-正解率」にしたらどうなるか！

結論

数値微分vs誤差逆伝搬法速度比較！