前回では、単純パーセプトロンについて説明をしました。
(前回の記事はこちら、ディープラーニング超入門 第二回~ディープラーニングの仕組み①~ハイパーリンクの設定お願いします。)
単純な問題であれば単純パーセプトロンで解決できましたが、少し複雑になると解決できませんでした。(非線形分離問題は、単純パーセプトロンで解決できませんでした。)
前回では例として、図1、図2のような問題を考えました。
今回は、前回解けなかった図2の非線形分離問題について考えます。
前回でも触れましたが、白点と黒点を一本の直線で分ける場合、図1の場合は分離できますが、図2の場合は分離できません。では、どうすればよいでしょうか?
結論から言いますと、単純パーセプトロンではなく、図3のような複数のパーセプトロンを組み合わせると解くことができます。
第0層は入力層、第1層は中間層、第2層は出力層として考えてください。
単純パーセプトロンは、入力と出力といった機能だけであり、図3の第1層という中間層はありませんでした。この中間層を入れることで解くことができるのです。
このとき、s1はNANDゲート、s2はORゲート、yはANDゲートという振る舞いをすると、先ほどまで分離できなかった問題が解けます。
NANDゲート、ORゲート、ANDゲートの解説に関しては、こちらのサイトが非常にわかりやすいので、是非参考にしてみてください。
http://www.s-graphics.co.jp/nanoelectronics/kaitai/logicgate/3.htm
ここで、言いたかったことは、
第1層という、中間層を増やすと解ける!
ということです。
つまり、ディープラーニングとは中間層をたくさん(ディープに)増やすことで今まで解けなかった問題が解けるといったコンセプトに基づいています。
より複雑な問題を解くために、中間層をたくさん(ディープ)にしたものがディープラーニングです
以上のように、階層を深く(ディープ)にすることで、複雑な判断が必要な問題も解決できるようになります。
日常生活でディープラーニング技術が使われている例として、スマートフォンの顔認証ロックがあります。
人間の顔の判断・識別は様々な条件があり、今までの技術では解決できなかったのですが、ディープラーニングにより解けるようになりました。
少し複雑な部分もありましたが、ディープラーニングについての説明は以上です。
AIやRPA、チャットボットについてはこちらも併せてご覧ください。