目次
■機械学習の中核であるディープラーニングは自動翻訳や画像認識など様々な分野に適用
●自動運転中には、自ら学習しながら成長するディープラーニングの応用が不可欠
AIの立役者であるディープラーニング(深層学習)は、ニューラルネットワークを多層化させてより複雑な処理を可能にした機械学習の総称です。自動翻訳や画像認識、音声認識、言語処理など様々な分野で活用されています。
AIを支える3つの要素である機械学習、ニューラルネットワーク、ディープラーニングについて、解説していきます。
●AI(人工知能)とは
AI(Artificial Intelligence)は、一般には「人間の知能、あるいはそれ以上の知能を機械によって実現したもの」「人間の知的営みをコンピュータに行わせるための技術」などのことを指しますが、厳密な定義はないようです。
現在実用されているAIの中心的存在は、ディープラーニングと呼ばれる機械学習です。ディープラーニングは、従来の機械学習にニューラルネットワークの技術を応用して開発されました。
以下に、機械学習とニューラルネットワーク、ディープラーニングの3要素について解説します。
●機械学習
機械学習は、人間が自然に行っている学習能力をコンピュータで実現しようとする、機械に自ら学習する機能を追加する技術、手法です。
機械学習は、2つのフェーズで構成されます。
・プログラムに大量のデータ(ビッグデータ)を入力、反復的に学習させてそこから規則性や判断基準となる数値を計算させます。
・その結果から、推論を行って新しい結果を導き出したり、未来予測を行います。
例えば、人は犬と猫の姿を見てこれまでの経験と知識から犬か猫かを容易に判別します。これとまったく同じように、コンピュータに膨大な犬と猫のデータを与えて自ら学習する機能を持たせたのが機械学習です。
●ニューラルネットワーク
ニューラルネットワークとは、人間の脳が情報を伝える仕組みをコンピュータプログラムで模倣した数学モデルで、機械学習の発展のキーとなる概念です。
人間の脳は、大量の脳神経細胞(ニューロン)が結合して次々に情報を伝達します。これによって、認知や学習、記憶、判断などの様々な機能を同時並行に行います。
ニューラルネットワークでは、データを入力すると「入力層」で処理され、その後「中間層(隠れ層)」にある多数のニューロンに送られます。中間層でも処理されたデータは、「出力層」に送られ、最後に結果が出力されます。この処理を繰り返すことで、認識・分類・予測・学習・会話といった様々なことが可能になります。
●ディープラーニング(深層学習)
機械学習にニューラルネットワークの技術を応用して開発されたのが、自動翻訳や画像認識など様々な分野に応用されているディープラーニングです。
ニューラルネットワークの中間層のニューロンの数を増やして多層構造にして、大量のデータから規則性や判断基準を見つけ出します。
従来の機械学習では、規則性を見つける際にあらかじめ目の付け所(特徴量)を指定する必要がありました。ディープラーニングでは、その特徴量を指定しなくても自動的に見つけることができます。
時間の短縮に加えて、機械学習の精度が上がり隠れた特徴が見つかるという大きなメリットがあります。
以下のような代表的な活用例があります。
・画像認識
画像や動画から文字や顔などの特徴を認識する技術で、顔認証や自動運転、感情分析など
・音声認識
Siriのような音声入力、あるいは音声のテキスト化、音声特徴から人の識別など
・自然言語処理
日常的に使う話し言葉や書き言葉を理解し、コールセンターの音声案内や機械翻訳など
・異常検知
機械に取り付けられたセンサーなどの時系列データから異常の兆候を検知
ディープラーニングは、ニューラルネットワークの中間層を多層化して情報伝達量と処理量を増やすことによって精度や汎用性を上げ、予測精度を向上させた機械学習です。
自動運転中に発生する様々な突発的な事象に対応するためには、自ら学習しながら成長するディープラーニングが不可欠です。
(Mr.ソラン)