令和 4 年度 第 1 次試験問題 経営情報システム 第十五問 解答と解説

解答

 

3.

 

解説

 

機械学習についてです。こちらも、問題文を通じて説明していきましょう。が、その前に機械学習についての定義を調べておきましょう。ちなみに、英語ではmachine learningです。以下、Wikipedia の通り、人工知能の一種の考え方であり、「経験からの学習により自動で改善するコンピューターアルゴリズムもしくはその研究領域」です。

機械学習(きかいがくしゅう、machine learning)とは、経験からの学習により自動で改善するコンピューターアルゴリズムもしくはその研究領域で人工知能の一種であるとみなされている。「訓練データ」もしくは「学習データ」と呼ばれるデータを使って学習し、学習結果を使って何らかのタスクをこなす。例えば過去のスパムメールを訓練データとして用いて学習し、スパムフィルタリングというタスクをこなす、といった事が可能となる。

機械学習は以下の分野と密接に関係する:

機械学習という名前は1959年にアーサー・サミュエルによって造語された

 

機械学習タスクの種類

機械学習のタスクは、以下の代表的な3種類のカテゴリーに分けられる。ただしこれらの3つで機械学習で扱う全てのタスクをカバーしているわけではないし、複数のカテゴリーに属するタスクや、どのカテゴリーに属するのか曖昧なタスクもある。

教師あり学習
入力とそれに対応すべき出力写像する関数を生成する。例えば、分類問題では入力ベクトルと出力に対応する分類で示される例を与えられ、それらを写像する関数を近似的に求める。
ラベルのインフォメーションが不足の場合は半教師あり学習である。
教師なし学習
入力のみ(ラベルなしの例)からモデルを構築する。データマイニング自己符号化器なども参照。
強化学習
周囲の環境を観測することでどう行動すべきかを学習する。行動によって必ず環境に影響を及ぼし、環境から報酬という形でフィードバックを得ることで学習アルゴリズムのガイドとする。例えばQ学習がある。

 

技法[編集]

クラスタリングは、観測された例をクラスタと呼ばれる部分集合に振り分けるもので、振り分けは事前に指示された基準に従って行う。クラスタリングはデータの構造についての仮説(基準)の立て方によって結果が異なる。仮説は「類似尺度」で定義され、「内部コンパクト性」(同一クラスタ内のメンバー間の類似性)や異なるクラスタ間の距離によって評価される。「推定密度」や「グラフ接続性」に基づく技法もある。クラスタリング教師なし学習技法であり、統計的データ解析でよく使われる。

『フリー百科事典 ウィキペディア日本語版』。2023年2月15日 (水) 10:47 UTC

ja.wikipedia.org

 

なかなかWikiの説明も難しい。

教師あり学習と、教師無し学習があるとのことですが、何が違うのでしょう。

分類問題では入力ベクトルと出力に対応する分類で示される例を与えられ・・・」

とある通り、入力と出力が共に与えられる。つまり、正解が何なのかを与えられているのが、教師あり学習ということです。何が正しくて、何が正しくないのかが、情報として与えられ、そのような入力・出力の関係性を与えることが可能な分野、手法と親和性が良いやり方です。

では、教師無し学習は、その逆で、正解を与えられないということになります。データマイニング統計学などを用いたアプローチになり、明確な答えがなく、ビックデータから最適なものを割り出すようなものがこの手法と親和性が良いです。

 

a クラスタリングはカテゴリ型変数を予測する手法であり、教師あり学習に含まれる。

クラスタリングは予め基準が与えられて、クラスタと呼ばれる部分集合に振り分けて、解析される手法である。これは、Wikiの通り、カテゴリ型変数を予測する手法ではありません。また、教師無し学習に分けられる手法です。

よって、aの説明は誤りとなります。

b クラスタリングはデータをグループに分ける手法であり、教師なし学習に含まれる。

上述の通りで、この文章はまさにクラスタリングの手法を表しており、教師無し学習に分けられるというのも正しいです。 

 

c 分類はカテゴリ型変数を予測する手法であり、教師あり学習に含まれる。

 教師あり学習の場合において、代表的なタスクを、回帰と分類といいます。分類は、この説明文のようにカテゴリ型変数を予測する手法であり、教師あり学習に含まれたタスクとなります。

回帰については、目的変数が量的変数である場合の手法となります。

よって、この文章は正しいです。

 

d 分類はデータをグループに分ける手法であり、教師あり学習に含まれる。

グループに分けるのはクラスタリングでしたね。誤りです。 

 

e 回帰はデータをグループに分ける手法であり、教師なし学習に含まれる。

 

回帰は、目的変数が量的変数である場合の手法であり、教師ありに分類される学習手法でした。よって誤りです。

 

以上より、bとcが正しいので、正解は3となります。