※本記事はアフィリエイト広告を含んでいます
どーも、りけーこっとんです。
「G検定取得してみたい!」「G検定の勉強始めた!」
このような、本格的にデータサイエンティストを目指そうとしている方はいないでしょうか?
また、こんな方はいませんか?
「なるべく費用をかけずにG検定取得したい」「G検定の内容について網羅的にまとまってるサイトが見たい」
今回はG検定の勉強をし始めた方、なるべく費用をかけたくない方にピッタリの内容。
りけーこっとんがG検定を勉強していく中で、新たに学んだ単語、内容をこの記事を通じてシェアしていこうと思います。
結構、文章量・知識量共に多くなっていくことが予想されます。
そこで、超重要項目と重要項目、覚えておきたい項目という形で表記の仕方を変えていきたいと思いますね。
早速G検定の中身について知りたいよ!という方は以下からどうぞ。
具体的にどうやって勉強したらいいの?
G検定ってどんな資格?
そんな方は以下の記事を参考にしてみてください。
なお、りけーこっとんは公式のシラバスを参考に勉強を進めています。
そこで主な勉強法としては
分からない単語出現 ⇒ web検索や参考書を通じて理解 ⇒ 暗記する
この流れです。
※この記事は合格を保証するものではありません
大項目「人工知能を巡る動向」
G検定のシラバスを見てみると、試験内容が「大項目」「中項目」「学習項目」「詳細キーワード」と別れています。
本記事は「大項目」の「人工知能を巡る動向」の内容。
その中でも「第二次AIブーム」というところに焦点を当ててキーワードを解説していきます。
G検定の大項目には以下の8つがあります。
・人工知能とは
・人工知能をめぐる動向
・人工知能分野の問題
・機械学習の具体的な手法
・ディープラーニングの概要
・ディープラーニングの手法
・ディープラーニングの社会実装に向けて
・数理統計
とくに太字にした「機械学習とディープラーニングの手法」が多めに出るようです。
本記事の範囲は問題数としては少ないものの、合格に向けては必須の基礎知識になります。
ここを理解していないと、機械学習やディープラーニングがどういうものかを理解できません。
ここから先の学習の理解を深めるために、そしてG検定合格するために、しっかり押さえておきましょう。
第二次AIブームに関する内容が多くなってしまってので、記事を二つに分割してお届けしようと思いますね。
第二次AIブームとは?
第二次AIブームとは、1980年代から1990年代にかけて、AIが急速に注目された期間のことを言います。
知識を大量に与えると、人間に近い精度の判断ができるようになったことが、ブームのきっかけのようですね。
第二次AIブームは「知識表現」の時代とも言われます。
しかし、第二次ブームの人工知能で解ける問題にも限界がありました。
さらに、大量の知識を与えるのは結局人間なので「結局人間が頑張ってるだけだよね」となってしまったようです。
そこで、1990年代には注目度合いが衰えてしまったと言われています。
では、そんな第二次AIブームの中でどんなキーワードがあったのでしょうか。
Cyc(サイク)プロジェクト
Cycプロジェクトとは「全ての一般常識をコンピュータに覚えさせよう」とするプロジェクトのこと。
1984年に開始され現在も尚、行われているようです。
全ての一般常識を覚えさせることで、人間と同等の推論ができるようになると考えられての、プロジェクト発足のようです。
本当に全ての一般常識を覚えられたら、人間と同等の推論ができるようになるのでしょうか…?
データマイニング
データマイニングとは大量のデータから「知識」を見出すための技術のこと。
ここで用いられるのは、統計学や人工知能などの分析手法です。
もしかすると「ビットコイン」の知識で聞いたことがある人もいるかもしれません。
しかし「データマイニング」と「ビットコインのマイニング」は意味が変わってきますので、ご注意を。
Webマイニング
Webマイニングとは、ウェブ上の膨大なデータを利用して行うデータマイニング
ウェブサイトの大量のデータから「知識」を見出します。
例えば、掲示板やレビューから商品の評価を見たり、サイトの行動履歴から趣味嗜好を判断したりと、様々な利用のされ方がありますね、
ワトソン
ワトソンとはクイズに答えるAIのこと。
IBMが2004年に発表しました。
問題を文脈を含めて理解し、大量の情報の中から適切な回答を選択します。
時には拡張知能と言われる事もあるようです。
Question-Answering
Question-Answeringとは、自然言語の質問をユーザから自然言語で受けつけ、その解答を返すようなコンピュータソフトウェアのこと。
Question-Answeringは質問応答システムとも呼ばれるようです。
セマンティックWeb
セマンティックWebとはWebページの意味を理解するため、コンピュータが自律的な情報の収集や加工を可能にする構想のこと。
ティム・バーナーズ=リーという方によって提唱されたようです。
メタデータを一定の規則に従って付加することで、意味を理解します。
このメタデータとは一体何なのか?
メタデータ
メタデータとは、データについてのデータのこと。
何を言ってるか分かりませんね…
例えば論文データであれば、その論文の「論文タイトル・発表者・発表日・関連キーワード」等があります。
ECサイトに売られている商品であれば「商品名・価格・関連キーワード」等でしょうか。
このようにデータを表す属性や関連する情報を記述したデータのことを、メタデータと言います。
集合の二つの関係に関する条件
これは第二次AIブームの知識、というよりは数学の知識に近いと思います。
「集合」等の範囲ですね。
シラバスにキーワードとして載っていたので、周辺の知識も踏まえて共有します。
反射律
反射律とは「全てのxに対してxRx」を満たすとき、「反射律を満たす」と言います。
Rには「=,<,>」などの等号や不等号が入るようですね。
例えば「x = x」はxにどんな数字を入れても成り立ちますよね。
これは「反射律を満たす」と言います。
他に「x > x」はどうでしょうか?
「>」は「●●より大きい、●●未満」という使われ方なので、「反射律を満たさない」です。
対称律
対称律とは「xRyならばyRx」を満たすとき、「対称律を満たす」と言います。
Rには「=,<,>」などの等号や不等号が入るようですね。
例えば「x = yならばy = x」は当然と言えば当然ですよね。
これは「対称律を満たす」と言います。
他に「x > yならばy > x」はどうでしょうか?
大小関係が逆になってしまっているので、「対称律を満たさない」です。
推移律
推移律とは「xRyかつyRzならばxRz」を満たすとき、「推移律を満たす」と言います。
Rには「=,<,>」などの等号や不等号が入るようですね。
例えば「x = yかつy = zならばx = z」はx,y,zにどんな数字を入れても成り立ちますよね。
三段論法とか言われることもあります。
このようになれば「推移律を満たす」と言いますね。
他に「x > yかつy > zならばx > z」はどうでしょうか?
実際に数字を当てはめてみると分かりますが、この式は正しいです。
なので、「推移律を満た」します。
まとめ
今回は大項目「人工知能を巡る動向」の中の一つ第一次AIブームについての解説、第二弾でした。
本記事をまとめると以下の3つ。
・Cycプロジェクトとは「全ての一般常識をコンピュータに覚えさせよう」とするプロジェクトのこと
・データマイニング・セマンティックWebのように、「意味」を理解しようとした
・「ワトソン」「Question-Answering」などに第二次AIブームの技術が用いられる
以上が大項目「人工知能を巡る動向」の中の一つ第二次AIブームの内容でした。
第二次があるということは、第三次もあるんです。
実はAIブームは三度起きていて、今は第三次AIブーム。
なので、次の記事では第三次AIブームについて解説させて頂きます。
覚える内容が多いですが、りけーこっとんも頑張ります!
ではまた~
続きは以下のページからどうぞ!
コメント