※本記事はアフィリエイト広告を含んでいます
どーも、りけーこっとんです。
「G検定取得してみたい!」「G検定の勉強始めた!」
このような、本格的にデータサイエンティストを目指そうとしている方はいないでしょうか?
また、こんな方はいませんか?
「なるべく費用をかけずにG検定取得したい」「G検定の内容について網羅的にまとまってるサイトが見たい」
今回はG検定の勉強をし始めた方、なるべく費用をかけたくない方にピッタリの内容。
りけーこっとんがG検定を勉強していく中で、新たに学んだ単語、内容をこの記事を通じてシェアしていこうと思います。
結構、文章量・知識量共に多くなっていくことが予想されます。
そこで、超重要項目と重要項目、覚えておきたい項目という形で表記の仕方を変えていきたいと思いますね。
早速G検定の中身について知りたいよ!という方は以下からどうぞ。
具体的にどうやって勉強したらいいの?
G検定ってどんな資格?
そんな方は以下の記事を参考にしてみてください。
なお、りけーこっとんは公式のシラバスを参考に勉強を進めています。
そこで主な勉強法としては
分からない単語出現 ⇒ web検索や参考書を通じて理解 ⇒ 暗記する
この流れです。
試験日は2022年7月2日。(記事の更新は間に合いませんでした)
残り一か月強で、知識0から合格できるかはわかりませんが、頑張りたいと思います。
皆さんも一緒に頑張りましょう!
※この記事は合格を保証するものではありません
大項目「ディープラーニングの社会実装に向けて」
G検定のシラバスを見てみると、試験内容が「大項目」「中項目」「学習項目」「詳細キーワード」と別れています。
本記事は「大項目」の「ディープラーニングの社会実装に向けて」の内容。
その中でも「AIと社会」というところに焦点を当ててキーワードを解説していきます。
G検定の大項目には以下の8つがあります。
・人工知能とは
・人工知能をめぐる動向
・人工知能分野の問題
・機械学習の具体的な手法
・ディープラーニングの概要
・ディープラーニングの手法
・ディープラーニングの社会実装に向けて
・数理統計
とくに太字にした「機械学習とディープラーニングの手法」が多めに出るようです。
AIの扱い方というのは、社会全体で「どう扱おうか?」と悩んでいる最中です。
いろんな法律・ルールがあったりしますし、新しいルールが出現したりすることも。
このルールを侵害してしまうと、罰則や信頼低下に繋がってしまいます。
さらにG検定合格にも、この章が肝になってくるようですね。
機械学習やディープラーニングはバッチリなのに法律関連が全然できなくて落ちた、という話も聞きます。
油断せずに行きましょう。
※今回取り上げた法律が変わることもあるということに注意してくださいね。
基本的なところは今回の記事で押さえて、最新版のシラバスを参考に調べることが大切!
今回はAIの実装・運用・評価に関する基本的な用語を押さえていきたいと思います。
著作物
著作物とは、思想又は感情を創作的に表現したもので、文芸・学術・美術又は音楽の範囲に属するもののこと。
文章で表現されると分かりにくいですよね。
重要ポイントは以下のような感じ。
・「思想・感情」に焦点を当てている
単なるデータは含まれません。
・思想や感情を「表現したもの」である
アイディアなど表現されていないものは対象になりません。
・思想や感情を「創作的に」表現したものである
他作品をコピーしただけのものは含まれません。
・文芸、学術、美術、音楽である
工業製品などは含まれません。
※「コンピュータプログラム」は著作物なので、注意しましょう
参考(著作物について|文化庁):https://www.bunka.go.jp/seisaku/chosakuken/seidokaisetsu/gaiyo/chosakubutsu.html
まとめると以下のようなものが「著作物」に当てはまります。
データベースの著作物
データベースの著作物とは論文などの情報が集まったもので、それらの情報を電子計算機で検索可能に体系化した構成のこと。
こちらも言葉にすると難しいですね。
要するに、著作物の集まりをサーバーなどで管理したもの、という意味です。
データベースにある情報が論文などの著作物なら、著作権法で守られます。
しかし著作物に、単なるデータは含まれません。
では顧客情報などの単なるデータを集めたデータベースを著作権で保護するにはどうすればいいのでしょうか。
そのためには「データの選択の仕方」や「体系的構成」に創作性が求められます。
すると個々の情報は「単なるデータ」であっても「データベースの著作物」として、保護の対象になるようです。
不正競争防止法
不正競争防止法とは、会社・事業者同士で公正な競争をしようとする法律のこと。
以前の記事でも簡単に解説しています。
今回はより深堀りしていきたいと思います。
前回の記事で出てきた単語もありますが、復習もかねて見ていきましょう。
営業秘密
営業秘密とは、以下の条件を満たす情報のこと。。
・事業に有用な情報(有用性)
・該当情報を秘密にしようとしていて、営業秘密であることが認知できる(秘密管理性)
・一般的には入手できない(非公知性)
参考:https://www.meti.go.jp/policy/economy/chizai/chiteki/trade-secret.html
有用性は、事業を行うに当たって使える情報かどうか、ということですね
秘密管理性とは、二段階の条件があります。
まず、企業側が「この情報は営業秘密として管理する」という意思がないといけません。(秘密管理意思)
加えて、情報を扱う人が「この情報は営業秘密だ」と分かる状態にあることが条件です。
学習用データなどのデータ、プログラムを保護できる法律のようですね。
限定提供データ
限定提供データは、以下の条件を満たす技術上・営業上の情報のこと。
・業として特定の者に提供される情報(限定提供性)
・電磁的方法で相当量蓄積されている(相当蓄積性)
・電磁的方法で管理されている(電磁的管理性)
分かりやすく言うと「パスワードなどで管理された、三次元地図データなどの利用できる人が限定されたデータ」のことかと。
たくさんの量があって、特定の人にしか提供されないデータです。
それらがパソコン上のデータ(電磁的方法)で管理されていても、不正競争防止法で守られます。
オープンデータに関する運用除外
オープンデータに関する運用除外とは、オープンデータが不正競争防止法から除外されたということ。
限定提供データ等は、不正競争防止法によって保護されていました。
確かにデータのプライバシーや権利を守ることは重要です。
しかし、それではデータの利活用などが進みにくくなるのもまた事実。
そこでオープンデータは、不正競争防止法の適用外にしようということですね。
オープンデータとは、その名の通り誰でも自由に利用できるデータのこと。
詳しくは以下の記事でも解説していたので、ぜひ見てみて下さい。
秘密管理
秘密管理とは、情報を「営業秘密」として扱いたい時に満たす条件のこと。
既に上記で触れましたね。
覚えているか復習してみましょう。
秘密管理性には以下の条件が必要でした。
・秘密管理意思
「この情報を営業秘密として管理する」という意思
・秘密管理性
「この情報は営業秘密だ」と情報を扱う人が認知できる
「秘密管理性」のほかにも「有用性」や「非公知性」が必要でしたね。
個人情報
個人情報とは、「ある個人」に特定できてしまう情報のこと。
個人情報に関する詳しい説明は、以前の記事でも触れています。
個人情報は扱いに注意しなければなりません。
例えば「AIの実装段階でデータ利用目的が変わる」という状況を考えてみましょう。
この場合、個人情報は原則、利用目的が変わることへの本人による事前の同意が必要です。
同意を得るために、利用目的を通知・公表するなどして伝えなければなりません。
さらに詳しい内容は以下の記事をぜひご覧ください。
GDPR
GDPRとは、EUに所属している個人のデータを無断で使用することを禁ずるもの。
General Data Protection Regulationの略で、日本語では個人情報保護規則といいます。
この規則は「EUだから関係ない」と思ったら大間違い。
EUに属する個人のデータを扱う日本の企業、個人にまで影響する可能性があります。
規則に違反した場合は、多額の罰金などが科せられる可能性があるため、注意が必要なんですね。
日本の個人情報保護法よりも厳格な制度であり、GDPRに対応するにはかなりの時間や人手などが必要なこともあります。
十分性制定
十分性制定とは、GDPRで定義されているデータ保護水準に関する定義のこと。
これは国ごとに制定され、認められるとデータ利活用の手間が削減できます。
具体的には「個人データの移転を行えるだけの十分なデータ保護の水準を持つ」かどうか。
その国のデータ保護の制度は本当に安心できる?ということですね。
日本は「十分性制定」を受けており、他の国に比べてEUの個人データの利活用がしやすいといえます。
まとめ
今回は大項目「ディープラーニングの社会実装に向けて」の中の一つ「実装・運用・評価」についての解説でした。
本記事をまとめると以下の通り。
・著作物
・データベースの著作物
・不正競争防止法
・営業秘密
・限定提供データ
・オープンデータに関する運用除外
・秘密管理
・個人情報
・GDPR
・十分性制定
以上が大項目「ディープラーニングの社会実装に向けて」の中の一つ「実装・運用・評価」の内容でした。
G検定では「機械学習」「ディープラーニング」で覚える内容が多いので、どうしてもそちらに注力しがちです。
しかし、G検定合格において落とし穴になるのが本章「ディープラーニングの社会実装に向けて」。
出題率としても高めに設定されていると思うので、全問不正解だと合格は厳しいです。
最低限の重要キーワードだけでも覚えておくことが重要でしょう。
次回は「ディープラーニングの社会実装に向けて」の「実装・運用・評価」の解説第二弾!
G検定の勉強完了までもう少し!
頑張りましょう!
ではまた~
続きは以下のページからどうぞ!
コメント