支援対象地域:札幌、仙台、関東、愛知、関西、広島、福岡


CompTIA Data+の概要について

ここでは、CompTIA Data+について解説させていただきます。 CompTIA Data+はCompTIA(The Computing Technology Industry Association)が主催する2021年に開始された認定資格です。 データベースはアクセスおよび管理できる方法で編成および保存されたデータのコレクションで、ビジネスニーズに合わせて作成できます。 データベースにはリレーショナルデータベース、階層データベース、ネットワークデータベースなど、さまざまな種類があり、選択するデータベースのタイプは、ビジネスの特定のニーズによって異なります。 たとえば、人や物に関する多くの情報を保存する必要がある場合は、リレーショナルデータベースが最適なオプションです。 ビジネスにさまざまなカテゴリまたは地理的地域で販売されている多数のアイテムがある場合は、階層データベースまたはネットワークデータベースが最適です。 データベースは、迅速な検索と簡単なアクセスを可能にする体系的な方法で保存されたデータのコレクションであり、エンターテインメントからビジネスまで、生活のあらゆる分野で使用されています。 また、Webサイトにアクセスしたユーザーに関する情報の保存、在庫の追跡、顧客の注文の管理など、さまざまな目的で使用されます。 データベースは、データを効率的に整理するのに役立つため、すべての企業にとって不可欠なツールでありその重要性は増す一方です。企業でデータベースを使用することで生産性が向上し、ビジネスインテリジェンスが向上し、より優れた顧客サービスが提供される可能性があります。 ただし、これらのデータベースに保存されるデータの機密性のため、企業は適切なセキュリティ対策を実施することが重要です。 それらの管理者には高い専門知識が求められるため、エンジニアは資格などを取得し体系的な知識が必要となってきます。 以上が簡単ではありますがデータベースに関する説明となります。

CompTIA Data+はデータアナリスト向けのプロフェッショナル認定資格であり、 専門的なデータに関する知識やスキルを確認し、データドリブン型のビジネス意思決定の構築と促進を 実施します。 CompTIAではCompTIA Data+を取得することで、データをよりよく分析し解釈することでより効果的にデータマイニングを行い、詳細な分析を行うことにより明確な分析結果を導き出すための知識を体系的に網羅していること、 データドリブン型の意思決定を行うためにはインサイトを正確に表すことも重要でそれらの知識を獲得できること、より価値の高い人材となれること、データリテラシースキルの証明により、自身が即戦力としてよりよい仕事ができ、常に向上心を持って取り組む姿勢を第三者に証明することができること、といったような知識やメリットを獲得できると定義しております。データ領域における専門的なプロフェッショナルを目指す方にとってCompTIA Data+は非常に役立つでしょう。
近年のビッグデータ時代において、データを取り扱うプロフェッショナルの需要は高まる一方となります。 データの概念を正しく理解し、データを分析することや正しい品質の知識を習得することはあらゆるビジネスにおいて重要です。 カスタマーエクスペリエンスの向上、新規顧客の獲得、内部プロセスの回線、消費者行動の学習など 様々な目的において企業が獲得したデータは貴重な資産となります。 それらを正しく活用することがデータアナリストのミッションと言えるでしょう。 データアナリストは、組織のデータをもとに意思決定ための知見を提供し、より良いビジネス上の意思決定を導くサポートを実行することが非常に大切な業務であり、具体的な業務としては顧客、ビジネスプロセス、市場経済状況などに関連するデータを収集、分析し、レポート、ダッシュボード、もしくはその他の視覚的なレポートの作成を実施する、データベースとデータ収集システムの開発と実装する、一次/二次情報ソースからのデータを取得する、データのクリーニングと検証を行う、データモデリング設計を行う、といった内容となります。新しいデータ分析手法の実装を行うCompTIA Data+を学習することで、上記の内容をより実践的に体系的な学ぶことができるでしょう。

CompTIA Data+はデータアナリスト向けの資格となりますが、データ分析を行う職業や関連する職業においても大いに役立ちます。データサイエンティストは、アルゴリズムと科学的プロセスを使用し、意思決定のためにデータから知見を抽出する業務です。データアナリストと比較するとよりデータ分析において高い専門性を求められるケースが多いです。 レポートアナリストは、データを収集し分析された後にレポートを作成し、調査結果に基づいてプロセス改善のための提案事項を提供する職業となります。データアナリストと比較すると資料作成や提案のための専門的な知識が必要となるケースが多いです。 ビジネスデータアナリストは日本ではなじみの薄い職業ですが、組織内のテクノロジー領域とビジネス領域の間のギャップを埋める役割を果たします。 ビジネスインテリジェンスアナリストは組織を成功に導くために、社内外のデータを収集し、これらの2つを比較して市場状況を作成する職業となります。 以上がデータ分析と関わりの深い職業や関連する職業の説明となりますが、CompTIA Data+を取得することで これらの職業においてキャリアアップを狙うことが可能となりますので参考にしてみてください。
すでに本文で述べたようにデータの概念を正しく理解し、データを分析することや正しい品質の知識を習得することはあらゆるビジネスにおいて重要と言えます。 マーケティングスペシャリスト、財務アナリスト、人事アナリスト、営業部門、管理部門などにおいては データを正しく使用、評価することでパフォーマンスを最適化することが可能になるでしょう。 いずれにせよ何かしらの意思決定を行う際に正しいデータ分析はビジネスを強力にバックアップしてくれることは間違いありません。 CompTIAではこのような社会情勢を鑑みて、データ分析に関連する認定資格の必要性を認識しCompTIA Data+を 設計することになりました。 CompTIA Data+を取得することでデータマイニングや統計手法の基本的な理解と適用、 データライフサイクル全体を通じたカバナンスと品質基準などのスキルを評価し、複雑なデータセットの分析を通じて、 データドリブン型の意思決定をサポートし、ビジネス要件を変革するために必要とされるスキルと知識を獲得できます。 CompTIA Data+では特に受験資格や制限はありませんが、 データ分析の18~24か月程度の実務経験者が対象となります。 CompTIA Data+はデータの概念と環境、データアナリシス、データガバナンスと品質と管理、 データマイニング、ビジュアライゼーションの5つの分野から出題されます。 以上がCompTIA Data+に関する説明とさせていただきます。

CompTIA Data+試験の内容について

CompTIA Data+の試験について説明させていただきます。 CompTIA Data+は90分、90問の単一/複数選択、パフォーマンスベーステスト、100~900のスコア形式で実施され、675スコア以上で合格となります。
CompTIA Data+はデータの概念と環境、データアナリシス、データガバナンスと品質と管理、 データマイニング、ビジュアライゼーションの5つの分野から出題されます。 データの概念と環境は出題比率が15%で、一般的なデータ構造とファイル形式の違いを理解し、データベースのスキーマとディメンションの基本的な概念理解、特定する ことやさまざまなデータ型を比較対照できるための知識が問われます。
データアナリシスの出題比率は23%で、主要な分析手法を理解し、様々な分析の種類をから適切な統計分析手法を適用するための知識が問われます。
データガバナンスと品質と管理の出題比率は14%で、重要なデータガバナンスの概念を理解し、データ品質管理の概念を適用するための知識が問われます。
データマイニングの出題比率は25%で、データ取得の概念、データのクレンジングとプロファイリングの理由、データ操作の手法と実行方法の理解を説明するための知識が問われ、シナリオに基づいて、データ操作手法を実行できるなど知識が問われます。
ビジュアライゼーションの出題比率は23%で、ビジネス要件を理解し、適切な設計コンポーネントによるレポートまたはダッシュボードの形式で最適な視覚化を形成するための知識が問われます。 以上がCompTIA Data+の試験についての説明とさせていただきます。

CompTIA Data+の学習について

CompTIA Data+の学習について説明させていただきます。 現在英語のみの取り扱いのため、英語が苦手な方や急ぎでCompTIA Data+を取得する予定のない方は CompTIAによって日本語版がリリースされるのを待つという方法もあります。 英語版の参考書としては、「Comptia Data+ : Exam Da0-001」という参考書を 利用するといいでしょう。 ただし国内の書店では在庫が少なくオンラインでの取り寄せとなってしまいますので 注意が必要となります。

データ分析に関する資格について

CompTIA Data+以外でも、データ分析に関する資格は複数あります。 データ分析の業務はそれだけで単独して実行するのではなく、ビジネスの中で必要に応じて 実施するため様々な専門的な業務の中でのデータ分析の手法などについて理解する必要があります。

データ分析に関する資格の一点目はG検定とE資格で、G検定とE資格は一般財団法人日本ディープラーニング協会が主催する資格です。 まず、G検定はジェネラリスト向けの試験となります。 AIや機械学習の基本的な知識を問われる資格であり、データ分析に関わる領域として「ディープラーニングの社会実装に向けて」の項目においてデータ分析について取り扱います。 データ分析だけでなくAIや機械学習に興味のある方に最適の資格となります。 また、G検定はエンジニア向けに具体的な実装を学ぶわけではありませんので、ビジネスマンとしての 活躍の場を広げたいという方にも向いております。
参考までにG検定の出題範囲について紹介させていただきます。 「人工知能分野の問題」では、人工知能分野における基礎的な知識を獲得することができます。 トイプロブレム、フレーム問題、弱いAI、強いAI、身体性、シンボルグラウンディング問題、 特徴量設計、チューリングテスト、シンギュラリティなどがそれに該当します。
「ディープラーニングの概要」ではディープラーニングについての基礎的な知識を学習します。 ニューラルネットワークとディープラーニング、既存のニューラルネットワークにおける問題、ディープラーニングのアプローチCPU と GPU、ディープラーニングのデータ量、活性化関数、学習率の最適化、更なるテクニックなどの 専門的な知識について学習を行います。
「ディープラーニングの社会実装に向けて」では、ディープラーニングが現実の社会やビジネスにおいて実装され運用されるために 必要な知識について学びます。 AIの倫理観や法的な理解など、しっかりと正しい知識を身につける必要があります。 AIプロジェクトの計画、データ収集、加工・分析・学習、実装・運用・評価 法律(個人情報保護法・著作権法・不正競争防止法・特許法)、契約 倫理、現行の議論(プライバシー、バイアス、透明性、アカウンタビリティ、ELSI、XAI、ディープフェイク、ダイバーシティ) などがそれに該当します。
「人工知能をめぐる動向」では、探索・推論、知識表現、機械学習、深層学習などについて学びます。
「機械学習の具体的手法」では代表的な手法(教師あり学習、教師なし学習、強化学習)、データの扱い、評価指標について学びます。これらは機械学習を実施するうえで必須の知識と言えるでしょう。
「ディープラーニングの手法」ではディープラーニングの具体的案手法について学びます。 CNN、深層生成モデル、画像認識分野での応用、音声処理と自然言語処理分野、RNN、深層強化学習,ロボティクス ,マルチモーダル、モデルの解釈性とその対応などが それに該当します。 以上がG検定についての説明とさせていただきます。

E資格はAIを実装するエンジニアのための資格であり、専門的な知識が問われる資格となります。 「応用数学」では確率・統計や情報理論が出題されます。 「深層学習」では順伝播型ネットワーク、深層モデルのための正則化、深層モデルのための最適化、畳み込みネットワーク、回帰結合型ニューラルネットワークと再帰的ネットワーク、生成モデル、深層強化学習、グラフニューラルネットワーク、深層学習の適用方法、距離学習、メタ学習、深層学習の説明性についての知識が問われます。 「機械学習」では機械学習の基礎、実用的な方法論、強化学習についての知識が問われます。 以上がE資格に関する説明とさせていただきます。

データ分析に関する資格の二つめはOSS-DB技術者認定試験です。 OSS-DB技術者認定試験はエンタープライズ領域での利用が進んでいる「PostgreSQL」の技術力を証明することになります。 データ分析を専門に扱う資格ではありませんが、データベースの扱いは データ分析エンジニアにとって非常に重要であることは間違いありません。 PostgreSQLをはじめとするオープンソースデータベースは企業が抱えるITシステムの低コスト化や開発の効率化など、様々な要望に応えられるデータベースとして 活躍しております。 こういった現状の中においてPostgreSQLの実践的な知識や技術力を証明できることはエンジニアのキャリアにとっても役立ちます。 OSS-DB技術者認定試験は「Silver」と「Gold」に分類されますが、ここではSilverについて説明させていただきます。Silverを取得することで、RDBMSとSQLに関する知識を有すること、 オープンソースデータベースに関する基礎的な知識を有すること、 オープンソースを利用して小規模なデータベースの運用管理ができること、 オープンソースを利用して小規模なデータベースの開発を行うことができること、 PostgreSQLを使ったデータベースシステムの運用管理ができること、 PostgreSQLを利用した開発でデータベース部分を担当することができることを第三者に証明することが可能となります。 出題内容は「一般知識」「運用管理」「開発」の3つの分野によって構成されております。 「一般知識」ではPostgreSQLに関する様々な知識が出題され、出題比率は16%となります。 具体的にはPostgreSQLの機能全般、OSS-DBおよびOSS一般のライセンス、OSS-DBのコミュニティ、活動内容、参加方法などメジャーバージョン / マイナーバージョン リリースサイクル / サポートポリシー / バグ報告などの関する知識が問われます。 また、リレーショナルデータベースに関する一般知識の項目では以下の内容が出題範囲となります。 リレーショナルデータモデルの基本概念 、データベース管理システムの役割、SQL に関する一般知識、SQLの 分類 (DDL / DML / DCL) データベースの設計と正規化となります。
「運用管理」はデータベースに関する様々な運用管理の知識が問われ、出題比率は52%となります。 インストール方法ではPostgreSQLのインストール方法、データベースクラスタの作成方法などに関する知識が問われます。 また、initdbコマンドの使い方やデータベースクラスタの概念と構造やテンプレートデータベース についての知識も問われます。 標準付属ツールの使い方では、OSのコマンドプロンプトから実行できる管理用ツールの使い方を問うための知識が必要となります。 設定ファイルでは設定ファイルの使い方、基本的な設定パラメータに関する知識を問うための知識が問われます。 postgresql.confに関する記述方法や接続と認証などが出題範囲となります。 バックアップ方法では、PostgreSQLのバックアップ方法に関する理解が問われます。 各種バックアップコマンドの使い方、ファイルシステムレベルのバックアップとリストア 、ポイントインタイムリカバリ(PITR)の概念と手順 、トランザクションログ(WAL)とWALアーカイブ 、pg_start_backup() / pg_stop_backup() COPY文(SQL)、¥copyコマンド(psql)の使い方などの知識が問われます。 基本的な運用管理作業では、データベース管理者として実行する基本的な運用管理コマンドに関する知識が 問われます。 PostgreSQLの起動・停止方法、データベースロール / ユーザの概念 、データベースロール / ユーザの追加・削除・変更方法、VACUUM、ANALYZEの目的と使い方 、自動バキュームの概念と動作、システム情報関数、情報スキーマとシステムカタログ 、テーブル単位の権限(GRANT/REVOKE)などの知識が問われます。
「開発/SQL」では開発とSQLに関する基礎的な知識が問われます。 SQL コマンドでは基本的なSQL文およびデータベースの構成要素に関する知識が問われます。 SELECT 文、INSERT 文、UPDATE 文、DELETE 文 、データ型、テーブル定義、インデックス、ビュー 、マテリアライズドビュー、ルール、トリガー 、シーケンス、スキーマ、テーブルスペース、パーティション 、関数定義 / プロシージャ定義、PL/pgSQLなどに関する知識が問われます。 組み込み関数では集約関数、算術関数、演算子 、文字列関数、文字列演算子 / 述語、時間関数に関する知識が問われます。 トランザクションの概念ではトランザクションの構文 、トランザクション分離レベル(リードコミッティド、リピータブルリード、シリアライザブル) 、LOCK 文、行ロックとテーブルロック、デッドロックに関する知識が問われます。 以上がOSS-DB技術者認定試験は「Silver」に関する説明となります。

データ分析に関する資格の三つめがPython3エンジニア認定データ分析試験となります。 Python3エンジニア認定データ分析試験は一般社団法人Pythonエンジニア育成推進協会が認定する資格となります。 一般社団法人Pythonエンジニア育成推進協会は、Python市場が広がる際にPythonを理解した人材が育成されるように学習の指針となる試験と教材認定とスクール認定を行う組織として2016年に設立されました。 設立目的として「Pythonをこれから始める人などを対象に、学習の目安を提供し習熟度チェックを行う」 「プログラミングフィロソフィー「Pythonic」の普及推進を行う」 「Python関連の一団体として試験関連の情報発信を行い、Pythonの普及を推進する」 などが掲げられております。 また、Python3エンジニア認定基礎試験という資格も発行しており、Python3エンジニア認定データ分析試験と比較すると難易度は低いですがPythonエンジニアを目指すエントリー向けの資格として人気があります。 CompTIA Data+と異なり、Python言語とデータ分析という領域に特化した資格となりますが ビッグデータ時代やAI時代を迎えるにあたりPython言語の需要は増加する一方です。 Python3エンジニア認定基礎試験やPython3エンジニア認定データ分析試験を取得し Pythonに関する体系的な知識を獲得することはエンジニアのキャリアの幅を広げることは間違いありません。
では、まずPython3エンジニア認定基礎試験について説明させていただきます。 Python3エンジニア認定基礎試験は、文法基礎を問う試験であり試験時間は60分で実施され、問題数は40問で正答率70%で合格となります。 出題範囲としては主教材であるオライリー・ジャパン「Pythonチュートリアル(2021年9月1日より第四版に対応)」の掲載内容としております。これはPython言語に関する最もポピュラーな参考書の一つとして知られております。 Python3エンジニア認定基礎試験は食欲をそそってみようか、Pythonインタープリタの使い方、気楽な入門編、制御構造ツール、データ構造、モジュール、入出力、 エラーと例外クラス、標準ライブラリめぐり、標準ライブラリめぐり─PartII、仮想環境とパッケージ、次はなに?、対話環境での入力行編集とヒストリ置換 の14章から構成されております。 Python3エンジニア認定基礎試験はPythonに関する基本的な問題が出題されますので、 これからPythonを学習したい方、エントリークラスのエンジニアに最適な資格と言えるでしょう。
次にPython3エンジニア認定データ分析試験に関して説明させていただきます。 Pythonを使ったデータ分析の基礎や方法を問う試験で問題数は40問、正答率70%で合格となります。 主教材である翔泳社「Pythonによるあたらしいデータ分析の教科書」の内容を中心に出題されます。 Pythonの知識だけでなく、データや統計、数学に関する知識が必要となりますので データ分析の関するスキルを高めたいエンジニアには最適な資格と言えるでしょう。 以上が簡単ではありますが、Python3エンジニア認定データ分析試験に関する説明とさせていただきます。

データ分析に関する資格の四つめがデータベーススペシャリスト試験(Database Specialist Examination)となります。 データベーススペシャリスト試験は情報処理技術者試験の一区分であり、試験制度のスキルレベル4に設定されており高度情報処理技術者試験に該当します。 その名の通りデータベースに関する専門的な知識やスキルを問う資格となっております。 データベーススペシャリスト試験では、データベースの計画、要件定義、設計、運用保守、データベースに関連する技術など一通りの範囲から出題されることもあり、対象者は幅広くインフラエンジニアやデータベース管理者、データ管理者などデータに携わるエンジニアであれば幅広く対象者となります。 取得することで企業のおける大規模データベースの取り扱いやその管理、パフォーマンスを意識したデータベースの設計や構築など、多くのデータベース業務においてプロフェッショナルとしての知識を第三者に証明することが可能であり、転職活動などにおいても一定の効果があります。 また、データベースに概念設計や論理設計といったシステム開発の上流工程に関する出題が多い傾向にあり、 合格者は実務経験が比較的豊富な経験者であることや、オラクルマスターなどの資格を保有しているケースが多いこともその特徴と言えるでしょう。
データベーススペシャリスト試験は1988年に創設されたオンライン情報処理技術者試験を 発祥としており、1994年になりデータベースの専門試験として分割されたという歴史があります。 また、2001年(平成13年)にテクニカルエンジニア(データベース)試験という名称に変更になりましたが、 その後現在のデータベーススペシャリスト試験に名称が戻ったという歴史もあります。 比較的難易度の高い資格となっており、例年合格率は10%程度となります。下位区分の応用情報技術者試験(スキルレベル3)や基本情報技術者試験(スキルレベル2)に合格できるスキルを持つ受験者でも合格率が10%程度であることから、難易度の高さはご理解いただけるのではないでしょうか。 国内のデータベースに関する資格では最高峰の難易度を持っていると言えるでしょう。
それでは試験の内容について簡単に紹介させていただきます。 データベースシステムの企画・要件定義・開発に関することの項目では、データベースシステムの計画、要件定義、概念データモデルの作成、コード設計物理デー タベースの設計・構築、データ操作の設計、アクセス性能見積り、セキュリティ設計などの知識が問われます。 この項目を学習することでデータベースに関する上流工程から設計までの実践的な 知識を体系的に獲得することが可能です。
データベースシステムの運用・保守に関することの項目では データベースの運用・保守、データ資源管理、パフォーマンス管理、キャパシティ管理、再 編成、再構成、バックアップ、リカバリ、データ移行、セキュリティ管理などの知識が問われます。 この項目ではデータベース設計後の運用保守の工程についての知識を学びます。
データベース技術に関することの項目では、 リポジトリ、関係モデル、関係代数、正規化、データベース管理システム、SQL、排他制御、 データウェアハウス、その他の新技術動向などについて学習します。 以上が簡単ではありますがデータベーススペシャリスト試験に関する説明とさせていただきます。

データ分析に関する資格の五つめがORACLE MASTERとなります。 ORACLE MASTERはリレーショナルデータベースであるORACLEのデータベースについての知識を問われる 資格であり、データベースに関する資格としては日本で最もポピュラーな資格の一つと言えるでしょう。 人気が高いのは、ORACLEのデータベースがリレーショナルデータベースの市場でトップシェアを誇っていることとも関係があり、インフラエンジニア・データベースエンジニアだけでなく開発エンジニアなどITに関わるエンジニアにとって重要な知識であることもその理由と言えるでしょう。 リレーショナルデータベースはエドガー・F・コッドによってその概念が発表されました。 それ以降データベースの主流であり、データベースと言えばリレーショナルデータベースという 認識を持つエンジニアも少なくありません。 リレーショナルデータベースでは データベースを利用する際にクエリをデータベースに与えデータを検索することや変更することを可能とし、従来のデータベースの性能や使い勝手を飛躍的に向上させることに成功しました。 これらのテクノロジーは先に述べたエドガー・F・コッドによって様々な形の論文で発表され、 現在も多くのエンジニアにとって貴重な資料となっております。 "A Relational Model of Data for Large Shared Data Banks" (大規模共有データバンクのデータ関係モデル)の中で リレーショナルデータベースについての概念について発表したことは非常に有名です。 やや専門的な内容となりますが、内容を紹介させていただくと以下の通りです。 大規模なデータバンクの将来のユーザーは、データがマシン内でどのように編成されているか(内部表現)を知る必要がないように保護する必要があり、 そのような情報を提供する迅速なサービスは、満足のいく解決策ではありません。 データの内部表現が変更された場合、および外部表現の一部の側面が変更された場合でも、 端末およびほとんどのアプリケーションプログラムでのユーザーのアクティビティは影響を受けないままである必要があります。 クエリ、更新、レポートトラフィックの変更、および保存されている情報の種類の自然な増加の結果として、データ表現の変更が必要になることがよくあります。 "A Relational Model of Data for Large Shared Data Banks" に影響を受けて ORACLEのラリーエリソンがリレーショナルデータベース市場に参入し、一気にトップシェアを奪うという歴史があります。 ラリーエリソンは自宅を和風建築にするほどの親日家としても知られ、IT業界においては知らない人がいないほど有名人となります。
ではORACLE MASTERについて詳しく解説させていただきます。 ORACLE MASTERは「Bronze(ブロンズ)」、「Silver(シルバー)」、「Gold(ゴールド)」、「Platinum(プラチナ)」の 4つから構成されており、難易度の低い下位資格を取得後に上位資格に挑戦できる形式となっております。 難易度の低い順にBronze、Silver、Gold、Platinumとなっておりますので、受験者は下から合格していく必要がある点について理解しておく必要があります。
BronzeはOracle DatabaseのアーキテクチャやOracle Databaseの構成に関する重要な用語を理解し、またデータベースの日常的な運用管理についての知識があることを紹介します。最も難易度の低いエントリークラスの資格となります。
Silverは大規模データベースの管理者としての専門的な知識を問う資格で、一定の業界経験や実務経験のあるエンジニアが対象となります。
Goldはデータベースに関する総合的な知識やチューニングに関する知識が問われます。
Platinumは経験豊富なデータベースのスペシャリストとしての知識が問われる専門的な資格となります。 以上がORACLE MASTERに関する説明とさせていただきます。

データ分析に関する資格の六つめがAWS認定 機械学習 – 専門知識(AWS Certified Machine Learning – Specialty)となります。 AWS認定 機械学習 – 専門知識はAWSが主催する認定資格で機械学習の専門知識が問われる資格となります。データ分析のみを扱う資格ではありませんが、機械学習やAI(人工知能)の分野ではデータを収集し、それらを分析し何らかのパターンを作成するという一連の作業は必須となるためデータに関する知識は必須と言えるでしょう。 比較的難易度の高い資格として知られておりますので、一定の実務経験のある方が対象となり資格です。 主催するAWSは、AWSクラウドでの機械学習ワークロードまたは深層学習ワークロードの開発、アーキテ クチャの設計、および実行における最低2年以上の実務経験があることを対象者として設定しております。 また、経験だけでなく一定の知識も必要とされており、具体的にAWSが推奨している知識としては、基本的な機械学習アルゴリズムの背後にある直感的知識を表現する能力 、 基本的なハイパーパラメータ最適化の実行に関する経験、機械学習および深層学習のフレームワークに関する経験、 モデルトレーニングのベストプラクティスに従う能力デプロイのベストプラクティスに従う機能、運用上のベストプラクティスに従う能力と、幅広い範囲が対象であることがご理解いただけるでしょう。
AWS認定 機械学習 – 専門知識は「データエンジニアリング」「探索的データ分析」 「モデリング」「機械学習の実装とその運用」の4つの分野から構成されております。 特に「データエンジニアリング」「探索的データ分析」の分野ではデータを取り扱います。 出題比率ですが、「データエンジニアリング」は20%、「探索的データ分析」は24%、「モデリング」は36%、「機械学習の実装とその運用」は20%の配分です。
「データエンジニアリング」では、その名の通りデータエンジニアリングに関する内容が出題されております。 膨大なデータを集めそれらを分析や検証を実行するスキルであり、 データエンジニアリングには専門的な知識と幅広い知識が問われます。AIや機械学習を行う際にはデータの扱いが必要となりますので、エンジニアにとってデータエンジニアリングの知識は必須と言えるでしょう。 機械学習のデータリポジトリを作成する、の項目ではデータソースを特定することや、記録媒体を決定するための知識が問われます。 また、データ取り込みソリューションを特定および実装するために、データのジョブスタイル/タイプやデータ取り込みのパイプライン、ジョブのスケジューリングについての知識が問われます。 データ変換ソリューションを特定および実装する、の項目においてはデータ転送の変換やMap Reduceを使用して機械学習固有のデータを処理する知識が問われます。
「探索的データ分析」はデータ分析の一つの手法である探求的データ分析やデータの可視化などを行う知識が問われます。 モデリング用のデータをサニタイズおよび準備する、の項目においては 欠損データ、破損データ、ストップワードなどを特定および処理することや データのフォーマット、正規化、拡張、スケーリングやラベル付けされたデータなどの知識が問われます。 特徴エンジニアリングを実行するの項目では、データセットから特徴 (テキスト、音声、画像、パブリックデータセットなどのデータソー スからの特徴を含む) を特定および抽出することや特徴エンジニアリングの概念を分析/評価する (データのビニング、トークナイゼーショ ン、外れ値、合成的特徴、One-Hot エンコーディング、次元低減)ことなどの知識が問われます。 機械学習のデータを分析および視覚化する、の項目では、グラフ化 (散布図、時系列、ヒストグラム、ボックスプロット)や記述統計の解釈 (相関関係、要約統計、p 値)やクラスタリング (階層型、診断、エルボープロット、クラスターサイズ)に関する知識が問われます。
「モデリング」では ビジネス上の課題やAIや機械学習における課題の抽出やそれに対する対策に関する知識が 問われます。 ビジネス上の課題を機械学習の課題として捉え直すことや、 特定の機械学習の課題に対して適切なモデルを選択すること、機械学習モデルのトレーニングを行うこと、ハイパーパラメータの最適化を実施すること、 機械学習モデルを評価することなどの知識が問われます。
「機械学習の実装とその運用」では機械学習の実装や実装後の運用などについての知識が問われます。 パフォーマンス、可用性、スケーラビリティ、回復性、および耐障害性を備えた機械学習ソリュ ーションを構築すること、特定の課題に対して適切な機械学習サービスと機能を提案および実装すること、 基本的なAWS セキュリティプラクティスを機械学習ソリューションに適用すること、 機械学習ソリューションのデプロイと運用を行うことに関する知識が問われます。 以上がAWS認定 機械学習 – 専門知識の試験に関する説明とさせていただきます。

本文で紹介させていただいた以外にもデータ分析に関わる資格は少なくありません。 自身がどういった用途でデータ分析を利用するのかという目的によって取得する資格も変わってくるため、 そのあたりについて調べたうえで受験計画をたてるといいでしょう。

まとめ

いかがでしたでしょうか?CompTIA Data+について説明させていただきましたので、 参考にしていただけましたら幸いです。