試験対策
DS検定 リテラシー|ビジネス力
- Source: pages\ds\business-skillcheck.md
- Permalink: /ds/business-skillcheck/
このページについて
このページは、
DS検定(リテラシーレベル)で求められている「ビジネス力」に関するスキル項目を
一覧で確認するためのページです。
分析手法や数値計算そのものではなく、
データを使って意思決定する力・考え方が求められます。
行動規範|ビジネスマインド
| スキルレベル |
チェック項目 |
| ★ |
ビジネスにおける「論理とデータの重要性」を認識し、分析的でデータドリブンな考え方に基づき行動できる |
| ★ |
「目的やゴールの設定がないままデータを分析しても、意味合いが出ない」ことを理解している |
| ★ |
課題や仮説を言語化することの重要性を理解している |
| ★ |
現場に出向いてヒアリングするなど、一次情報に接することの重要性を理解している |
| ★ |
様々なサービスが登場する中で直感的にわくわくし、その裏にある技術に興味を持ち、リサーチできる |
行動規範|データ・AI倫理
| スキルレベル |
チェック項目 |
| ★ |
データを取り扱う人間として相応しい倫理を身に着けている(データのねつ造、改ざん、盗用を行わないなど) |
| ★ |
データ、AI、機械学習の意図的な悪用(真偽の識別が困難なレベルの画像・音声作成、フェイク情報の作成、Botによる企業・国家への攻撃など)があり得ることを勘案し、技術に関する基礎的な知識と倫理を身につけている |
行動規範|コンプライアンス
| スキルレベル |
チェック項目 |
| ★ |
データ分析者・利活用者として、データの倫理的な活用上の許容される範囲や、ユーザサイドへの必要な許諾について概ね理解している(直近の個人情報に関する法令:個人情報保護法、EU一般データ保護規則、データポータビリティなど) |
論理的思考|MECE
| スキルレベル |
チェック項目 |
| ★ |
データや事象の重複に気づくことができる |
論理的思考|構造化能力
| スキルレベル |
チェック項目 |
| ★ |
与えられた分析課題に対し、初動として様々な情報を収集し、大まかな構造を把握することの重要性を理解している |
論理的思考|言語化能力
| スキルレベル |
チェック項目 |
| ★ |
対象となる事象が通常見受けられる場合において、分析結果の意味合いを正しく言語化できる |
論理的思考|ストーリーライン
| スキルレベル |
チェック項目 |
| ★ |
一般的な論文構成について理解している (序論⇒アプローチ⇒検討結果⇒考察や、序論⇒本論⇒結論 など) |
論理的思考|ドキュメンテーション
| スキルレベル |
チェック項目 |
| ★ |
データの出自や情報の引用元に対する信頼性を適切に判断し、レポートに記載できる |
| ★ |
1つの図表〜数枚程度のドキュメントを論理立ててまとめることができる(課題背景、アプローチ、検討結果、意味合い、ネクストステップ) |
論理的思考|説明能力
| スキルレベル |
チェック項目 |
| ★ |
報告に対する論拠不足や論理破綻を指摘された際に、相手の主張をすみやかに理解できる |
着想・デザイン|AI活用検討
| スキルレベル |
チェック項目 |
| ★ |
既存の生成AIサービスやツールを活用し、自身の身の回りの業務・作業の効率化ができる |
課題の定義|KPI
| スキルレベル |
チェック項目 |
| ★ |
担当する分析プロジェクトにおいて、当該事業の収益モデルと主要な変数を理解している |
課題の定義|スコーピング
| スキルレベル |
チェック項目 |
| ★ |
担当する事業領域について、市場規模、主要なプレーヤー、支配的なビジネスモデル、課題と機会について説明できる |
| ★ |
主に担当する事業領域であれば、取り扱う課題領域に対して基本的な課題の枠組みが理解できる(調達活動の5フォースでの整理、CRM課題のRFMでの整理など) |
| ★ |
既知の事業領域の分析プロジェクトにおいて、分析のスコープが理解できる |
アプローチ設計|データ入手
| スキルレベル |
チェック項目 |
| ★ |
仮説や既知の問題が与えられた中で、必要なデータにあたりをつけ、アクセスを確保できる |
アプローチ設計|分析アプローチ設計
| スキルレベル |
チェック項目 |
| ★ |
スコープ、検討範囲・内容が明確に設定されていれば、必要な分析プロセスが理解できる(データ、分析手法、可視化の方法など) |
アプローチ設計|生成AI活用
| スキルレベル |
チェック項目 |
| ★ |
大規模言語モデルにおいては、事実と異なる内容がさも正しいかのように生成されることがあること(Hallucination)、これらが根本的に避けることができないことを踏まえ、利用に際しては出力を鵜呑みにしない等の注意が必要であることを知っている |
| ★ |
Hallucinationが起きていることに気づくための適切なアクションをとることができる(検索等によるリサーチ結果との比較や、他LLMの出力結果との比較、正確な追加情報を入力データに付与することによる出力結果の変化比較など) |
データ理解|統計情報への正しい理解
| スキルレベル |
チェック項目 |
| ★ |
単なるローデータとしての実数だけを見ても判断出来ない事象が大多数であり、母集団に占める割合などの比率的な指標でなければ数字の比較に意味がないことがわかっている |
| ★ |
ニュース記事などで統計情報に接したときに、数字やグラフの不適切な解釈に気づくことができる |
データ理解|ビジネス観点での理解
| スキルレベル |
チェック項目 |
| ★ |
ビジネス観点で仮説を持ってデータをみることの重要性と、仮に仮説と異なる結果となった場合にも、それが重大な知見である可能性を理解している |
データ理解|意味合いの抽出、洞察
| スキルレベル |
チェック項目 |
| ★ |
分析結果を元に、起きている事象の背景や意味合い(真実)を見抜くことができる |
事業への実装|評価・改善の仕組み
| スキルレベル |
チェック項目 |
| ★ |
結果、改善の度合いをモニタリングする重要性を理解している |
契約・権利保護|契約
| スキルレベル |
チェック項目 |
| ★ |
二者間で交わされる一般的な契約の概念を理解している(請負契約と準委任契約の役務や成果物の違いなど) |
契約・権利保護|権利保護
| スキルレベル |
チェック項目 |
| ★ |
AI・データを活用する際に、組織で規定された権利保護のガイドラインを説明できる |
PJマネジメント|プロジェクト発足
| スキルレベル |
チェック項目 |
| ★ |
プロジェクトにおけるステークホルダーや役割分担、プロジェクト管理・進行に関するツール・方法論が理解できる |
PJマネジメント|リソースマネジメント
| スキルレベル |
チェック項目 |
| ★ |
指示に従ってスケジュールを守り、チームリーダーに頼まれた自分の仕事を完遂できる |
| ★ |
担当するタスクの遅延や障害などを発見した場合、迅速かつ適切に報告ができる |
使い方のおすすめ
- 学習前:
ビジネス観点で何が問われるかを確認
- 学習中:
記事がどのチェック項目に対応しているかを意識
- 試験前:
「説明できるか?」を基準に自己確認
※ 技術系スキルは
データサイエンス力シート を参照してください。
DS検定 リテラシー|データサイエンス力シート
- Source: pages\ds\skillcheck.md
- Permalink: /ds/skillcheck/
このページについて
このページは、
DS検定(リテラシーレベル)で求められているスキル・チェック項目を
一覧で確認するためのページです。
ブログ内の各記事は、
ここに記載されたチェック項目を 1つずつ確実にカバーする ことを目的に作成しています。
- 試験範囲の全体像を把握する
- どこまで学習できているかを確認する
- 記事と試験要件をひも付けて理解する
ための 基準ページ として使ってください。
数学的理解|線形代数基礎
| スキルレベル |
チェック項目 |
| ★ |
ベクトルの内積に関する計算方法を理解し、線形式をベクトルの内積で表現できる |
| ★ |
行列同士、および行列とベクトルの計算方法を正しく理解し、複数の線形式を行列の積で表現できる |
| ★ |
逆行列の定義、および逆行列を求めることにより行列表記された連立方程式が解けることを理解している |
| ★ |
固有ベクトルおよび固有値の意味を理解している |
数学的理解|微分・積分基礎
| スキルレベル |
チェック項目 |
| ★ |
微分により計算する導関数が傾きを求めるための式であることを理解している |
| ★ |
微分により計算する導関数が傾きを求めるための式であることを理解している |
| ★ |
積分と面積の関係を理解し、確率密度関数を定積分することで確率が得られることを説明できる |
数学的理解|集合論基礎
| スキルレベル |
チェック項目 |
| ★ |
和集合、積集合、差集合、対称差集合、補集合についてベン図を用いて説明できる |
| ★ |
論理演算と集合演算の対応を理解している(ANDが積集合に対応するなど) |
科学的解析の基礎|統計数理基礎
| スキルレベル |
チェック項目 |
| ★ |
順列や組合せの式 nPr, nCr を理解し、適切に使い分けることができる |
| ★ |
確率に関する基本的な概念の意味を説明できる(確率、条件付き確率、期待値、独立など) |
| ★ |
平均、中央値、最頻値の算出方法の違いを説明できる |
| ★ |
与えられたデータにおける分散、標準偏差、四分位、パーセンタイルを理解し、目的に応じて適切に使い分けることができる |
| ★ |
母(集団)平均と標本平均、不偏分散と標本分散がそれぞれ異なることを説明できる |
| ★ |
標準正規分布の平均と分散の値を知っている |
| ★ |
相関関係と因果関係の違いを説明できる |
| ★ |
名義尺度、順序尺度、間隔尺度、比例尺度の違いを説明できる |
| ★ |
ピアソンの相関係数の分母と分子を説明できる |
| ★ |
5つ以上の代表的な確率分布を説明できる |
| ★ |
二項分布は試行回数が増えていくとどのような分布に近似されるかを知っている |
| ★ |
変数が量的、質的どちらの場合でも関係の強さを算出できる |
| ★ |
指数関数とlog関数の関係を理解し、片対数グラフ、両対数グラフ、対数化されていないグラフを適切に使いわけることができる |
| ★ |
ベイズの定理を説明できる |
科学的解析の基礎|洞察
| スキルレベル |
チェック項目 |
| ★ |
分析、図表から直接的な意味合いを抽出できる(バラツキ、有意性、分布傾向、特異性、関連性、変曲点、関連度の高低など) |
| ★ |
想定に影響されず、数量的分析結果を客観的に解釈できる |
科学的解析の基礎|性質・関係性
| スキルレベル |
チェック項目 |
| ★ |
適切なデータ区間設定でヒストグラムを作成し、データのバラつき方を把握できる |
| ★ |
適切な軸設定でクロス集計表を作成し、属性間のデータの偏りを把握できる |
| ★ |
量的変数の散布図を描き、2変数の関係性を把握できる |
科学的解析の基礎|推定・検定
| スキルレベル |
チェック項目 |
| ★ |
点推定と区間推定の違いを説明できる |
| ★ |
統計的仮説検定において帰無仮説と対立仮説の違いを説明できる |
| ★ |
第1種の過誤、第2種の過誤、p値、有意水準の意味を説明できる |
| ★ |
片側検定と両側検定の違いを説明できる |
| ★ |
検定する対象となるデータの対応の有無を考慮した上で適切な検定手法(t検定, z検定など)を選択し、適用できる |
科学的解析の基礎|アソシエーション分析
| スキルレベル |
チェック項目 |
| ★ |
条件Xと事象Yの関係性を信頼度、支持度、リフト値を用いて評価できる |
科学的解析の基礎|因果推論
| スキルレベル |
チェック項目 |
| ★ |
ある特定の処置に対して、その他の変数や外部の影響を除いた効果を測定するためには、処置群(実験群)と対照群に分けて比較・分析する必要があることを知っている |
| ★ |
ある変数が他の変数に与える影響(因果効果)を推定したい場合、その双方に影響を与える共変量(交絡因子)の考慮が重要であると理解している(喫煙の有無と疾病発症の双方に年齢が影響している場合など) |
| ★ |
分析の対象を定める段階で選択バイアスが生じる可能性があることを理解している(途中離脱者の除外時、欠損データの除外時など) |
データの理解・検証|データ確認
| スキルレベル |
チェック項目 |
| ★ |
単独のグラフに対して、集計ミスや記載ミスなどがないかチェックできる |
| ★ |
データ項目やデータの量・質について、指示のもと正しく検証し、結果を説明できる |
データの理解・検証|俯瞰・メタ思考
| スキルレベル |
チェック項目 |
| ★ |
データが生み出される経緯・背景を考え、データを鵜呑みにはしないことの重要性を理解している |
データの理解・検証|データ理解
| スキルレベル |
チェック項目 |
| ★ |
どのような知見を得たいのか、目的に即して集計し、データから事実を把握できる |
| ★ |
データから事実を正しく浮き彫りにするために、集計の切り口や比較対象の設定が重要であることを理解している |
| ★ |
普段業務で扱っているデータの発生トリガー・タイミング・頻度などを説明でき、また基本統計量や分布の形状を把握している |
| ★ |
時系列データとは何か、その基礎的な扱いについて説明できる(時系列グラフによる周期性やトレンドの確認、移動平均、回帰や相関計算における注意点など) |
データ準備|サンプリング
| スキルレベル |
チェック項目 |
| ★ |
標本誤差およびサンプリングバイアス、およびそれぞれの違いについて説明できる |
| ★ |
実験計画法の基本的な3原則(局所管理化、反復、無作為化)について説明できる |
データ準備|データクレンジング
| スキルレベル |
チェック項目 |
| ★ |
外れ値・異常値・欠損値とは何かを理解し、指示のもと適切に検出と除去・変換などの対応ができる |
データ準備|データ加工
| スキルレベル |
チェック項目 |
| ★ |
標準化とは何かを理解し、適切に標準化が行える |
| ★ |
名義尺度の変数をダミー変数に変換できる |
データ準備|特徴量エンジニアリング
| スキルレベル |
チェック項目 |
| ★ |
数値データの特徴量化(二値化/離散化、対数変換、スケーリング/正規化、交互作用特徴量の作成など)を行うことができる |
データ可視化|方向性定義
| スキルレベル |
チェック項目 |
| ★ |
データの性質を理解するために、データを可視化し眺めて考えることの重要性を理解している |
| ★ |
可視化における目的の広がりについて概略を説明できる(単に現場の作業支援する場合から、ビッグデータ中の要素間の関連性をダイナミックに表示する場合など) |
データ可視化|軸出し
| スキルレベル |
チェック項目 |
| ★ |
散布図などの軸出しにおいて、目的やデータに応じて縦軸・横軸の候補を適切に洗い出せる |
| ★ |
積み上げ縦棒グラフでの属性の選択など、目的やデータに応じて適切な層化(比較軸)の候補を出せる |
データ可視化|データ加工
| スキルレベル |
チェック項目 |
| ★ |
サンプリングやアンサンブル平均によって適量にデータ量を減らすことができる |
| ★ |
読み取りたい特徴を効果的に可視化するために、統計量を使ってデータを加工できる |
データ可視化|表現・実装技法
| スキルレベル |
チェック項目 |
| ★ |
データ解析部門以外の方に、データの意味を可視化して伝える重要性を理解している |
| ★ |
情報提示の相手や場に応じて適切な情報濃度を判断できる(データインク比の考え方など) |
| ★ |
不必要な誇張をしないための軸表現の基礎を理解できている(コラムチャートのY軸の基準点は「0」からを原則とし軸を切らないなど) |
| ★ |
強調表現がもたらす効果と、明らかに不適切な強調表現を理解している(計量データに対しては位置やサイズ表現が色表現よりも効果的など) |
| ★ |
1~3次元の比較において目的(比較、構成、分布、変化など)に応じ、BIツール、スプレッドシートなどを用いて図表化できる |
| ★ |
端的に図表の変化をアニメーションで可視化できる(人口動態のヒストグラムが経年変化する様子を表現するなど) |
| ★ |
1~3次元の図表を拡張した多変量の比較を適切に可視化できる(平行座標、散布図行列、テーブルレンズ、ヒートマップなど) |
データ可視化|意味抽出
| スキルレベル |
チェック項目 |
| ★ |
外れ値を見出すための適切な表現手法を選択できる |
| ★ |
データの可視化における基本的な視点を挙げることができる(特異点、相違性、傾向性、関連性を見出すなど) |
モデル化|回帰・分類
| スキルレベル |
チェック項目 |
| ★ |
単回帰分析において最小二乗法、回帰係数、標準誤差、決定係数を理解し、モデルを構築できる |
| ★ |
重回帰分析において偏回帰係数と標準偏回帰係数、重相関係数、自由度調整済み決定係数について説明できる |
| ★ |
線形回帰分析とロジスティック回帰分析のそれぞれが予測する対象の違いを理解し、適切に使い分けられる |
モデル化|統計的評価
| スキルレベル |
チェック項目 |
| ★ |
ROC曲線、AUC(Area under the curve)を用いてモデルの精度を評価できる |
| ★ |
混同行列(正誤分布のクロス表)、Accuracy、Precision、Recall、F値、特異度を理解し、精度を評価できる |
| ★ |
RMSE(Root Mean Square Error)、MAE(Mean Absolute Error)、MAPE(Mean Absolute Percentage Error)、決定係数といった評価尺度を理解し、精度を評価できる |
モデル化|機械学習
| スキルレベル |
チェック項目 |
| ★ |
機械学習のモデルを使用したことがあり、どのような問題を解決できるか理解している(回帰・分類、クラスター分析の用途など) |
| ★ |
「教師あり学習」「教師なし学習」の違いを理解している |
| ★ |
過学習とは何か、それがもたらす問題について説明できる |
| ★ |
次元の呪いとは何か、その問題について説明できる |
| ★ |
教師あり学習におけるアノテーションの必要性を説明できる |
| ★ |
観測されたデータにバイアスが含まれる場合や、学習した予測モデルが少数派のデータをノイズと認識してしまった場合などに、モデルの出力が差別的な振る舞いをしてしまうリスクを理解している |
| ★ |
機械学習における大域的(global)な説明(モデル単位の各変数の寄与度など)と局所的(local)な説明(予測するレコード単位の各変数の寄与度など)の違いを理解している |
| ★ |
ホールドアウト法、交差検証(クロスバリデーション)法の仕組みを理解し、訓練データ、パラメータチューニング用の検証データ、テストデータを作成できる |
| ★ |
時系列データの場合は、時間軸で訓練データとテストデータに分割する理由を理解している |
| ★ |
機械学習モデルは、データ構成の変化(データドリフト)により学習完了後から精度が劣化していくため、運用時は精度をモニタリングする必要があることを理解している |
| ★ |
過学習とは何か、それがもたらす問題について説ニューラルネットワークの基本的な考え方を理解し、入力層、隠れ層、出力層の概要と、活性化関数の重要性を理解している明できる |
| ★ |
決定木をベースとしたアンサンブル学習(Random Forest、勾配ブースティング[Gradient Boosting Decision Tree:GBDT]、 その派生形であるXGBoost、LightGBMなど)による分析を、ライブラリを使って実行でき、変数の寄与度を正しく解釈できる |
| ★ |
連合学習では、データは共有せず、モデルのパラメータを共有して複数のモデルを統合していることを理解している |
| ★ |
モデルの性能を改善するためには、モデルの改善よりもデータの質と量を向上させる方が効果的な場合があることを理解している |
モデル化|深層学習
| スキルレベル |
チェック項目 |
| ★ |
深層学習(ディープラーニング)モデルの活用による主なメリットを理解している(特徴量抽出が可能になるなど) |
| ★ |
データサイエンスやAIの分野におけるモダリティの意味を説明できる(データがどのような形式や方法で得られるか、など) |
モデル化|時系列分析
| スキルレベル |
チェック項目 |
| ★ |
時系列分析を行う際にもつべき視点を理解している(長期トレンド、季節成分、周期性、ノイズ、定常性など) |
モデル化|クラスタリング
| スキルレベル |
チェック項目 |
| ★ |
教師なし学習のグループ化(クラスター分析)と教師あり学習の分類(判別)モデルの違いを説明できる |
| ★ |
階層クラスター分析と非階層クラスター分析の違いを説明できる |
| ★ |
階層クラスター分析において、デンドログラムの見方を理解し、適切に解釈できる |
モデル化|ネットワーク分析
| スキルレベル |
チェック項目 |
| ★ |
ネットワーク分析におけるグラフの基本概念(有向・無向グラフ、エッジ、ノード等)を理解している。 |
モデル利活用|レコメンド
| スキルレベル |
チェック項目 |
| ★ |
レコメンドアルゴリズムにおけるコンテンツベースフィルタリングと協調フィルタリングの違いを説明できる |
非構造化データ処理|自然言語処理
| スキルレベル |
チェック項目 |
| ★ |
テキストデータに対する代表的なクリーニング処理(小文字化、数値置換、半角変換、記号除去、ステミングなど)を目的に応じて適切に実施できる |
| ★ |
形態素解析や係り受け解析のライブラリを適切に使い、基本的な文書構造解析を行うことができる |
| ★ |
自然言語処理を用いて解けるタスクを理解し、各タスクの入出力を説明できる(GLUEタスクや固有表現抽出、機械翻訳など) |
非構造化データ処理|画像認識
| スキルレベル |
チェック項目 |
| ★ |
画像のデジタル表現の仕組みと代表的な画像フォーマットを知っている |
| ★ |
画像に対して、目的に応じた適切な色変換や簡単なフィルタ処理などを行うことができる |
| ★ |
画像データに対する代表的なクリーニング処理(リサイズ、パディング、正規化など)を目的に応じて適切に実施できる |
| ★ |
画像認識を用いて解けるタスクを理解し、入出力とともに説明できる(識別、物体検出、セグメンテーションなどの基本的タスクや、姿勢推定、自動運転などの応用的タスク) |
非構造化データ処理|映像認識
| スキルレベル |
チェック項目 |
| ★ |
動画のデジタル表現の仕組みと代表的な動画フォーマットを理解しており、動画から画像を抽出する既存方法を使うことができる |
非構造化データ処理|音声認識
| スキルレベル |
チェック項目 |
| ★ |
wavやmp3などの代表的な音声フォーマットの特徴や用途、基本的な変換処理について説明できる(サンプリングレート、符号化、量子化など) |
生成|大規模言語モデル
| スキルレベル |
チェック項目 |
| ★ |
大規模言語モデル(LLM)でHallucinationが起こる理由を学習に使われているデータの観点から説明できる(学習用データが誤りや歪みを含んでいる場合や、入力された問いに対応する学習用データが存在しない場合など) |
使い方のおすすめ
- 学習前:
どんな項目があるかをざっと確認
- 学習中:
該当する記事を読んだらチェック項目を見返す
- 試験前:
★がすべて説明できるかを自己確認
このページを「軸」にして、
各ブログ記事を積み上げていく想定です。
DS検定 リテラシー|データエンジニアリング力シート
- Source: pages\ds\engineering-skillcheck.md
- Permalink: /ds/engineering-skillcheck/
このページについて
このページは、
DS検定(リテラシーレベル)で求められている「データエンジニアリング力」を
一覧で確認するためのページです。
高度な実装スキルではなく、
「データを正しく扱うための考え方・前提理解」が重視されます。
環境構築|システム企画
| スキルレベル |
チェック項目 |
| ★ |
オープンデータを収集して活用する分析システムの要件を整理できる |
環境構築|システム設計
| スキルレベル |
チェック項目 |
| ★ |
サーバー1~10台規模のシステム構築、システム運用を手順書を元に実行できる |
| ★ |
オンプレミス環境もしくはIaaS上のデータベースに格納された分析データのバックアップやアーカイブ作成などの定常運用ができる |
環境構築|アーキテクチャ設計
| スキルレベル |
チェック項目 |
| ★ |
ノーコード・ローコードツールを組み合わせ、要件に応じたアプリやツールを設計できる |
| ★ |
コンテナ技術の概要を理解しており、既存のDockerイメージを活用して効率的に分析環境を構築できる |
| ★ |
分析環境を提供するクラウド上のマネージドサービス(Amazon SageMaker、Azure Machine Learning、Google Cloud Vertex AI、IBM Watson Studioなど)を利用して、機械学習モデルを開発できる |
データ収集|クライアント技術
| スキルレベル |
チェック項目 |
| ★ |
対象プラットフォーム(クラウドサービス、分析ソフトウェア)が提供する機能(SDKやAPIなど)の概要を説明できる |
| ★ |
Webクローラー・スクレイピングツールを用いてWebサイト上の静的コンテンツを分析用データとして収集できる |
データ収集|通信技術
| スキルレベル |
チェック項目 |
| ★ |
システムやネットワーク機器に用意された通信機能(HTTP、FTPなど)を用い、データを収集先に格納するための機能を実装できる |
データ収集|データ抽出
| スキルレベル |
チェック項目 |
| ★ |
データベースから何らかのデータ抽出方法を活用し、小規模なExcelのデータセットを作成できる |
データ収集|データ収集
| スキルレベル |
チェック項目 |
| ★ |
既存のサービスやアプリケーションに対して、分析をするためのログ出力の仕様を整理することができる |
データ構造|基礎知識
| スキルレベル |
チェック項目 |
| ★ |
扱うデータが、構造化データ(顧客データ、商品データ、在庫データなど)か非構造化データ(雑多なテキスト、音声、画像、動画など)なのかを判断できる |
| ★ |
ER図を読んでテーブル間のリレーションシップを理解できる |
データ構造|テーブル定義
| スキルレベル |
チェック項目 |
| ★ |
正規化手法(第一正規化~第三正規化)を用いてテーブルを正規化できる |
データ蓄積|DWH
| スキルレベル |
チェック項目 |
| ★ |
DWHアプライアンス(Oracle Exadata Database Machine、IBM Integrated Analytics Systemなど)に接続し、複数テーブルを結合したデータを抽出できる |
データ蓄積|分散技術
| スキルレベル |
チェック項目 |
| ★ |
HadoopやSparkの分散技術の基本的な仕組みと構成を理解している |
| ★ |
NoSQLデータストア(HBase、Cassandra、Mongo DB、CouchDB、Amazon DynamoDB、Azure Cosmos DB、Google Cloud Firestoreなど)にAPIを介してアクセスし、新規データを登録できる |
データ蓄積|クラウド
| スキルレベル |
チェック項目 |
| ★ |
クラウド上のオブジェクトストレージサービス(Amazon S3、Azure Blob Storage、Google Cloud Storage、IBM Cloud Object Storageなど)に接続しデータを格納できる |
データ加工|フィルタリング処理
| スキルレベル |
チェック項目 |
| ★ |
表計算ソフトのデータファイルに対して、条件を指定してフィルタリングできる(特定値に合致する・もしくは合致しないデータの抽出、特定範囲のデータの抽出、部分文字列の抽出など) |
| ★ |
正規表現を活用して条件に合致するデータを抽出できる(メールアドレスの書式を満たしているか判定をするなど) |
データ加工|ソート処理
| スキルレベル |
チェック項目 |
| ★ |
表計算ソフトのデータファイルに対して、目的の並び替えになるように複数キーのソート条件を設定ができる |
データ加工|統合処理
| スキルレベル |
チェック項目 |
| ★ |
表計算ソフトのデータファイルに対して、単一条件による内部結合、外部結合、自己結合ができ、UNION処理ができる |
データ加工|前処理
| スキルレベル |
チェック項目 |
| ★ |
表計算ソフトのデータファイルに対して、NULL値や想定外・範囲外のデータを持つレコードを取り除く、または既定値に変換できる |
データ加工|マッピング処理
| スキルレベル |
チェック項目 |
| ★ |
表計算ソフトのデータファイルに対して、規定されたリストと照合して変換する、都道府県名からジオコードに変換するなど、ある値を規定の別の値で表現できる |
データ加工|サンプリング処理
| スキルレベル |
チェック項目 |
| ★ |
表計算ソフトのデータファイルに対して、ランダムまたは一定間隔にレコードを抽出できる |
データ加工|集計処理
| スキルレベル |
チェック項目 |
| ★ |
表計算ソフトのデータファイルのデータを集計して、合計や最大値、最小値、レコード数を算出できる |
データ加工|変換・演算処理
| スキルレベル |
チェック項目 |
| ★ |
表計算ソフトのデータファイルのデータに対する四則演算ができ、数値データを日時データに変換するなど別のデータ型に変換できる |
| ★ |
変換元データと変換先データの文字コードが異なる場合、変換処理のコードがかける |
データ共有|データ出力
| スキルレベル |
チェック項目 |
| ★ |
加工・分析処理結果をCSV、XML、JSON、Excelなどの指定フォーマット形式に変換してエクスポートできる |
| ★ |
加工・分析処理結果を、接続先DBのテーブル仕様に合わせてレコード挿入できる |
データ共有|データ展開
| スキルレベル |
チェック項目 |
| ★ |
RESTやSOAPなどのデータ取得用Web APIを用いて、必要なデータを取得できる |
データ共有|データ連携
| スキルレベル |
チェック項目 |
| ★ |
FTPサーバー、ファイル共有サーバーなどから必要なデータファイルをダウンロードして、Excelなどの表計算ソフトに取り込み活用できる |
| ★ |
BIツールからデータベース上のDBテーブルを参照して新規レポートやダッシュボードを作成し、指定のユーザグループに公開できる |
| ★ |
BIツールの自由検索機能を活用し、必要なデータを抽出して、グラフを作成できる |
プログラミング|基礎プログラミング
| スキルレベル |
チェック項目 |
| ★ |
小規模な構造化データ(CSV、RDBなど)を扱うデータ処理(抽出・加工・分析など)を、設計書に基づき、プログラム実装できる |
| ★ |
プログラム言語や環境によって、変数のデータ型ごとに確保するメモリサイズや自動型変換の仕様が異なることを理解し、プログラムの設計・実装ができる |
| ★ |
データ処理プログラミングのため分岐や繰り返しを含んだフローチャートを作成できる |
| ★ |
オブジェクト指向言語の基本概念を理解し、スーパークラス(親クラス)を継承して、スーパークラスのプロパティやメソッドを適切に活用できる |
| ★ |
ホワイトボックステストとブラックボックステストの違いを理解し、テストケースの作成とテストを実施できる |
プログラミング|拡張プログラミング
| スキルレベル |
チェック項目 |
| ★ |
JSON、XMLなど標準的なフォーマットのデータを受け渡すために、APIを使用したプログラムを設計・実装できる |
| ★ |
外部ライブラリが提供する関数の引数や戻り値の型や仕様を調べて、適切に呼び出すことができる |
プログラミング|AIサービス活用
| スキルレベル |
チェック項目 |
| ★ |
他サービスが提供する分析機能や学習済み予測モデルをWeb API(REST)で呼び出し分析結果を活用することができる |
| ★ |
目的に応じ音声認識関連のAPIを選択し、適用できる(Speech to Text など) |
プログラミング|コーディング支援
| スキルレベル |
チェック項目 |
| ★ |
AIを用いたソースコードのレビュー機能・チェック機能を活用してプログラムのバグ修正や性能改善を実現できる |
プログラミング|アルゴリズム
| スキルレベル |
チェック項目 |
| ★ |
入れ子の繰り返し処理(二重ループ)など計算負荷の高いロジックを特定しアルゴリズムの改善策を検討できる |
プログラミング|分析プログラム
| スキルレベル |
チェック項目 |
| ★ |
Jupyter Notebook(Pythonなど)やRStudio(R)などの対話型の開発環境を用いて、データの分析やレポートの作成ができる |
| ★ |
クラウド上の統合開発環境(AWS SageMaker Studio Lab、Google Colab、Azure Data Studio、IBM Watson Studioなど)で提供されるNotebookを用いてPythonやRのコードを開発して実行できる |
プログラミング|SQL
| スキルレベル |
チェック項目 |
| ★ |
SQLの構文を一通り知っていて、記述・実行できる(DML・DDLの理解、各種JOINの使い分け、集計関数とGROUP BY、CASE文を使用した縦横変換、副問合せやEXISTSの活用など) |
ITセキュリティ|基礎知識
| スキルレベル |
チェック項目 |
| ★ |
セキュリティの3要素(機密性、完全性、可用性) について具体的な事例を用いて説明できる |
ITセキュリティ|攻撃と防御手法
| スキルレベル |
チェック項目 |
| ★ |
マルウェアなどによる深刻なリスクの種類(消失・漏洩・サービスの停止など)を理解している |
| ★ |
OS、ネットワーク、アプリケーション、データなどの各レイヤーに対して、ユーザーごとのアクセスレベルを設定する必要性を理解している |
ITセキュリティ|暗号化技術
| スキルレベル |
チェック項目 |
| ★ |
暗号化されていないデータは、不正取得された際に容易に不正利用される恐れがあることを理解し、データの機密度合いに応じてソフトウェアを使用した暗号化と復号ができる |
| ★ |
なりすましや改ざんされた文書でないことを証明するために、電子署名が用いられることを理解している |
| ★ |
公開鍵暗号化方式において、受信者の公開鍵で暗号化されたデータを復号化するためには受信者の秘密鍵が必要であることを知っている |
| ★ |
ハッシュ関数を用いて、データの改ざんを検出できる |
ITセキュリティ|認証
| スキルレベル |
チェック項目 |
| ★ |
OAuthに対応したデータ提供サービスに対して、認可サーバから取得したアクセストークンを付与してデータ取得用のREST APIを呼び出すことができる |
AIシステム運用|AutoML
| スキルレベル |
チェック項目 |
| ★ |
AutoMLを用いて予測対象を判定するために最適な入力データの組み合わせと予測モデルを抽出できる |
AIシステム運用|MLOps
| スキルレベル |
チェック項目 |
| ★ |
GitやSubversionなどのバージョン管理ソフトウェアを活用して、開発した分析プログラムのソースをリポジトリに登録しチームメンバーと共有できる |
| ★ |
MLOpsの概要を理解し、AIモデル性能の維持管理作業の基本的な流れを説明できる |
| ★ |
AIシステムのモニタリング項目を理解し、AIモデルの劣化状況や予測対象データの不備、AIシステムの異常を検知できる |
AIシステム運用|AIOps
| スキルレベル |
チェック項目 |
| ★ |
ITシステムの運用におけるAIOpsの概要とメリットを説明できる |
生成AI|プロンプトエンジニアリング
| スキルレベル |
チェック項目 |
| ★ |
生成AIを活用する際、出力したい要件に合わせ、Few-shot PromptingやChain-of-Thoughtなどのプロンプト技法の利用や、各種APIパラメーター(Temperatureなど)の設定ができる |
| ★ |
画像生成AIに組み込まれた標準機能の利用(モデル選択)や、画像生成プロンプトルール(強調やネガティブプロンプトなど)を理解し、適切に入力することで、意図した画像を生成できる |
生成AI|コーディング支援
| スキルレベル |
チェック項目 |
| ★ |
LLMを利用して、データ分析やサービス、システム開発のためのコードを作成、修正、改良できる |
| ★ |
LLMを利用して、開発した機能のテストや分析検証用のダミーデータを生成できる |
使い方のおすすめ
- 学習前:
データを扱う前提知識として確認
- 学習中:
分析記事の前後関係を意識
- 試験前:
「なぜ必要か」を説明できるかで自己チェック
※ 数理・分析面は
データサイエンス力シート
ビジネス面は
ビジネス力シート
を参照してください。
DS検定 リテラシー|AI利活用スキル
- Source: pages\ds\ai-utilization-skillcheck.md
- Permalink: /ds/ai-utilization-skillcheck/
このページについて
このページは、
DS検定(リテラシーレベル)で求められている「AI利活用スキル」を
一覧で確認するためのページです。
モデルを作る力ではなく、
AIを理解し、正しく使い、過信しない力が重視されます。
①使う
| スキルレベル |
チェック項目 |
| ★ |
LLMを利用して、データ分析やサービス、システム開発のためのコードを作成、修正、改良できる |
| ★ |
LLMを利用して、開発した機能のテストや分析検証用のダミーデータを生成できる |
| ★ |
画像生成AIに組み込まれた標準機能の利用(モデル選択)や、画像生成プロンプトルール(強調やネガティブプロンプトなど)を理解し、適切に入力することで、意図した画像を生成できる |
| ★ |
既存の生成AIサービスやツールを活用し、自身の身の回りの業務・作業の効率化ができる |
| ★ |
生成AIを活用する際、出力したい要件に合わせ、Few-shot PromptingやChain-of-Thoughtなどのプロンプト技法の利用や、各種APIパラメーター(Temperatureなど)の設定ができる |
⑤企画
| スキルレベル |
チェック項目 |
| ★ |
モデルの性能を改善するためには、モデルの改善よりもデータの質と量を向上させる方が効果的な場合があることを理解している |
⑥技術的理解
| スキルレベル |
チェック項目 |
| ★ |
様々なサービスが登場する中で直感的にわくわくし、その裏にある技術に興味を持ち、リサーチできる |
人間の関与と⑦技術課題対応責任
| スキルレベル |
チェック項目 |
| ★ |
大規模言語モデルにおいては、事実と異なる内容がさも正しいかのように生成されることがあること(Hallucination)、これらが根本的に避けることができないことを踏まえ、利用に際しては出力を鵜呑みにしない等の注意が必要であることを知っている大規模言語モデルにおいては、事実と異なる内容がさも正しいかのように生成されることがあること(Hallucination)、これらが根本的に避けることができないことを踏まえ、利用に際しては出力を鵜呑みにしない等の注意が必要であることを知っている |
| ★ |
大規模言語モデル(LLM)でHallucinationが起こる理由を学習に使われているデータの観点から説明できる(学習用データが誤りや歪みを含んでいる場合や、入力された問いに対応する学習用データが存在しない場合など) |
| ★ |
Hallucinationが起きていることに気づくための適切なアクションをとることができる(検索等によるリサーチ結果との比較や、他LLMの出力結果との比較、正確な追加情報を入力データに付与することによる出力結果の変化比較など) |
⑧倫理課題対応
| スキルレベル |
チェック項目 |
| ★ |
データ、AI、機械学習の意図的な悪用(真偽の識別が困難なレベルの画像・音声作成、フェイク情報の作成、Botによる企業・国家への攻撃など)があり得ることを勘案し、技術に関する基礎的な知識と倫理を身につけている |
| ★ |
データ分析者・利活用者として、データの倫理的な活用上の許容される範囲や、ユーザサイドへの必要な許諾について概ね理解している(直近の個人情報に関する法令:個人情報保護法、EU一般データ保護規則、データポータビリティなど) |
| ★ |
AI・データを活用する際に、組織で規定された権利保護のガイドラインを説明できる |
使い方のおすすめ
- 学習前:
AIに何を期待してよいか/期待しすぎないかを確認
- 学習中:
記事がどのAI利活用スキルに対応しているかを意識
- 試験前:
「なぜ人の判断が必要か」を説明できるかで確認
※ 数理・分析面は
データサイエンス力シート
ビジネス面は
ビジネス力シート
エンジニアリング面は
データエンジニアリング力シート
を参照してください。