タスク一覧



「データ利活用」のタスク例

タスク大分類 「データ利活用」で定義されているタスク例です。これらを参考にしながらタスクや役割を定義してください。
また、各タスクの詳細を参照する場合は、「評価項目を表示」ボタンをクリックしてください。
をクリックすると関連する研修・書籍・資格が検索できます。

タスク大分類 タスク中分類 タスク小分類
データ利活用 ビジネス目標の決定 ビジネス背景情報の収集評価項目を表示
ビジネス目標の決定評価項目を表示

▼評価項目

解決したい課題やビジネス上明らかにしたい疑問点を具体化する

ビジネス目標に関連する他のビジネス要件や制約を明らかにする

プロジェクトに期待する効果を可能な限り定量的に記述する

ビジネス成功基準の設定評価項目を表示

▼評価項目

ビジネスの定量的および定性的な成功基準を設定する

各々のビジネス目標の関連を明らかにする

定性的な成功基準の達成を最終的に判断する責任者を決定する

状況の評価 リソースの調査評価項目を表示

▼評価項目

プロジェクトで利用可能なハードウェアリソースを明らかにする

プロジェクトで利用可能なデータソースのデータの種類や形式を調査する

データの入手方法(外部のデータを購入するか否かを含む)、保存状況、アクセス方法、セキュリティ上の問題等を調査する

対象となる業務の内容やデータに関する専門家を明らかにする

必要なデータベース管理者やその他のサポート要員を確保する

要件、仮説、制約、リスクおよび用語の明確化評価項目を表示

▼評価項目

プロジェクトの結果の展開方法に関する要件を明らかにする

プロジェクトの予算上の制約を明らかにする

利用するデータの品質に関する仮説を立てる

スケジュール、予算、必要なデータの有無や品質、結果の効果や精度等についてのリスクを検討し、リスクを避けるための代替計画を策定する

わかりにくい技術用語や専門用語を明確に定義し、関係者間のコミュニケーションの齟齬を防ぐ

コストと利益の分析評価項目を表示

▼評価項目

データの収集(外部データの購入を含む)、結果の展開、展開後のオペレーション等に関するコストを推定する

ビジネス目標の達成、プロジェクトの結果による副次的な洞察、より深いデータの理解等から得られる利益を推定する

コストと利益(潜在的利益を含む)を比較し、プロジェクトの収益を推定する

目標の決定とプロジェクト計画の策定 プロジェクト目標の設定評価項目を表示

▼評価項目

クラスタ化、予測、分類等、集計・分析・データマイニングの種類を特定する

「3ヶ月の有効性を持つ予測モデルの作成」等、特定の時間単位を使った技術上の目標を設定する

「ダイレクトメールのレスポンス率が20%を超える顧客属性の絞り込み」等、集計・分析の結果やモデルの数値目標を設定する

プロジェクトの成功基準の設定評価項目を表示

▼評価項目

集計・分析の結果やモデルの定量的な評価基準(精度、パフォーマンス等)を設定する

プロジェクトの成功を評価するためのベンチマークを設定する

集計・分析結果やモデルの定性的な評価基準を設定し、成功か否かを判断する責任者を決定する

プロジェクト計画の策定評価項目を表示

▼評価項目

プロジェクトにかかわる人員と作業計画を明らかにする

すべてのフェーズや作業を考慮して所要時間を見積もる

結果の展開に必要な作業やリソースを明らかにする

計画中に意志決定を行うタイミングとレビュー要件を明らかにする

ツールの機能や利用可能な分析手法を調査し、プロジェクトに期待される成果と照らし合わせて評価する

データの理解 初期データの収集評価項目を表示

▼評価項目

入手したデータをテーブル形式に加工し、役に立つ属性(列)と無関係な属性とを選別する

総括的な結論を導き出したり、正確な予測を行ったりするために必要十分なデータが揃っていることを確認する

データソース中の欠損値に対する処理を決定する

データの説明評価項目を表示

▼評価項目

データのフォーマット、取得方法、大きさ(行数および列数)を明らかにする

データにビジネス上の問いに関連する特性が含まれているか検証する

データの値の種類(シンボル値、数値等)を確認する

主要な属性の基本統計量を算出し、その結果がビジネス上の問いにどのような洞察を提供するか検討する

データの探索評価項目を表示

▼評価項目

テーブル、グラフ、その他の視覚化ツールを用いてデータを探索し、統計情報を作成する

探索の結果からプロジェクト目標およびビジネス目標に対する回答を導き出すための仮説を設定する

探索の結果から分析で使用するデータのサブセットを識別する

探索の結果や仮説からプロジェクトの目標を見直す

データ品質の検証評価項目を表示

▼評価項目

欠けている属性や空白フィールドを識別する

後のデータの結合や変換作業で問題になるようなスペリング上の不整合がないか確認する

偏差を調べて、ノイズか分析する価値がある現象かを識別する

データの値の妥当性(論理的な矛盾がないか)を検証する

仮説に影響しないデータの除外を検討する

データマイニングのためのデータの準備 データの選択評価項目を表示

▼評価項目

ビジネス上の問いに関連する特性に着目して、分析に使用する項目(行)と属性(列)の絞り込みを行う

分析に用いるハードウェアおよびソフトウェアの処理能力の観点からデータを絞り込み、サブセットを作成する

特定のデータセットや属性の品質により、結果の妥当性が損なわれないか検証する

データのクリーニング評価項目を表示

▼評価項目

データのノイズ(欠損データ、データエラー、コードの不整合、測定エラー等)を調査する

データのノイズを除去し、用いた手段を記録する

ノイズのために除外されたデータを記録する

新規データの作成・統合・フォーマット評価項目を表示

▼評価項目

特定の条件に該当する項目を識別するためのフラグ等、データモデルの作成に有効な新しい属性を作成する

共通の識別キーと異なる属性(列)を持つ複数のデータソースを、識別キーを用いて結合する

同じ属性(列)を持つ複数のデータソースを統合する

モデリングのアルゴリズムに適した形式にデータのフォーマットを変更する

モデリング モデリング手法の選択評価項目を表示

▼評価項目

データマイニングの最終目標、利用可能なデータ型(シンボル値、数値)、その他のモデリング要件(特定のデータサイズやデータ品質等)に基づき、モデリングの手法を選択する

モデルが信頼できる結果を生成するために十分なデータがあることを検証する

モデルが信頼できる結果を生成するために十分なデータ品質レベルを満たしていることを検証する

テスト設計評価項目を表示

▼評価項目

モデルのテストに使用するデータを決定する

モデルの適合度の測定方法と基準を決定する

モデルの構築(設定調整と実行)の反復の打ち切りを判断する基準(反復回数)を設定する

モデルの構築評価項目を表示

▼評価項目

モデルのパラメータの設定、記録、モデルの実行を繰り返し、適合度の高いパラメータを決定する

複数のモデルを実行し、結果の違いを評価する

モデルの実行結果から導き出される結論や新たな洞察、処理時間、データ品質上の問題等を記録する

モデルの評価評価項目を表示

▼評価項目

テスト計画で決めた測定方法と基準に基づき、モデルの適合度を評価する

ビジネス上の問いに対する回答の観点から結果のレビューを行う

モデルの展開方法とその容易性を検討する

データマイニングの成功基準に対するモデルの効果を分析する

評価 結果の評価と次ステップの決定評価項目を表示

▼評価項目

集計・分析・データマイニングの結果から得られるモデルや所見がビジネス成功基準を満たしているか評価する

集計・分析・データマイニングの結果から得られる特筆すべき新しいまたは固有の所見を明らかにする

集計・分析・データマイニングの結果から得られる所見から提起されるビジネス上の新たな問題を明らかにする

展開のフェーズに進むか、適合度の高いモデルや新たな所見を得るために再度、集計・分析、モデルの調整、変更を行うかを判断する

プロセスの見直し評価項目を表示

▼評価項目

データサイエンスの各々のフェーズが最終結果の価値を高めるために役立ったか検証する

データサイエンスの各々のフェーズや作業を効率化したり改善したりする手段を検討し、記録する

データサイエンスの各々のフェーズの実施にあたっての問題点とその回避策を検討し、記録する

データサイエンスの各々のフェーズで利用できる代替手段、判断、戦略等を検討し、記録する

結果とモデルの展開 展開のプランニング評価項目を表示

▼評価項目

集計・分析・データマイニングの結果を、誰に何を展開すべきかという観点で整理する

集計・分析・データマイニングの結果の手順を追った展開やシステムへの統合の計画を作成する

モデルや所見を戦略担当者に配布するための計画を作成する

モデルや所見を展開する上で予想される問題を判断し、不測の事態に対する計画を作成する

監視と保守のプランニング評価項目を表示

▼評価項目

展開後の集計・分析・データマイニングの結果に対して、追跡する必要がある要素や影響(市場価格、季節変動等)を判断する

展開後の集計・分析・データマイニングの結果の妥当性や精度をどのように測定、監視するか決定する

展開後の集計・分析・データマイニングの結果が「古くなった」ことを判断する基準(精度の閾値、データの有効期限等)を設定する

展開後の集計・分析・データマイニングの結果が「古くなった」場合の対処を想定する

最終報告書の作成評価項目を表示

▼評価項目

結果の報告先(部門、担当者)を特定する

プロジェクトのテーマとなったビジネス上の課題、データサイエンスのプロセス、費用、結果(モデルや所見)の要約、展開計画の概要等を報告書に記述する

データの探索やモデリングの過程で見つかった新たな手がかり等、将来のデータサイエンスの作業における推奨事項を提言する

最終プロジェクトレビューの実施評価項目を表示

▼評価項目

プロジェクトに大きく関与した人々にインタビューを行い、プロジェクト遂行で得られた成果、プロセスの問題点、今後の課題等を明らかにする

集計・分析・データマイニングの結果によって影響を受けた顧客や提携企業等にインタビューを行い、影響の具体的な内容、メリット、デメリット等を明らかにする

プロジェクトの成果とコストを比較し、プロジェクトの価値を評価する

ビジネスでの活用と評価 ビジネスでの活用評価項目を表示

▼評価項目

「レスポンス率の高い顧客属性に基づくダイレクトメール送付先リストの作成」等、集計・分析・マイニングの結果に基づく具体的なアクションを実施する

過去のデータから導き出されたパターンやルールを、ビジネスの戦略・計画立案や意思決定に反映する

集計・分析・データマイニングの結果やモデルの保守に用いるための新たなデータを蓄積する

ビジネス成果の確認評価項目を表示

▼評価項目

ビジネス成果を測定するための具体的な手段(各種データの収集、顧客アンケートの実施等)を定め、実行する

定量的/定性的なビジネス成功基準に基づき、ビジネスでの活用の成果を評価する

ビジネスでの活用の視点から、データサイエンスの活動の課題を次期のプロジェクトにフィードバックする