ヘルスデータサイエンス

データサイエンスとは

Data science is the art of turning data into action and an approach to problem solving.

This is accomplished through the creation of data products, which provide actionable information.

(Herman et al., The Field Guide to Data Science. 2013) (Balakrishnan, A Practitioner's Guide to Data Science. 2015)

問題解決にデータを用いることの重要性

問題解決のための行動の階層性

  • 第1階層(90%):日常的に生じる大多数の問題 ➡ 標準対策
  • 第2階層(9%):解決策を立案する必要がある問題 ➡ 専門家たちの経験・知識・度胸に基づく組織的対策
  • 第3階層(1%):上記で解決できない問題 ➡ データサイエンス

(椿 広計. データによる問題解決人材育成)

データサイエンスのプロセス

  • STEP 1: Identify a problem to solve
  • STEP 2: Collect the necessary data
  • STEP 3: Process the data for analysis
  • STEP 4: Analyze the data
  • STEP 5: Interpret the analysis results
  • STEP 6: Make suggestions for problem solving

PPDACサイクル

データサイエンスは循環的なプロセスです。PPDAC(Problem ➡ Plan ➡ Data ➡ Analysis ➡ Conclusion)サイクルは、データサイエンスの代表的なサイクルです。

図02