Rによる統計解析

プログラム概要


プログラム概要

本講座では、データサイエンティストとして分析結果を統計的に正しく理解し、適切な意思決定支援を行うために必要なスキルをケーススタディを通じて学んでいきます。データ分析の各プロセスに従いながら、モデル(予測、分類、連関、時系列)の作成方法や評価方法について、基本的な一連の流れを身につけることができます。総合演習では、受講生が自社の分析担当者になった想定で、データを分析し、実際に販売促進案を作成、プレゼンテーションを実施します。

本講座で使用するRは、オープンソースの統計解析環境で、さまざまな統計解析手法がパッケージとして提供されています。大規模データや分散処理システムへの対応も行われており、データサイエンティストにとって、必須ツールの一つと言えます。

学習目標分析結果を統計的に正しく理解するとともに、
意思決定に向けた提案ができるようになること
利用環境・言語R、Rstudio、Microsoft Office(Excel、PowerPoint)
受講前提Rのインストールができること
高校数学程度の知識(行列・ベクトルの概念やΣの意味がわかるレベル)
受講人数最大20名
受講料1名様 216,000円(税込)

カリキュラム


PART1

【講義:60分】
・分析のプロセス
 ービジネスの理解〜施策展開までのプロセス
・分析と統計の関わり
 ー統計的分析を実務に応用する流れと、技術トレンド
【講義90分+演習30分】
・統計・R講義&演習
 ーRstudioの使い方
 ー基本統計量(平均、中央値、分散、標準偏差)
【演習:60分】
・演習(応用)
 ー各種指標の統計量算出
  推移:日別ユーザ数推移
  利用:平均利用回数と標準偏差
  属性:都道府県別の人数、年齢の分布など

PART2

【講義45分+演習30分】
・統計・R講義&演習
 ーデータの可視化
  度数分布表、ヒストグラム
  時系列プロット、箱ひげ図
  クロス集計、散布図
【演習90分】
 ー演習(応用)&発表
  今までの演習での集計結果やグラフを元に、分析課題を設定
【講義75分】
・統計・R講義
 ー確率分布
 ー統計的仮説検定
  t検定、分散分析、交互作用、χ2乗検定

PART3

【講義60分+演習30分】
・統計・R講義&演習
 ーモデル作成と評価
  単回帰分析、重回帰分析
  実行結果の見方、予測精度の評価
  モデル選択、注意点
【演習90分】
・演習(応用)&発表
 前日の分析課題に合わせモデルを作成し、結果を発表
【講義60分】
・R講義&演習
 ー他の分析手法の概要と対応するパッケージの説明、結果の見方
  クラスタ分析
  連関規則
  時系列解析

PART4

【演習:240分】
・総合演習(前半)
 新規事業の担当者として、分析結果に基づく販売促進施策の提案を作成
 ー集計、統計量算出による現状把握
 ー仮設構築、分析課題設定
・中間発表

PART5

【演習:240分】
・総合演習(後半)
 ー分析課題に合わせてモデル作成
 ーモデルの結果から、提案作成
・最終発表
・まとめ/講師評

開講スケジュール


開催日程は「開講スケジュール」のページをご覧ください。

プロファイル&アンケート結果


受講生のプロファイル&アンケート結果はこちらのページをご覧ください。

 

お申込みについてはこちら お問い合わせ・資料請求はこちら