データサイエンティスト育成講座 株式会社ブレインパッド

Rによる統計解析【データサイエンティスト入門研修】

プログラム概要


ビッグデータの分析に欠かせないデータマイニング手法

データサイエンティストとして分析結果を統計的に正しく理解し、適切な意思決定支援を行うために必要なスキルをケーススタディを通じて学んでいきます。
データ分析の各プロセスに従いながら、モデル(予測、分類、連関、時系列)の作成方法や評価方法について、基本的な一連の流れを身につけることができます。総合演習では、受講生が自社の分析担当者になった想定でデータを分析し、 実際に販売促進案を作成、プレゼンテーションを実施します。
本講座で使用するRは、オープンソースの統計解析環境でさまざまな統計解析手法がパッケージとして提供されています。 大規模データや分散処理システムへの対応も行われており、データサイエンティストにとって必須ツールの一つと言えます。

学習目標

分析結果を統計学に基づき正しく理解するとともに、意思決定に向けた改善提案ができるようになること

利用環境R、Rstudio、Microsoft Office(Excel、PowerPoint)
受講前提高校数学程度の知識がない場合でもご受講いただける内容となっております。
受講人数

最大30名

受講料

1名様 216,000円(税込)

対象者
  • 業務でR言語を使うことになった分析初心者の方
  • 分析プロジェクトに関わることになったマネジメント層の方
  • 単純な集計よりも踏み込んだ分析スキルを習得したい方
  • 多変量解析を含む一連のデータ分析プロセスを体験したい方
  • R言語を使うとどんな分析が可能になるのかを知りたい方
  • 統計の基礎を学びたい方
  • 分析結果を業務改善に生かす方法を知りたい方
  • R(RStudio)の基本操作を習得したい方
  • tidyverseパッケージを用いたRのモダンなデータハンドリングについて学びたい方
  • ggplot2による視覚化の基礎を身に付けたい方
メリット
  • 実データを用いた実践形式の演習を行うことでビジネスでRを活用するために必要な勘所や、分析で役立つポイントを体感しながら習得できます。
  • 分析設計から問題解決までのプロセスを体験することで、分析担当者との円滑なコミュニケーションが期待できます。
  • ハンズオン形式で実際に受講者自身がコーディングをしながら講義を進められるため、R(RStudio)の基本操作を効率よく習得できます。
  • tidyverseによるデータハンドリングを習得することで、分析をより高速に、よりスムーズに行えるようになります。
  • 研修で身に付けたggplot2の基礎を土台として、自由度の高い、より魅力的なグラフを作成できるようになります。

カリキュラム


PART1

【講義:60分】

・分析のプロセス

 -ビジネスの理解〜施策展開までのプロセス

・分析と統計の関わり

 -統計的分析を実務に応用する流れと、技術トレンド

【講義90分+演習30分】

・統計

・R講義&演習

 -Rstudioの使い方

 -基本統計量(平均、中央値、分散、標準偏差)

【演習:60分】

・演習(応用)

 -各種指標の統計量算出

  推移:日別ユーザ数推移

  利用:平均利用回数と標準偏差

  属性:都道府県別の人数、年齢の分布など

PART2

【講義45分+演習30分】

・統計

・R講義&演習

 ーデータの可視化

  度数分布表、ヒストグラム

  系列プロット、箱ひげ図

  クロス集計、散布図

【演習90分】

 ー演習(応用)&発表

  今までの演習での集計結果やグラフを元に、分析課題を設定

【講義75分】

・統計

・R講義

 ー確率分布

 ー統計的仮説検定

  t検定、分散分析、交互作用、χ2乗検定

PART3

【講義60分+演習30分】

・統計

・R講義&演習

 ーモデル作成と評価

  単回帰分析、重回帰分析

  実行結果の見方、予測精度の評価

  モデル選択、注意点

【演習90分】

・演習(応用)&発表

  前日の分析課題に合わせモデルを作成し、結果を発表

【講義60分】

・R講義&演習

 ー他の分析手法の概要と対応するパッケージの説明、結果の見方

  クラスタ分析

  連関規則

  時系列解析

PART4

【演習:240分】

・総合演習(前半)

 新規事業の担当者として、分析結果に基づく販売促進施策の提案を作成

 ー集計、統計量算出による現状把握

 ー仮設構築、分析課題設定

・中間発表

PART4

【演習:480分】

・総合演習(後半)

 ー分析課題に合わせてモデル作成

 ーモデルの結果から、提案作成

・最終発表

・まとめ/講師評

テキストイメージ


弊社のデータ分析・活用に関する知見と人材育成のノウハウを元にした独自のテキストです。

R言語による統計解析【データサイエンティスト入門研修テキストイメージ1

【ポイント1】
実業務で活用できるガイド

ビジネス課題の解決に使われることの多い代表的なデータ分析手法に注力して使い分け方を説明

R言語による統計解析【データサイエンティスト入門研修】テキストイメージ2

【ポイント2】
実務視点での予測とモデル評価
実際の業務での活用を想定し、モデルの評価方法や精度向上のヒントを、事例を交えて説明

開講スケジュール


開催日程は「開講スケジュール」のページをご覧ください。

直近の開講スケジュールは下記です。

  • 2018年12月10日(月)-12月12日(水) 1日目:14:00-18:00、2・3日目:09:00-18:00

  • 2019年02月18日(月)-02月20日(水) 1日目:14:00-18:00、2・3日目:09:00-18:00

  • 2019年03月11日(月)-03月13日(水) 1日目:14:00-18:00、2・3日目:09:00-18:00

受講生の声


基礎の基礎を知れたこと、データ分析の基本戦略みたいなものを学べたことは実りが多かったです。(男性・30代)

Rの操作や書き方についてわからないことを丁寧に教えていただいた。(女性・40代)

Rの書籍を見ながら勉強してはいたが、"tidyverse"にはまだ出会っていなかったのでこの使用方法だけでもかなり操作効率が上がった。(男性・30代)

お申込みについてはこちら お問い合わせ・資料請求はこちら