Apache Sparkによるデータ分析技術の基礎と実践 〜デモ付〜

〜 Spark SQLによるSQL分析、Spark Streamingによるストリームデータ分析、Spark MLによる機械学習、GraphXによるグラフデータ処理 〜

機械学習など先進的な分析機能を即座に活用できるApacheSparkを先取りし、応用するための講座

従来のビッグデータ分析フレームワークが抱えていた問題を大幅に改善し、現在も活発に進化しているApache Sparkをマスターし、効率的なデータ分析に活かそう!

・Apache Sparkは高速にビッグデータを処理する分散処理フレームワークで、ビッグデータ処理基盤として急速に注目を集めています

講師の言葉

 近年ビッグデータ、ビッグデータ分析という言葉に注目が集まっています。またビッグデータ分析はしばしば機械学習やディープ・ラーニングなどと交えて語られ、マーケティングが先行しているために実態をなかなか把握しづらく、混乱を招いています。Apache Sparkはこのような状況の中であらわれ、以前のビッグデータ分析フレームワークが抱えていた問題を大幅に改善しており、現在も活発に開発、機能追加が続いています。
 このセミナーではApache Sparkをめぐる歴史的経緯から昨今の最新情報を踏まえた体系的な説明から、各機能について実際のアプリケーションデモを交えた具体的な解説を行います。また実際にシステムを構築、分析を行うにあたりあわせて使用することが望ましい製品や、個別機能に関する代替選択肢の紹介も行います。本セミナーを受講することで、Apache Sparkを活用した分析をはじめ、ビッグデータを活用するためのシステムの構成を検討することができるようになります。

セミナー詳細

開催日時
  • 2016年10月24日(月) 10:30 ~ 17:30
開催場所 日本テクノセンター研修室
カテゴリー ソフト・データ・画像・デザイン
受講対象者 ・システムアーキテクトの方 ・データ分析担当者の方
予備知識 ・Linuxに関する基礎的な知識 ・Pythonに関する基礎的な知識
修得知識 ・Apache Sparkの概要、他のデータ分析フレームワークとの違い ・Apache Sparkの基礎的な使用方法 ・ビッグデータ分析システムに関する概要
プログラム

1.イントロダクション -Apache Sparkの概要
 (1).データ分析の歴史的な経緯と変化
 (2).近年のデータ分析の変化とスケールアウト分析プラットフォームの課題
 (3).各分析プラットフォームの特徴
 (4).Apache Hadoopとエコシステム
 (5).Apache Sparkの開発経緯と利点(RDD、DAG)
 (6).Apache Sparkの適用分野
 (7).Apache Sparkの今後。Project Tungsten
 (8).Apache Sparkの導入

2.Spark SQLによるSQL分析
 (1).Spark SQLによるSQL分析の利点とデータソースの選択
 (2).ローカルファイル(JSON/CSV/Parquet)の読み込み/書き込み
 (3).HDFSからの読み込み/書き込み
 (4).MongoDBからの読み込み/書き込み
 (5).RDD、Data Frame
 (6).transform関数、action関数、遅延評価、shuffle処理

3.Spark Streamingによるストリームデータ分析
 (1).ストリームデータとは
 (2).ストリームデータ分析手法の違い
 (3).サンプルアプリケーション:Twitterストリーム分析
 (4).Apache Sparkにおけるウィンドウ処理。マイクロバッチ
 (5).ストリーム処理に関する周辺テクノロジー

4.Spark MLによる機械学習
 (1).機械学習と人工知能の違い
 (2).機械学習のディープ・ラーニング
 (3).サンプルアプリケーション:映画のリコメンド
 (4).教師データ、テストデータ、評価関数
 (5).Apache Spark以外の機械学習ライブラリ

5.GraphXによるグラフデータ処理
 (1).グラフデータとは何か。グラフデータによって何がわかるのか
 (2).サンプルアプリケーション: サッカーチームのパス分析
 (3).グラフデータ分析関数
 (4).Apache Spark以外のグラフ分析フレームワーク、グラフデータベース

キーワード Apache Spark フレームワーク ビッグデータ ストリームデータ 機械学習 ディープ・ラーニング 
タグ ソフト管理データ解析組み込みソフト
受講料 一般 (1名):49,500円(税込)
同時複数申込の場合(1名):44,000円(税込)
会場
日本テクノセンター研修室
〒 163-0722 東京都新宿区西新宿2-7-1 新宿第一生命ビルディング(22階)
- JR「新宿駅」西口から徒歩10分
- 東京メトロ丸ノ内線「西新宿駅」から徒歩8分
- 都営大江戸線「都庁前駅」から徒歩5分
電話番号 : 03-5322-5888
FAX : 03-5322-5666
こちらのセミナーは受付を終了しました。
次回開催のお知らせや、類似セミナーに関する情報を希望される方は、以下よりお問合せ下さい。
contact us contact us
各種お問い合わせは、お電話でも受け付けております。
03-5322-5888

営業時間 月~金:9:00~17:00 / 定休日:土日・祝日