Apache Sparkの導入検証を行いました－アプリ検証編－

AI/機械学習

執筆者

公開日

2020.10.30

更新日

2024.02.26

皆さん、こんにちは。マーケティングプラットフォーム本部で広告系製品の開発を担当している、田崎と白井です。

今まで2回にわたり、新たな分散基盤である「Apache Spark（アパッチスパーク）」に関して、概要や弊社で実施したパフォーマンス検証について説明させていただきました。

・第1回「Apache Sparkの導入検証を行いました－基礎編－」
・第2回「Apache Sparkの導入検証を行いました－パフォーマンス検証編－」

最終回である今回は、Spark Streamingを使ったサンプルアプリケーション開発とその検証について、皆さんにスライドでご紹介したいと思います。

今回行った検証では、「Apache Kafka（アパッチカフカ）」経由でアクセスログを取得し、そのログを用いてユーザーがコンバージョンするかどうかを予測する、というアプリケーションを作成しました。

スライドの内容

1.目的
2.アプリケーションのイメージ
3.特徴量作成
　(1)特徴量の作成
　(2)アクセスログについて
　(3)アクセスログからの特徴量作成
4.モデル作成
　(1)モデル構築手順
　(2)学習モデルについて
　(3)モデル実装
　(4)MLibを利用したロジスティック回帰
5.モデル適用
　(1)ストリーミング処理での特徴量作成
　(2)ストリーミング処理でのモデル適用
　(3)モデルの保存と読み込み
　(4)結果
　(5)まとめ

Sparkストリーミング検証 from BrainPad Inc.

今回を含め3回にわたり、Apache Sparkの導入検証について説明させていただきました。システムパフォーマンスやアプリケーション作成の“はまりどころ”については、実際に触ってみないと気がつくのが難しいとは思いますが、本検証が、皆さんのApache Spark導入の際の参考になれば幸いです。

このページをシェアする

コピー
しました

この記事に関する
お問い合わせはこちら

あなたにオススメの記事

人気タグから探す

人気記事ランキング

あなたにおすすめの記事

株式会社ブレインパッドについて

2004年の創業以来、「データ活用の促進を通じて持続可能な未来をつくる」をミッションに掲げ、データの可能性をまっすぐに信じてきたブレインパッドは、データ活用を核としたDX実践経験により、あらゆる社会課題や業界、企業の課題解決に貢献してきました。そのため、「DXの核心はデータ活用」にあり、日々蓄積されるデータをうまく活用し、データドリブン経営に舵を切ることであると私達は考えています。

株式会社ブレインパッド
についてはこちら

メールマガジン

Mail Magazine

データ活用の厳選記事や、会員限定のDXのお得情報などをお届けいたします。

1分で簡単登録！

メールマガジンのご案内

Apache Sparkの導入検証を行いました －アプリ検証編－

スライドの内容

AI 記事検索

あなたにおすすめの記事

株式会社ブレインパッドについて

メールマガジン

Apache Sparkの導入検証を行いました－アプリ検証編－