- tech系
Cloud OnAir 第17回 ~「-リクルートライフスタイルにおけるデジタルトランスフォーメーションとクラウド活用-」~ まとめ
目次
こんにちは。クラウドエース編集部の高木です。
2017年10月5日より、【隔週木曜 18:00~18:45】に、Google 社のエンジニアが、Google Cloud Platform の製品、サービスや導入事例等について解説する番組が始まっています。
ユーザー参加型の生放送番組となっており、視聴者からのリアルタイム Q&A も受け付けています!
この記事では、動画を見逃した方や、見る時間が無い方向けに、要点をかい摘まんで、クイックに紹介したいと思います。
今回の内容は、リクルートライフスタイル社の導入の背景や、実際のアーキテクチャ紹介、導入してどのように変わっていったかについて紹介します!
講師は、Google Cloud カスタマーエンジニアの寳野 雄太さんです。
今回のテーマ: リクルートライフスタイルにおけるデジタルトランスフォーメーションとクラウド活用
前回同様実際に GCP を利用されているお客様の事例を紹介します。
今回は、株式会社リクルートライフスタイルの前田 周輝さんと堀澤 健太さんの事例紹介です。
なぜ GCP を採用したのか、どういったサービスを提供しているかご紹介します。
会社紹介
リクルートライフスタイル社では、ユーザーが探している情報と企業が提供している情報を間に入ってマッチングさせる、マッチングプラットホームを提供しています。
代表的なサービスだと「じゃらん」や「HOT PEPPER グルメ」などがあります。
クラウド活用の背景と変化
リクルートライフスタイル社が GCP を導入した背景には、「市場環境」と「技術の変化」があります。
市場環境
- サービス競争が激化
- グローバル、異業種の参入
技術
- クラウドサービスの台頭
- Big Data 関連技術の発展
これらの世の中の変化によって、サービス開発の 速度・質・規模が大幅に変化しました。
これらの変化に対して、Adoption(採用) 、Transformation(変換)していく必要がありました。
このときに、今まで築いてきたものが障害になってきました。
レガシーの呪縛
- 1000億円以上の利益
- 現状維持バイアス/損失回避
- 旧来型の開発スタイルと組織運営
- 技術負債の蓄積
そのため、ゆるやかな Adoption にとどまっています。
Transform していかなければいけないため、下記3つに対して、対策をして進めていく必要があると考えたとのことです。
People
- 新しいチームの立ち上げ
Process
- 新たにプロセスを策定
- とにかく早くまわす
Technology
- 積極的にクラウドを活用
People / Process / Technology の対策をし、クラウドを導入することにより、プロセスの大幅な短縮が実現
オンプレでは DWH がない、データの加工に時間がかかる等の理由により、下記スライドの作業が 3,4日はかかっていたましたが、20分に短縮することができたとのことです。
複数あるクラウドプロバイダーから GCP を使った決め手は3点あります。
データ素材
- AD (DoubleClick) / Firebase / GA360
ストリーミングでデータがはいってくるので、データをロードする作業を短縮できる
データ加工・処理
- BigQuery
- Spanner
DWH / データレイクを兼ねることが可能な強力なサービス
データ活用の実行エンジン
- Firebase (FCM / Cloud Functions)
データをもとに、分析・テスト・実行までのプロセスすべてがカバーできることが決め手となったとのことです。
アーキテクチャとユースケース
続いて、CET のユースケースを紹介します。
CET とは
そもそも CET とは
- リクルートライフスタイル社のサービス横断で活用されているデータプロダクトのこと
- 主なシステムは以下4つ
- ログ収集
- 機械学習バッチ処理
- ストリームデータ処理
- 分析結果、機械学習の予測結果などを API として提供
- じゃらん net:宿並び替え施策
- ホットペッパービューティー:スタイリスト指名有無予測
ここからは一つずつ、ユースケースを紹介していきます。
じゃらん net リアルタイム UU 集計
リアルタイムに流れるログに対して、宿ごとのユニークユーザーを集計し、API として提供してユーザーに見せる という施策です。
上記スライドの矢印のように、○人が記事を見ている という情報がリアルタイムで確認できます。
じゃらん net での宿 to 宿レコメンド
宿の詳細ページを見ているユーザーにおすすめの宿を表示する施策です。
後ほど説明しますが、機械学習バッチ基盤にデプロイして AB テストなどを運用しています。
じゃらん net でのリアルタイムユーザ to 宿レコメンド
上述したレコメンド機能は日次で集計したデータを元におすすめの宿を表示する 施策でしたが、こちらはリアルタイムでおすすめの宿を表示する施策です。
CET のアーキテクチャ
機械学習バッチ基盤
- データサイエンティストがモデリング
→機械学習エンジニアがバッチ基盤で本番化 - ワークフローエンジンには Airflow を使用
Python で DAG を書いてバージョン管理 - データは BigQuery で一元管理
CET API
- 機械学習バッチの予測結果やストリームデータ処理の結果を Bigtable へ入れる
- GET リクエストパスをキーとして Bigtable を引いて返す
- API Data Loader
- TSV ファイルを Bigtable へロードする仕組み
- 他グループのデータサイエンティストやエンジニアにも開放
- S3 に TSV ファイルをおけば誰でもAPIを作成できる
GCPを利用してみて
良い点
- BigQuery のキャパシティプランニングが必要ない
- プロジェクト噛んで BigQuery のテーブルの共有が簡単にできる
- マイクロサービスアーキテクチャを採用した Web サービス
- 新機械学習基盤のインフラとして
- Cloud ML Engine が利用しやすい
- TensorFlow の環境を自前で用意しなくて良い
改善してほしいところ
- Cloud Composer では Python2 系でしか DAG を記述できない
- 250MB までのモデルしか Cloud ML Engine にデプロイできない
- Cloud ML Engine の Online Prediction の割当がプロジェクトあたり10000リクエスト / 100 秒
- リクルートライフスタイル社の規模では足りない
最後にデジタルトランスフォーメーションを実現するための簡単なまとめがありました。
デジタルトランスフォーメーション実現のためのモダンな開発プロセス
- GitHub Flow とDrone による CI/CD
- Slack によるコミュニケーション
- Terraform による Infrastructure as Code
- Packer, Docker による Immutable Infrastructure
まとめ
今回のまとめです。
- クラウドはリーンアプローチに有効である
- レガシーは大切で重いがまずは最初の一歩を踏み出す
- システムだけでなく組織やプロセスも変える
- この状況を楽しむ
デジタルトランスフォーメーションしていくためには、まず一歩踏み出すことが重要です。
やってみないとわからないことが多いですが、踏み出すためのハードルは下がってきているため、
日進月歩でいいので実際にやってみる、状況を楽しむことが大事とのことです。
最後にひとこと
いかがでしたでしょうか。
リクルートライフスタイル社の堀澤さんもおっしゃっていましたが、GCP はコマンド一つで最新の技術を利用することができ、活用することで、本来自分が行うべき業務に集中することができます。
新しいことを導入するには根幹から変えていく可能性もあり、時間と労力がかかることもございます。
まずは身構えずに一歩踏み出してみるのもいいかもしれません。
GCP は初期設定もほぼなく、簡単に使うことができるため、GCP を使ってその第一歩を踏み出してみてはいかがでしょうか。
参考リンク
Youtube視聴
Cloud OnAir の放送は、今回分含め、バックナンバーも全て Youtube で視聴できます。
スライドと合わせて進行する解説を、是非ご覧ください!
Youtube URL:https://www.youtube.com/watch?v=CwNWeld0Gy8
SlideShare
今回の動画で説明に使用されたスライドについても、SlideShare でいつでも閲覧可能です。
登場した用語について振り返りたい、用語同士の関係性を確認したい等、大変参考になります!
スライド URL:https://www.slideshare.net/GoogleCloudPlatformJP/cloud-onair-2018712
この記事を共有する