Facebook
RMP FEATURE

RMP FEATUREQuipper

未来の学びを創り出す!『スタディサプリ』を進化させるデータ組織とデータ活用事例、その全て
~StudySapuri Data Meetup~

「Distributors of Wisdom」というミッションの達成に向け、世界の果てまで最高の教育を届けるべく教育サービスを開発・提供しているスタディサプリやQuipperにとって「データ」は重要な意味を持っている。前日の「StudySapuri Product Meetup #1」に続き、7月20日に開催された「StudySapuri Data Meetup#1」では、「分析」「エンジニアリング」、そして「R&D」という3つのチームそれぞれで活躍するメンバーが登場し、取り組みを紹介した。

2018-09-20

120名の定員に対し700名を超える申し込みがあるほど注目を集めたこの日のイベント。もともと「教えること」に興味を持っていたり、子供が生まれたことを機にあらためて「教育」について考えるようになった彼らが、どんな思いを持ってデータに向き合っているのだろうか――。

データを解き明かせば、未来の教育のあるべき姿も見えてくる?

01三角の図.JPG 
「自分が注目しているのは学習行動データの可能性。世代が変わっても人間の認知能力はそれほど変わらないし、学習内容も大きくは変わらない。人や時代、社会環境の変化に影響を受けにくい学習行動データを分析していくことで、人間がどのように認知処理を行い、知識を獲得しているのか解き明かしていけるかもしれない」ーー冒頭のセッション「スタディサプリのデータ組織、これまでとこれから」において、スタディサプリのデータ組織を率いる山邉哲生はこのように述べた。

それでなくても、EdTech業界におけるデータやAI活用の機運は高まるばかりだ。「学び」というものが複雑さを増す中、学習者それぞれの理解度に合わせた教育を実現するため、また教育者がより少ない負担で適切な指導を行えるようにするために学習データの活用は不可欠になっており、人材獲得競争も激しさを増しているという。

そんな中Quipperでも、リクルートの傘下に入ったタイミングでデータ分析基盤を作り直し、学習データのモニタリングやレポーティング、データ分析などに取り組んできた。昨今では「サービスの分析・評価だけでなく、新機能の開発に生かし、データの価値を具現化してユーザーに届けたい」(山邉)という。

より具体的には、2つの方向性を考えている。まず「縦軸」は「Quipperが蓄積してきた独自の学習行動データを活用し、未来の学びのあり方を探求し、実現していきたい」(山邉)というもの。R&Dチームがシーズとなる技術の研究開発を進め、エンジニアリングチームがそれを性能改善しながら実運用に耐えうるような運用フローの整備を行う。そしてそこから得られた結果を分析チームが評価検証して次なる改善につなげる......といった具合に三つのチームが連携して動いていくことを考えているという。同時に「横軸」として、「スタディサプリ English」をはじめ、フィリピン、インドネシア、メキシコといった海外諸国で提供中のサービスにもスコープを拡大し、データの側面から支援していく計画だそうだ。

分析基盤の構築で、Quipper全体を「データドリブンな組織」に

02進化したデータ分析.JPG
スタディサプリが収集するデータの数は膨大だ。複数の「口」から流れ込むユーザーの学習履歴や動画視聴ログといった一連のデータはTreasure Dataに集約される。レコード数は10億件を超え、テーブル数は450以上。集計ジョブ数もPrestoとHiveを合わせると100を超える規模になっている。

それもこれも「データとエンジニアリングによって、ユーザーによりよい学習体験を届ける」というミッションのために構築されたものだと、エンジニアリングチームの戸井田明俊は説明した。この基盤をベースに、開発に携わるプロダクトチームはもちろん、「マーケティングも企画開発も、全員がデータを活用しながら分析し、施策を打っている」(戸井田)という。

より活用しやすくするため、用途や使いやすさによって「Luigi+Jenkins」「Digdag (TD Workflow)」「Treasure Dataの登録クエリ」と複数のジョブ実行の仕組みを用意し、使い分けているそうだ。データエンジニアは基幹集計処理をLuigiで実装し、一方PMやマーケティングチームは気軽に使えるTreasure DataのWebコンソールを利用するといったイメージだ。

データ基盤の運用に当たっては「Luigiによるジョブ実行が全ての集計処理の起点になるため、もしその処理が遅れてしまうと全体に影響が出てしまう」(戸井田)。そのため、Luigiの処理実行時間を計測し、可視化することで遅延やボトルネックとなっている処理にすみやかに気付き、リファクタリングなどで対処できるようにした。

また「中には、1年分のアクセスログをフルスキャンするようなワイルドなクエリが投げられることもある。こういった問題のあるクエリを監視する『TD ポリス』というボットプログラムを作り、定期的にTreasure Dataのクエリの状況を確認して、時間がかかりすぎているクエリは強制終了するようにした」(戸井田)といった具合に、いろいろ工夫を凝らして安定運用につなげているそうだ。

こうした取り組みも相まって、「データ分析基盤を作って2年半になるが、利用者が増えただけでなく、Quipper全体としてデータを使ってPDCAを回すデータドリブンな組織になってきた。会社全体でデータの民主化ができたのが大きな進歩」だと戸井田は振り返った。

もちろん課題も残る。1つは、日本だけでなく海外各国のサービスから得られるデータも含めた横断的な分析基盤の構築だ。グローバルな分析を可能にするため、Treasure Dataに加え、海外拠点で利用されてきたBigQueryを組み合わせることで、ハイブリッドで、しかももっと堅牢なデータ分析基盤が構築できないかと検討中だ。

もう1つは、「データ基盤からプロダクトに対し、もっとダイレクトに何らかの価値を提供したい」(戸井田)ということだ。いわば「守りのデータ活用から攻めのデータ活用へ」と表現できるだろう。

例えば、現在R&Dチームが進めている研究開発成果をプロダクトに反映させることも視野に入れている。戸井田は「スタディサプリ全体でマイクロサービス化を進めているが、データ分析基盤もその中に携わり、機械学習を活用した機能を実装してユーザーに提供することを考えている」といい、独自開発したコーチング業務サポートツールを一例として挙げた。

こうして「絶賛、次世代データ分析基盤の開発中」という戸井田。新たな技術にチャレンジしつつ、「ユーザーによりよい学習体験を届ける」という目的をぶれることなく追求していくという。

カンや経験ではなく「データ」に基づいて最適な意思決定を支援

03やってきた分析の概要.JPG
Quipperでは「Distributors of Wisdom」というビジョンのもと、組織文化として「ユーザーファースト」「オーナーシップ」といった5つの「コアバリュー」を掲げている。その1つが「ファクトベース」だ。「カンや経験に基づいて意思決定するのではなく、データから導き出された事実を基に判断する。データ分析チームはそれを支え、推進している」と林田祐輝は説明した。

ポイントは、課題の設定から分析、効果検証、その成果をフィードバックして反映するまでのサイクルを非常に早く回していることだ。「サービスや機能組織ごとに担当のデータサイエンティストが付いて、事業に密接に伴走しながら分析を行っている。物理的にも近い場所にいるので分析する側もドメインに関する知識が得られるし、信頼関係も醸成される。何より、PDCAをすごく早く回せるようになった」と林田は述べた。何らかの知見が得られたら、定例会議を待たずに関係者に即時共有する、といったスピード感で分析タスクを回しているそうだ。

一連の分析のリソースとして、登録時に入力される「ユーザー情報」と、学習履歴、アプリの利用状況といった「学習の行動ログ」、それにアンケートなどから得られる「定性的データ」を組み合わせている。これにPython/RやTableau、DataRobot、Lookerといったツールを組み合わせて分析を加え、さまざまな知見を得ているそうだ。

例えば、志望大学ごと、学年ごとに動画視聴時間の推移を見るだけでも、「一学期から右肩上がりで増加し、特に夏休みには学習意欲が高まる」「難易度の高い大学を目指す生徒は、早めに演習問題に取りかかる」といったさまざまな示唆が得られる。同じように合格大学の難易度別に学習時間を分析していくことで、「もしこの大学を目指すなら、基準学習時間はこのくらい」と提案するといった具合に、一歩踏み込んだ支援も可能になるかもしれない。

データ分析の結果はユーザー向けのサービスだけでなく、社内での意思決定にも活用している。ブログで紹介されている事例だが、スタディサプリの決済手段のうち「キャリア決済」を廃止するかどうかを検討する際にもデータに基づいて見込み損失額を試算し、「ファクトベースで意思決定を下した」。さらに、R&Dチームが開発した新規技術の効果検証も支援している。

このように過去に起こったことの「要因分析」だけでなく、今後どういった方向に向かうべきかの「意思決定支援や予測」にも踏み込み始めたデータ分析チーム。今後はカバーする分野を拡大するとともに、「今はPMからの分析依頼に対応する流れだが、データサイエンティストだからこそできる発想で分析チームからの提案を増やしていきたい。それによって、より効率よくファクトベースでの意思決定を進められるのではないか」と林田。ひいては「最高の学びを支えるスタディサプリを、最適なファクトで導く分析チームでありたい」と、その醍醐味を強調した。

よりよい未来の学びの実現に向け、データやAIにできることを追求

04研究の指針 学びを支援する.JPG
スタディサプリは、授業そのものや教科書・参考書といった教育コンテンツをさまざまなICTを活用して置き換えるだけでなく、AI/機械学習やIoTデバイスを組み合わせたこれからの教育の姿も模索している。それも自社だけで完結するのではなく、大学や他の企業との共同研究を通じてだ。R&Dチームの大西高史がその取り組みを紹介した。

「研究開発が目指しているのは、ディープラーニングなどを使って面白いことをするためではない。いかに学習というものをもっと楽しく、効率的にできるようにするか、生徒がよりよく学べるようになるかという目標を実現する手段として活用している」(大西)。だからこそ、過去に蓄積されてきた教育心理学などの知見に、「スタディサプリで得られた学習行動データを掛け合わせることで、より効果的に学習支援できるのではないかと考えている」そうだ。

これまでも、一律に同じ内容を教えるのではなく、理解度や目標に応じてパーソナライズされた形で教育コンテンツを出し分けたり、時間を効率的に使うための方法を提案するような学習環境はあった。だが「そのノウハウは個人としては蓄積されていたが、データとして残りにくかった」と大西は指摘。「スタディサプリはそれをデータとして蓄積し、サービスに展開していきたい」という。

既にいくつか具体的な取り組みも進んでいる。例えば、「ある内容を習得するにはどの単元、どの項目を踏まえれば、より理解できるか」を提案する前提として、東京大学の松尾研究室とともに、単元同士がどのようにつながっているかのネットワーク化を進めている。また、スタディサプリが蓄積してきた約4万本に上る動画の中から、特定のキーワードに関する事柄だけを学習したいとき、ピンポイントで検索できる機能も開発中だ。音声認識や文字認識エンジンを用いて動画を解析し、タイムスタンプとともにインデックス化することで、「イオン化傾向」などの重要な学術用語についての解説をピンポイントで閲覧できるようになる見込みだ。

ユニークな試みとしては、JINSとともに進めている集中力測定がある。いままで、学習者がどれくらい集中しているかを定量的に図る方法はなかったが、JINSが開発した集中力を測定する眼鏡「JINS MEME」を学生にかけてもらい、「どれくらい集中して勉強しているか」「何時頃に集中しやすいか」といった事柄を個人それぞれに分析し、コーチングに生かすというものだ。

このように「テクノロジーを駆使して、学びをもっと楽しく効果的にしていくことを目指す上で、データやAI関連技術を使うというのは開拓しがいのある領域。しかもスタディサプリなら、実際に生徒に試していただく中で評価検証を行い、サービスとして実装しきるところまで経験できる」と大西はその醍醐味を語り、ぜひ志を同じくするエンジニアや研究者がいれば声をかけてほしいと呼び掛けた。

☆★Quipperでは一緒に働く仲間を募集しています★☆
 
☆★情報発信中!Quipper Product Team Blogも要チェック★☆
今回のイベント内容も掲載→「StudySapuri Data Meetup を開催しました #sapurimeetup

RECRUITMENT

  • 営業職はこちら

    営業職はこちら

  • 企画・スタッフ職はこちら

    企画・スタッフ職はこちら

  • エンジニア・デザイナー職はこちら

同じカテゴリの特集