「知識ゼロ」からわずか2ヶ月で解析基盤を構築
―様々な経験を積まれた萩原さんが「受験サプリ」に参加されたのはいつ頃ですか?
萩原 2014年の10月です。当時は、赤井が先ほど述べたように今後の可能性を模索している段階でした。ですから、まずは分析基盤の構築に着手しました。
―どのように基盤を構築しましたか?
萩原「ゼクシィ」では「Hadoop」を利用してオンプレミスで構築しました。しかし、「受験サプリ」ではクラウド型の「トレジャーデータサービス」を導入したんです。
―なぜクラウド型を選んだのですか?
萩原 私たちは「受験サプリ」と同じ「サプリシリーズ」としていくつかのサービスを提供しています。それらの共通基盤として一番動かしやすいのが「トレジャーデータサービス」だと思ったんです。他のデータマネジメントサービスでは、対象となる私たちのサービスがひとつ増えるごとに、手間や費用も倍々になっていくケースもあるので、コストメリットを感じていますね。
―導入はスムーズにいきましたか?
萩原 当時は、社内にプロダクトを作るエンジニアはいたのですが、データを分析したり、その環境を作りこんだりするエンジニアはいなかったんです。ですから、インフラ面も自分でゼロから勉強しました。マーケッターとしては、そこに苦労しましたね。
それでも、2ヶ月後の2014年12月には運用を開始しました。社内の人間をつかまえてわからないことを聞いたりもしましたし、トレジャーデータの営業の方がサポートしてくれたりしたもの大きかったですね。
―社内リソースが少ない状況でも2ヶ月で運用開始できるスピード感なのですね。
萩原 クラウド型なので、始めてから色々と試行錯誤していきましたね。欲しかったデータがきちんと入って、実際に分析を始めたのは2015年の3月くらいでしょうか。
見える化してわかった学習行動と成績の関係
▲講師の実力はトップクラス。9割以上の講師が参考書の執筆を手がけているほどだ。
―分析した「受験サプリ」のデータはどの部門が使っていますか?
萩原 分析したデータを活用しているのは主に3つの部門です。事業開発部門と集客の部門、それにUX部門ですね。私たちはUXの担当ではあるのですが、他の2つの部署へ数字のレポートを作成しています。
―UX部門ではどのようなデータを見ているのでしょうか。
萩原 「トレジャーデータサービス」を導入してからの1番大きな変化は、「ユーザーがどのように動画を見ているのか」がわかるようになったことです。例えば「10分の動画を再生し始めて、5分で一時停止して、3分30秒まで巻き戻した」といった再生する行動の詳細な履歴ですね。今までは、「動画を再生した」ことしかわからなかったんです。
―今まで見えなかった行動が見えるようになったのですね。
萩原 「ユーザーの動画の見方」が見えるようになると、「ユーザーの学習の仕方」が見えるようになるんです。つまり、「ちゃんと動画を見てから問題を解く」といったことがわかるんですね。「学習をしないで最後のテストを受ける」といった行動もわかります。
―学習方法と成績には相関がある?
萩原 そうですね。やはり、きちんと学習を行っているユーザーの方の成績が上昇していくという相関関係が、実際に結果として出ています。また、「成績と利用頻度」にも関係があることがわかっています。一方で、初めから高得点を取るようなユーザーは、利用頻度が低くなってしまうんです。
難易度が低く問題を解かなくなってしまうのでしょう。こういった関係性がわかることで、「ユーザーが離脱しないように問題の難易度を調整する」といった対策が行えるようになりました。
「微積」でつまずいたらどこを復習すればいい?
―解析したデータを活用している事例が他にもあればご紹介ください。
萩原 ほとんどの学校では、学習指導要領にそって教科書の順番通りに授業が行われますよね。例えば、数学の中にも「数Ⅰ」「数A」「数Ⅱ」「数B」といった科目があるわけです。ところが、その学ぶ順番でつまずいてしまっている人もいるんです。「受験サプリ」でも、学習指導要領にのっとった順番で学ぶのが基本的な使い方なのですが、より効率的に学習するための方法がないか、東京大学の松尾研究室と共同研究しています。
―どのような研究なのですか?
萩原 学校の先生が使う「先生用の教科書」というものがあるのですが、その教科書の単語を全てデータ化して解析するんです。「単語の近さ」を解析していくことで、「どの単元とどの単元が近いか」という関係性を明らかにします。さらに、その結果に「受験サプリ」ユーザーの行動データを掛け合わせます。
―どのような行動データを使うのですか?
萩原 ある単元がわからないとき、その単元を単純に繰り返すユーザーもいれば、前の単元に戻るユーザーもいます。その行動ログに注目しました。例えば「数Ⅱの10章」でつまずいた場合、直前の「数Ⅱの9章」ではなく、「数Ⅱの3章」に戻る行動が見られるわけです。その点に注目し専門家と議論した結果、このふたつの単元は関連性が高いとわかりました。
―「教科書の単語を解析したデータ」と「どの単元に戻ったかという行動データ」を利用しているということですか?
萩原 そうですね。この2つを掛け合わせることでネットワークが出来上がっていくんです。現在、この研究の第一段階はほぼ終わりました。
―どのような結果が?
萩原 例えば「微積分と極限」「三角関数と複素数」は、それぞれ密接な関係にある単元だとわかっています。このような関係がわかれば、ある単元につまずいたときに、学ぶべき順番がわかり、同時に戻って学ぶ必要がない単元もわかるわけです。これは、学習の効率化、最適化に大きな役割を果たせると思っています。
学校での行動もデータに蓄積される!?
―今後の「受験サプリ」の展望について教えてください。
萩原 それぞれのユーザーに合わせた学習習慣、学習方法のレコメンドをできるようになりたいですね。まだ研究中ではありますが、学習の仕方というのがかなり見えるようになってきました。学習者の多くは学校の生徒です。ですから、基本的には一週間の行動サイクルが存在します。
―月曜から日曜まで?
萩原 そうですね。月曜から日曜まで、かつ24時間の中でいつ勉強しているのか、いつは勉強ができないのかが見えてくるようになりました。
―具体的には、どう見えるようになったのでしょうか?
萩原 例えば、高校生のユーザーが平日の朝8時台に暗記科目の社会を勉強しているとすれば、通学の移動中の時間を利用しているのでしょう。反対に、高校2年生の水曜日の放課後は絶対に「受験サプリ」を利用していないとすれば、部活動に参加しているか、予備校に通っているのではないか。こういった制約条件や学習が可能なエリアがわかるようになりました。さらに今は学校での行動データもだんだん見えるようになってきたんです。
―学校内での行動ですか?
赤井実は、最近高校に導入いただくケースも増えています。「受験サプリ」を教材として使っていただいているのです。
―どのように使っているのでしょうか?
赤井 放課後に補習授業を行っている高校もありますし、反対に事前に「受験サプリ」の動画を見て、授業ではディスカッションを行うといった使い方をしている高校もあります。
―どのくらいの高校が利用されている?
赤井 高校の数は、公立と私立を合わせて5000校ほどなのですが、現在は700ほどの高校と提携しています。
萩原 高校生の生活の中心は、当然高校ですよね。予備校も生活の主役にはなれないわけです。ですから、その「生活の中心である学校でどんな学習をしたのか」ということがわかるとデータ分析としてはすっごく面白いんですよ。高校と連携することで、データの精度がどんどん上がっていくんです。
―こういったデータから学習方法のレコメンドを?
萩原 さらに、先程から申し上げている「学習方法と成績の相関性」に関するデータも使っていきたいですね。「講義動画を見た直後に問題を解いた点数」と「講義動画を見て、一週間後に再び同じ動画を見てから問題を解いた点数」の差がわかるわけです。今はあくまで研究段階ですが「何曜日の何時に、こんな学習をすれば効果的」など学習方法に踏み込んだレコメンドを、機能として実装していくことを検討しています。
―そのレコメンドの内容もユーザーごとに切り分けるわけですよね?
萩原 そうですね。ゴールが人それぞれ異なるところが、教育サービスの面白い点だと私は思っています。
―ゴールが違う?
萩原 他のサービスであれば、ユーザーが商品を予約したり、購買することがコンバージョンです。しかし、教育は人によってゴールが違うんです。「大学に受かること」がゴールの人もいます。「定期テストの点数を上げたい」という人もいます。低学年であれば、「週に3回勉強する習慣を身に着けたい」というゴールもあるでしょう。「受験サプリ」を使ってもらう頻度をあげたり、より成績が向上したりするように、それぞれのゴールに合わせたデータの解析を行い、最適な学習方法をレコメンドできるようになりたいですね。これが、教育の難しさでもあり、面白さなのだと私は考えています。
Sponsored by Treasure Data Inc.