(c) Recruit Co., Ltd.

2022 IEEE International Conference on Big Dataにリクルート特任研究員 高田 悠矢の執筆した論文が採択

株式会社リクルート

logo_recruit

株式会社リクルート(本社:東京都千代田区、代表取締役社長:北村 吉弘、以下リクルート)の特任研究員である高田 悠矢が執筆した論文が、ビッグデータ分野の最新研究を扱う国際カンファレンス「2022 IEEE International Conference on Big Data(IEEE Big Data 2022)」に採択されました。

論文の概要

今回採択された論文「Implementation of Biased Big Data to the Japanese Official Labor Statistics Using Supervised Learning under Covariate Shift」では、リクルートが事業を運営するなかで捕捉されるビッグデータを用いて、厚生労働省「雇用動向調査」における転職入職者の賃金変動状況という指標の速報化を試みています。

近年、各国の統計作成機関は公的統計の作成において、POS(Point of Sales)データや、携帯電話端末のGPSによって捕捉される位置情報データ、衛星画像データ、Webの検索データ等、いわゆる民間のビッグデータを新たなデータソースとして活用し始めています*。

公的統計作成のために政府等が行うサーベイは、企業や世帯に対して回答を依頼するため、データの収集には多くの時間が必要であり、集計から公表までのタイムラグが発生します。一方、民間企業等が保有するビッグデータは、リアルタイムに取得することが可能であり、タイムラグはほとんど存在しません。つまり、ビッグデータを活用することで、公的統計の公表を大幅に早めることが可能となります。公的統計は、経済政策の判断に用いられるほか、企業の経営判断にも用いられており、その速報化はこうした意思決定の質向上につながると考えられます。

ただし、公的統計作成における民間ビッグデータの活用には課題があります。これらは公的統計作成を意図して取得されたデータではないため、捕捉したい対象の全体を捉えていることはまれであり、部分的にしか捕捉できていないケースがほとんどです。したがって、これらを「捕捉したい対象全体を捉えるためのデータ」と見做す場合、セレクションバイアスの影響を取り除くことが必要となります。

当論文では、機械学習分野で発展した共変量シフト下での教師付き学習のアイデアを応用することで、この課題が解決できることを示しています。

*日本では、例えば、総務省により、各府省、地方公共団体、民間企業等におけるデータ等の相互利活用を推進するため、「ビッグデータ等の利活用推進に関する産官学協議のための連携会議」が開催されています。

執筆者 株式会社リクルート 特任研究員 高田 悠矢

01_takadasan2010年 ⽇本銀⾏⼊⾏
経済指標の推計⼿法設計や景気判断など、マクロ経済・⾦融領域における統計分析業務に携わる。
2015年 株式会社リクルート⼊社 (統合前はリクルートキャリア所属)
経営統括室、事業開発室、人事部、広報部を兼務し、戦略策定のための分析や、リコメンドエンジンの開発、⼈事課題に対する統計分析の適用、⾃社データを活用した経済指標の作成・発信など、データ起点のさまざまな取り組みの企画・実行を担う。
2021年 Re Data Science株式会社 創業 / 株式会社リクルート特任研究員 就任
2018年より、総務省 統計改革実行推進室 研究協力者

関連するプレスリリース