データ活用を陰で支える立役者!デジタルバンクのデータエンジニア・インタビュー
近年、あらゆる産業でデータ活用が進む中、企業においてもデータエンジニアの需要が非常に高まっており、ここ1、2年でも数多くのデータエンジニア関連のイベントが開催される等、盛り上がりをみせています。
今回は、みんなの銀行のデータおよびデータ分析基盤の構築・運用を担う「Architecture Division DWH Group(以下、DWH Group)」のグループリーダー本嶋さんと松本さんに、具体的な業務内容やチーム体制等について話を聞いていきます。
自己紹介とキャリアのきっかけ
本嶋(グループリーダー):
私が新卒の頃はまだ「データエンジニア」という職種はなかったのですが、途中でキャリアチェンジをして、2010年頃、前職のSIerにいる頃にHadoop(※)に触ったのがきっかけです。
それ以降、世の中のトレンドや自分の興味も相まりどんどんデータ業務に携わるようになって今に至るわけですが、昔から統計関連の書籍を読むのは好きだったので比較的自然にキャリアチェンジできました。
松本:
私は学生時代に統計学やデータ分析手法の勉強をし、これまでに機械学習エンジニアやインフラ・アプリケーションエンジニアとしてのキャリアを積んできました。
機械学習モデル構築や施策の効果検証を経験する中で、データの品質や分析基盤の重要性を痛感するようになり、データエンジニアリングという分野に進むことにしました。
データエンジニアの現状
本嶋:
企業における経営資源には、ヒト・モノ・カネ・情報の4つの要素があります(近年では経営環境の変化により、ヒト・モノ・カネ・情報・時間・ブランド・知的財産の7つの要素に注目することもあります)。
ヒト、モノ、カネを重要視しない企業はないと思いますが、情報、すなわちデータも同じように取り扱う必要があります。今、すべての企業にとって「データを正しく管理する」重要度が増してきており、そのデータを適切に扱うためのデータエンジニアの重要性も、必然的に高くなっているとみています。
松本:ひと昔前は、データエンジニアが「データ分析担当者の一部」としてデータ処理を任されるケースも多かったと聞きますが、最近では、データ分析基盤の構築・運用自体が専門性の高い業務として認識されるようになり、多くの企業で専門チームが置かれるケースが増えてきました。
これからは更にデータエンジニアの需要が高まり、その数も増加していくと思います。SaaSや商用OSSの登場により技術的にも更に発展していくと思っています。
本嶋:
そうですね。みんなの銀行では3つのサービスコンセプトを掲げていますが、その実現にはいずれもデータがとても重要な位置を占めているので、今後はさらにデータを起点とした施策が増えていくはずです。
世の中の流れと同様、みんなの銀行でもデータエンジニアに閉じず、データ関連職種の需要は高まる方向だと考えています。
データエンジニアチーム(DWH Group)のミッション
本嶋:
我々の果たすべき使命は、高品質なデータおよびデータ分析基盤を構築・運用することです。
みんなの銀行はデジタルバンクです。デジタルバンクである以上、データを軸にした業務運営は必須事項です。データエンジニアチームではその下支えとして、データに基づいた迅速かつ的確な意思決定を支援していきます。
データは存在するだけでは意味がありません。DIKWモデル(※)でも定義されていますが、「データをいかにビジネスにつながる資源へと昇華させるか」が鍵となります。そのためにもデータエンジニアチームでは、まずは高品質なデータを安定的に提供することを目指しています。
またデータエンジニアチームはエンジニアリング主体の組織ではありますが、みんなの銀行のデータ利活用推進もミッションとして掲げています。
データの利活用方針やデータ基盤の利用手引きをはじめ、データ利活用運用ルールやプロセスの整備を行い、利用者が安心して且つ積極的にデータ利用できる環境を、体制面、ルール面から支えていきます。
業務内容:データマネジメント(グループリーダー本嶋さん)
本嶋:
マネジメントを兼ねているので、自身で開発業務を行うことは少なくなりましたが、社内の他グループからデータ利活用基盤への要望やデータ連携の要件を受け、開発につなげたり、グループ間の調整を行ったりすることが多いですね。
また直近ではデータマネジメントの取組みにも力を入れています。
本嶋:
銀行のサービスが追加されることに伴い、新規作成されるテーブル群をデータ分析環境に連携することはとても大切な業務の1つですが、それだけではあくまで「データを貯める」ということにすぎません。
前述の通り「貯まったデータをどれだけ意味のあるものにするか」ということが、デジタルバンクとしてとても重要になってきます。
そのためデータ利用者が、データの意味を理解した上で利用できるように、データカタログの導入、データ品質の担保、データガバナンス検討(データ利活用規定やプロセスの整備)等を実施しています。
業務内容:データパイプライン開発(松本さん)
松本:
私の場合は主にデータの収集、格納、処理といった、データ分析基盤の構築・運用を中心に行っています。具体的には、PythonやJava、SQLを使って、様々なデータソースからデータを取得し、 BigQuery等に格納しています。 最近ではGoogle Cloud等のクラウドサービスを活用することも多くなりました。
またELTツールの導入やBIツールの運用・整備や、データの問い合わせ対応も行います。
松本:
ある大型リリースに向けての開発でしょうか。大規模なシステム改修となったので特に印象に残っています。
そのリリースでは、多岐にわたるデータソースに対して変更や追加が行われるため、多様なデータ連携開発やBigQueryの開発を行いました。複数のデータソースから情報を集約する必要があり、連携要件もバッチ連携、リアルタイム連携等、多岐に渡っていました。
松本:
まず最初に変更点の影響範囲を正確に把握することが重要だったので、新しいデータ項目やテーブルが既存のデータ分析にどのような影響を与えるのかを、綿密に調査・分析しました。
また、開発期間内での設計変更や、既存データ分析の仕組みへの影響が判明・発生したので、他部署との密なコミュニケーションのもと進めていきました。
データエンジニアの役割と業務範囲
本嶋:
データエンジニアだけで完結する業務はほとんどなく、多くはエンジニア・非エンジニアの枠を超え、組織横断で様々なチームとコミュニケーションを取りながら業務を推進しています。
データエンジニア組織には大きく3つのケイパビリティを持った人材がいるのですが、それぞれでメインとなるコミュニケーション先は変わってきます。
業務によっても異なりますが、代表的なところで言うと下の図のようなチームと一緒に仕事を進めることが多いですね。
松本:
私の場合は、アプリケーションエンジニア、インフラエンジニア、そしてデータサイエンティストのチームとコミュニケーションをとることが多いです。
データ連携においてはアプリケーションエンジニアから要件を聞いて技術に落としたり、新しいサービスや仕組みを導入する際はセキュリティ等の問題が無いかをインフラエンジニアと議論したりします。
また、データの利用者であるデータサイエンティストには、データ利用用途のヒアリングやデータの品質や鮮度について会話をすることが多いです。
仕事の魅力
本嶋:
データ利用者であるデータサイエンティストが、データエンジニアチームに相談に来てくれる時があるのですが、そういう時は活用が進んでいることを実感しますし、より良い環境への改善につながるきっかけとなるので、特にやりがいを感じる瞬間ですね。
逆に、関係者が多岐にわたる業務の調整は、簡単にいかない時もあります。データ活用を進めるための調整事項はとても多いのです。
今は新しいことをはじめる、つまり新たな課題へ対応していくための整備段階なので、やりがいと同じくらい苦労もありますが(笑)、今後、みんなの銀行のデータ活用は加速度的に進んでいきますから、データエンジニアとしてやりがいを感じる瞬間は今よりもっともっと増えていくでしょうね。
松本:
私たちが整備しているデータを利活用してもらえることに、一番のやりがいを感じます。
データが分析や機械学習モデルに使用されることはもちろんですが、例えば他のチームの会議資料に(提供したデータの)グラフや表が掲載されているのを目にしただけでも、とても嬉しくなります(笑)。
逆に「答えのある業務ばかりではない」といった難しい部分もあります。書籍で調べたり、国内外の他社事例をキャッチアップしたりして情報収集するのですが、データエンジニアリング領域は今まさに発展中の段階なので、ベストプラクティスが1つに定まっていないことも多々あります。
変化が激しく最適解がすぐに変わってしまう分野の中で、その時その環境における最適解を見つけることが、難しくも面白い点だと思っています。
技術の選択・取組み
松本:
みんなの銀行ではデータ分析基盤のプラットフォームにGoogle Cloudを採用していますが、新規サービスの導入に寛容なため、次々に出てくるGoogle Cloudの新サービスの採用可否を日々検討しています。
スクラッチで開発しているケースが多いので、技術選定もGoogle Cloudサービスに寄せていくようにしています。
データエンジニアチームでは、特定の技術に固執せず、常に新しい技術を評価して最適なものを選定するように意識し、より良い環境となるように改善を図っていきます。
また、今後は更にデータ利活用に向けたBI(Business Intelligence)ツールやELT(Extract Load Transform)サービスを改善して、データ取得の工数を削減していきたいですね。更に言うと、バッチ処理やリアルタイム処理、といった既存の仕組みを更に改善していきたいです。
チーム体制について
本嶋:
現在、データエンジニアチームは7名体制で、福岡オフィスに6名、東京オフィスに1名に分かれています(2024年9月時点)。この他にビジネスパートナー企業より5名の方に参加いただいており、計12名体制です。
今はたまたま福岡オフィスの方が数が多いですが、「〇〇の業務を行うから東京」「〇〇の業務だから福岡」といった業務による区別はなく、勤務地は自由に選択できます。
データエンジニアチームで活躍している人の特徴
本嶋:
これはどの業種にも当てはまることかと思いますが、積極的に周囲に関わっていくタイプのデータエンジニアは、やはり活躍していますね。そういう姿勢で業務に取組む人がとても多いです。
整備段階の分析環境において機能の追加開発や手直しもありますし、業務も多岐にわたりますが、そんな中でチームの皆がそれぞれの持ち場において積極的に周囲と関わり、課題を見つけ、改善につなげていってくれています。
採用面でいうと実は、募集要項に書かれたデータエンジニア要件に完全マッチした人ばかりが入社して来ているわけではありません。重要なのは入社後で、それぞれが努力を続けた結果、今活躍しているメンバーがほとんどです。
松本:
データエンジニアチームは、プログラムを組んだりDBの運用保守等を経験してきたメンバーが多いですね。
データエンジニアはここ数年で登場してきた職種なので、今携わっている業務をもともと経験していたというメンバーは多くはありません。それでも皆がキャッチアップ力高く、常に自分をアップデートさせようと前進しています。そういうタイプの人が多いですし、そんな人たちが活躍しているように思います。
今後について
本嶋:
デジタルバンクとして、データをいかに活用していくかというのは至上命題です。今後も、データがみんなの銀行の命運を握ることを肝に銘じて取り組んでいきたいです。データエンジニア/データマネジメントに内製で取り組む企業はまだ多くはないと思いますので、少しでも興味のある方はぜひ、みんなの銀行 採用サイトをチェックしてみてください。
松本:
みんなの銀行には、チームで協力し、新しい技術に挑戦していける環境があります。変化の激しいデータエンジニアリングの分野において、最適な答えを見つけ出すのは容易ではありませんが、それ以上のやりがいを感じられるはずだと思っています。今後も知識を広げ、より高度なデータ活用に挑戦していきたいです。
[採用情報]みんなの銀行ではデータエンジニアを募集中です
みんなの銀行では、システム全体のデータのありかたを企画、実装いただけるデータエンジニアを募集しています。
古い手法や固定観念にとらわれず、新しい手法や技術に積極的に挑戦していける人、アプリ開発者、データサイエンティスト等のステークホルダーと円滑にコミュニケーションできる人を歓迎します。
分析基盤のシステム(インフラ)、データ連携処理(アプリケーション)、データマネジメント等、所掌範囲が広い職種です。複数領域に跨ったマネジメントしていただき、将来的にリーダーとして活躍していただきます。
興味のある方は下記の採用サイト「募集要項詳細」をご覧ください!
👇みんなの銀行 採用サイトはコチラ!
https://corporate.minna-no-ginko.com/careers/job-descriptions/data/data-engineer/
👇デジタルバンクのプロジェクトは、なぜ生まれ、どのように開発が進められてきたのか。こちらの本も合わせてお楽しみください!
👇システムマガジンの記事一覧はコチラ!