Sep
15
Data Analysis Study #1 データ分析環境について
インタラクティブな分析環境についてナレッジをシェアしよう!
Organizing : 株式会社ナウキャスト
Registration info |
オンライン参加枠(定員数の上限はありません) Free
Attendees
LT枠 Free
FCFS
|
---|---|
参加者への情報 |
(参加者と発表者のみに公開されます)
|
Description
開催背景・概要
本イベントは、データ分析環境に関する勉強会です。
「生成されるデータ量は年々、爆発的に増えている」という話はよく聞くようになって久しいかと思います。データを活用することで新たなビジネスチャンスに繋がったりする一方、多くの課題も生まれてきました。その一つに「データ分析環境をどのようにするか?」という課題があります。昔は Excel で十分対応出来るようなケースも多かったですが、データ量の増加に伴い、「最早、ローカル環境での分析は不可能」というケースも珍しくはないものとなってきました。昨今は Jupyter Notebook などの OSS や クラウドベンダーが提供する各種サービスなどを活用し、インタラクティブな分析が行える環境を構築するというケースが多くなりつつありますが、まだまだ課題も多いのが、実情かと思います。
- そもそもどのようなサービスなどがあるのか?
- 環境の構築や運用に時間や手間を要する
- 個人情報などを含み、データの扱いに注意を要する
- セキュリティ、ガバナンス、etc...
これらの課題にどのように立ち向かえば良いのか? それらを共有できるイベントに出来ればと思います。
こんな方におすすめ
・これからデータ分析環境の構築を検討されようとしている方
・データ分析やデータエンジニアリング業務に携わっている方
・他社はどのようなデータ分析環境を構築しているのか興味がある方
・EDA の環境に課題を感じている方
参加方法
Zoom での開催を予定しています
※前日までに URL をご案内します。
※参加者の方は、本ページの「参加者への情報」欄でもご確認いただけます。
タイムテーブル
時間 | スケジュール |
---|---|
19:20 | Zoom オープン |
19:30 | オープニング・登壇者自己紹介 |
19:40 | LT1 / ナウキャスト 島さん / 「Amazon EMR Studio を用いた EDA 環境の構築」 |
19:55 | LT2 / estie 黒崎さん / データソースにまたがった分析環境の改善計画 |
20:10 | LT3 / CDataSoftwareJapan 宮本さん /ノーコード×分析基盤で複数データソースからのデータ収集を楽しようの話 |
20:25 | QA&トーク |
20:45 | クロージング |
セッション内容とスピーカー
LT1 / Amazon EMR Studio を用いた EDA 環境の構築
2021年4月に Amazon EMR Studio が一般公開されました。株式会社ナウキャストでは現在、社内向けの EDA 環境の構築を検討しており、その中で Amazon EMR Studio の採用を考えています。本セッションではそれらを通じて得られた Amazon EMR Studio をはじめ、関連するサービスの基本的な使い方、具体的な構成、その他ポイントなどを解説します。
スピーカー:株式会社ナウキャスト データエンジニア 島 真人
武蔵大学経済学部金融学科卒。ファイナンスを専攻。新卒で株式会社QUICK に入社。主にバックエンドエンジニアとして、AWS の各種マネージドサービスを用いて自社内にて手動で行われていた各種オペレーション作業のオートメーション化や金融データと機械学習の技術を活用し、予測モデルを構築するプロジェクトなどに携わった。2021年、株式会社ナウキャストにデータエンジニアとして入社。現在は、データパイプラインの新規構築やエンハンス、社内のデータに対するオペレーション作業の効率化や EDA 環境の構築などに携わっている。
LT2 / 複数データソースにまたがった分析環境の改善計画
オフィス不動産データを扱うestieでは、その不動産データやSaaSプロダクトの利用状況の分析環境として、初期よりredashやAmazon Athena、Amazon RDSを活用しています。 ログの分析ニーズが増えるにつれて、S3にあるログデータへのAthena経由のクエリとRDSにあるデータに対するクエリの結果を紐付けて分析する際に、処理時間/クエリの記載のしやすさという点で課題が発生してきました。本セッションでは、この課題に対してどのように改善していこうとしているかをご紹介します。
スピーカー:株式会社estie エンジニア黒崎 優太
estieで副業でデータ基盤の整備やインフラの改善を担当。
本業は広告配信システムのバックエンドの開発や小売企業のDXを推進するプロダクトのエンジニア。
LT3 ノーコード×分析基盤で複数データソースからのデータ収集を楽しようの話
1企業で利用するデータソースの種類が年々増加してきている今日、ビジネス部門からのリクエストで、さまざまなデータソースからのデータを収集するタスクをされている方も多いと思います。しかしデータを集めることが一筋縄ではいかず、データ収集だけで大きくコストを掛けてしまうことも事実です。そこで本セッションでは実際に社内で行っているノーコードでのデータ基盤やクラウドサービスの活用例など挙げながら、複数データソースにも簡単に対応できる分析基盤の構成などを紹介したいと思います。
スピーカー:CDataSoftwareJapan合同会社 テクニカルサポートエンジニア宮本航太
クラウドサービス向けのコネクタや、ノーコードベースのデータ連携ツールのテクニカルサポートを行いつつ、他社のトライアル製品を探しては日々検証しています。
注意事項
・イベントの内容は予告なく変更になる可能性があります。
・イベントの様子は主催者の PR 目的でウェブサイトやソーシャルメディア等に掲載される可能性があります。
・人材紹介業、営業、ネットワークビジネス勧誘目的の参加はご遠慮ください。
・その他、主催者が不適切と判断した場合は、ご参加をお断りさせていただく場合がございます。
個人情報の取り扱いについて
主催者は、本イベントで取得した個人情報を以下の目的でのみ利用いたします。
・本イベントの運営管理
・各種イベントのご案内
発表者
