お客さまがご利用のブラウザはサポートされていないため、正常に利用できない可能性があります。 お手数ですが、こちらをご確認いただき推奨環境のブラウザをインストールしてご利用ください。

【即戦力・1日】データをキレイにする技術

講義で使用するノウハウ満載のオリジナルPDFとサンプルデータのプレゼント付き。

こんなことを学びます

【こんなことを学びます】
Open Refineというオープンソースで無料のウェブアプリケーションを使用して「データをキレイにする」ための方法論と具体的な手法をご紹介します。

ほぼすべてのアプリケーションにおいて、データを利用するためには、データがキレイな状態でなければなりません。そのための方法論と実際のやり方を共有いたします。

単にクレンジングするのみならず、目的に合わせてデータを整形・加工も行なっていきます。自分の仮説に基づいてデータを用意・加工する。これこそが大事な工程ですが、可視化のサービス上では行うことができません(行える環境も一部もちろんありますが)。

・タイムスタンプのみのPOSデータに、営業時間としてのコンテクストを追加することで、コンテクストに基づいた集計を可能な状態にする

・住所データを元に緯度経度を付け加えることで、海外製の地図サービスにデータを掲載できる状態にする

・(同じ組織から公表されるデータは毎回同じような汚れ方をしているので)汚れたデータをキレイにする手順自体をファイル化してしまうことで、クレンジング手順の明文化・透明化を推進する

・ツイートデータから、時差を考慮した上で、ある時間帯や日付のみ抽出することで、自然言語の分析手法で活用できる状態にする

といったことが可能になります。

一般にデータ前処理とデータラングリングと呼ばれる行為はデータベースへの操作(集約、抽出)として語られることが多いです。本講習ではそういった言い方を避け、シンプルに「どんな順番」で「何をするべきか」をハンズオンで学んでいただきます。

【こんなデータを扱います】
実際公開されている公的なデータを用いて、クレンジングや整形をハンズオンで画面を見ながらやり方を学べます。

・ツイートデータ...トランプ大統領2018年全ツイート
・自治体データ...東京都スポーツ施設
・行政PDF...労働基準関係法令違反に係る公表事案

【持ち物】
ノートPCをご持参いただきます。事前準備はお申込者にご案内します。

【定員】
10名程度

【関連講義】
【即戦力・1日間】データを自在に取得し可視化する極意 講座のデータクレンジング部分のみにフォーカスした講座となります。
https://www.street-academy.com/myclass/46443

【ご注意】
本講座資料を用いた、独自の講座の開催はお断りいたします。
ご参加いただいていない社内の方への資料の展開はお断りいたします。
著作権法違反となりますので、ご注意のほどお願いいたします。
続きを読む

日程・開催時間を選ぶ

4月23日(木)

10:30 - 17:30

東京 / 秋葉原・御茶ノ水

予約締切日時

4月22日(水) 10:30 まで

参加人数

0/10人

開催場所

銀座線 末広町駅 徒歩2分
granica 東京都千代田区外神田5-2-7 外神田下村ビル 4階

価格(税込)

¥20,000

  • 4月23日(木)

    10:30 - 17:30

    東京 / 秋葉原・御茶ノ水

    選択中 選択
  • 参加できる日程がありませんか?
    先生に開催リクエストを送ってみましょう!
    開催リクエストする
受けたい
21人が受けたい登録しています

開催日程

4月23日(木) 10:30 - 17:30

¥20,000
参加人数 0/10人
場所 銀座線 末広町駅 徒歩2分

この講座の先生

データの活用をどなたにでも

合同会社ノーテーション 代表社員。データ・ビジュアライゼーションの実践と普及に関する様々な活動をおこなっています。ストアカに登録する前、自主開催講習は一年以上開催し、これまで百名以上の方たちに受講いただいています。

講習:
データビジュアライゼーション講習 https://data-viz-lectures.com/

教育のお仕事:
・多摩美術大学 情報デザイン学科 3年次 メディアデザイン 非常勤講師
・株式会社日立インフォメーションアカデミー データビジュアライゼーション基礎 講師

執筆のお仕事:
・「RESASの教科書」共著書
・Yahoo!ニュース個人オーサー

研究活動:
・千葉工業大学 デザイン科学 修士課程
・国立国会図書館 委嘱研究員
・東京大学空間情報科学研究センター 柴崎研究室 協力研究員

コミュニティ活動:
コード・フォー・トウキョウ 共同代表
データ・ビジュアライゼーション・ジャパン 発起人 https://www.facebook.com/groups/datavizjapan/ + 続きを読む

  • 当日の流れとタイムスケジュール

    昼食休憩一時間を挟んで、三時間づつの構成です。

    10:30〜13:30 前半
    13:30〜14:30 昼食休憩
    14:30〜17:30 後半

    実際に手を動かしていただきながら、様々な手法を身につけていただきます。
    講義は適宜、合間あいまに行なっていきます。
    • こんな方を対象としています

      ・企業内のデータ活用ご担当者で、まずはご担当者レベルでできることから始めたい。

      ・データ分析の実務になるべく早くたどり着くために、クレンジングのフェーズを簡易化する方法を知りたい。

      ・毎回繰り返す同じ作業を簡略化し、データのクレンジングにかかるコストを削減したい。
    • 受講料の説明

      ・領収書の発行はいたしません。ご希望の方は別途ご連絡ください。
      ・受講料はこちらでご用意させていただいている当日の内容に対してのものでして、受講中や受講後の、内容に直接関係ないご質問への回答を保障するものではございません。
    ※ストアカでは全講座に保険が適用されます。詳しくはストアカ補償制度をご覧ください。

    この先生の他の講座

    関連講座

    この講座を見た人は、こんな講座も見ています

    お探しの講座が見つかりませんでしたか?