派遣で働くエンジニアのスキルアップを応援するサイト

PRODUCED BY RECRUIT

【イベントレポート】IoT時代に欠かせない統計学の基本を学ぼう

株式会社リクルートスタッフィングが運営するITSTAFFINGでは、弊社に派遣登録いただいている皆さまのスキル向上を支援するイベントを、定期的に開催しています。

2月10日に開催した「IoT時代のデータ分析 はじめの一歩 ~統計学の基本のき~」では、 グローバルナレッジネットワーク株式会社で講師を務める田中亮さんをお迎えし、IoT時代になぜ統計学を学ぶべきか、また統計学の基礎について教えていただきました。

■今回のセミナーは最近よく耳にするIoTと統計学について

・モノが自動でインターネットを通じて情報のやり取りをするようになるIoT時代
・IoT時代に欠かせないのが膨大な情報(ビックデータ)を分析する統計学!
・統計学の基礎、平均の考え方を練習問題交えて解説

分析のプロセスやわかりやすい解説も入っているので、これから統計学を学ぶ方でも安心!ぜひ最後までご覧ください。

【講師】グローバルナレッジネットワーク株式会社 田中亮

▲【講 師】グローバルナレッジネットワーク株式会社 田中亮さん
1998年4月に製造業系システム子会社にて生産管理システム・販売管理等のシステム開発を担当。2001年よりグローバルナレッジネットワークにて、データベース・システム開発に関わる企業向けに教育・研修を実施。共著に、『完全合格 ORACLE MASTER Bronze SQL基礎 12c 必須教本』『完全合格 ORACLE MASTER Bronze DBA 12c 必須教本』。

モノのインターネット、IoTって一体何?

インターネットはこれまで、人がPCやスマートフォンを使って能動的にアクセスし、利用する存在でした。それがIoT(Internet of Things)と呼ばれる時代になると、これまでインターネットに繋がると思いもしなかったモノが、私たちの知らない所で勝手にインターネットを通じて情報のやり取りをするようになる、とされています。

例えば、車のIoT化は、車が相互に渋滞情報を共有し、より最適なカーナビゲーションをしてくれるようになり、昨年の12月にAmazonが発表したAmazon Dash Buttonというボタン型のデバイスは、ワンプッシュで洗剤などの日用品をオンライン注文してくれます。

IoTの時代には統計学が重要になる

IoTが普及すると、モノから送信されたデータがクラウド上のデータベースやサーバーに大量に蓄積されるようになります。これらのデータは機械から自動的に大量に送信されるので、人間がそのまま解釈することはできません。

ビッグデータをビジネスに役立てるためには、コンピューターを使ってデータを加工し、意味のあるメッセージを導くことが不可欠です。そして、ビッグデータを専門的に分析・活用する人材が今後一層求められるようになります。

このような時代の要請に応えるため、今学ぶべきなのが統計学なのだと田中さんは言います。今回のセミナーでは、データ分析の大まかな流れを理解した上で、まず押さえるべき基本知識として基本統計量とデータ分析手法についてお話をされました。

データ分析を行う上で重要な5つのプロセス

データの分析をした上で、データ分析の目的を達成するためには適切な作業手順が必要です。一般的に、データ分析は以下の順番で作業が進められます。

イメージ

1. 計画の策定

データ分析の最初のステップは分析計画の策定です。データ分析の目的を定義し、最終的に主張したい仮説、仮説を検証するために必要なデータは何かを明らかにします。

2. データの収集・クレンジング

分析計画が固まったら、分析に必要なデータの収集を行います。ただし、収集されたデータはそのままの形で分析することができないので、更にクレンジングという作業でデータを分析可能なキレイな状態に整形する必要があります。具体的には、異常なデータを修正・除去し、分析しやすいようにデータの反転などを行います。

3. データの分析

クレンジングされたデータが整った段階で、データと検証したい仮説に適した分析手法で実際に分析を行います。よく使用される分析用のソフトウェアにR、SAS、Excelなどがあります。

4. 結果の評価

得られた分析結果が本当に信頼のおける結果かどうかを検証します。例えば、サンプルデータがある偏った母集団から抽出されてしまっていたならば、分析結果が歪んでいる可能性があります。また、自分自身の思い込みや先入観によって偏った解釈をしていないか注意して検証します。

5. 結果の表現

グラフなどのビジュアル表現を使い、誤解のない資料作りをし、得られた示唆をビジネスに活かせるようにコミュニケーションを取ります。

以上のような、統計学に裏付けられた一連のデータ分析を行うスペシャリストが今後社会で一層求められるのです。この時代の流れに置いていかれないよう、まずは統計学の基本から学習していくことが必要です。

イメージ

データ分析に必要なスキル 、データ分析の手法

統計学の基礎として、データの基本統計量について学ぶことが重要です。基本統計量というのは、分布の基本的な特徴を表す統計学上の指標のことです。例えば、日常よく使う「平均値」という言葉も基本統計量の中の1つです。

基本統計量は大きく2種類に分類されます。一つは、分布全体の特徴を1つの値で要約して示す代表値というものです。これには、平均値・最頻値・中央値・最大値・最小値といった種類があります。

もう一つは、分布のばらつき具合を示す分散値と呼ばれるものです。分散値には、分散・標準偏差・変動係数といったものがあります。

「平均値」だけを信用するのは良くない

データを正確に理解するためには、状況に合わせて基本統計量を使い分ける必要があります。その実例として田中さんはいくつかクイズを出題していただきました。そのうちの1つを抜粋します。

イメージ

【クイズ】
Cさんは、100点満点のテストを受け、得点は75点でした。クラスの平均は74.1点だったので、自分は平均より高いので人並みの点が取れたと安心しました。Cさんの成績は真ん中よりも上の順位だと言えるでしょうか?

【答え】
必ずしも、平均点よりも上だからだといって順位が真ん中よりも上だとは言えません。例えば以下のような分布の場合を考えましょう。

イメージ

このとき、平均値は確かに74.125点ですが、最頻値は80点であり中央値も80点です。必ずしも平均値だけを見るべきだ、とは言えないのです。

基本統計量を理解したら、実際の解析手法を学ぼう

基本統計量の解説が終わった後、今後の学習の指針として単変量解析・二変量解析についての紹介がありました。

・単変量解析

データ解析をする際に取り扱う変数が一つであるときの解析手法です。例えば、テストの平均点や標準偏差を求める時の分析は単変量解析です。

・二変量解析

取り扱う変数が二つであるときの解析手法です。2つの変数の相関関係を分析したり、相関関係を元に値の予測を行ったりします。例えば、夏の最高気温と生ビールの売上高に正の相関関係があるとき、気温から生ビールの売上高を予想することができます。

・多変量解析

取り扱う変数の値が3つ以上には多変量解析と呼ばれます。多変量解析では、目的となる変数の値を予測したり、複数の変数を要約して代表となる1つの変数を求めたりすることができます。

多変量解析は上記2つに比べてやや高度です。主要な分析手法としては以下のようなものがあります。ご興味のある方はぜひ調べて見てください。

 予測のために用いられる手法
 ・重回帰分析
 ・判別分析

 要約のために用いられる手法
 ・主成分分析
 ・因子分析

IoT時代に必要な統計学をこれから学ぶ皆さんへ

今回のセミナーでは田中さんから

― IoTとは、さまざまなモノがインターネットに接続され、そこから得られたデータを集約して、ビジネスなどに活かされる

― そのためには、データを活用するためのスキルがより重要になる

― だからこそ、データ分析の基本的な流れや基本統計量、データ分析に関わる用語を理解する必要がある

ということを教えていただきました。また、これから統計学を勉強される方は、信頼のおける書籍から学び始めることが大切だ、というアドバイスをいただきました。

ITSTAFFINGでいい仕事に巡り合うコツとは?

最後にITSTAFFINGから、スタッフの皆さんの希望に沿ったお仕事を紹介するためにお願いしたいことについてご紹介しました。

イメージ

希望に沿ったお仕事をご案内するために、MyPageの定期的な更新をお願いしています。ITSTAFFINGでは、MyPageにご入力いただいた内容に基づいてお仕事のご案内をしています。

ご自身のスキル・最新のご経験がMyPageに反映されていないと、案内することができる案件でもご紹介できない可能性があります。必ず最新の情報に更新をし、現在のスキルについてご入力をお願いしています。

また、ご記入頂く際には以下の点に注意すると、より良い案件をご紹介できる可能性が高まります。

・お仕事をしていない時期についても職歴として記入する

お仕事をしていない時期であっても、新しいスキルを取得するために勉強をしていた、スクールに通っていたという場合はポジティブな評価につながります。

・プロジェクトについては詳細まで記載する

ご本人の経験を詳細に把握できるので、よりご自身にあった案件をご紹介できる可能性が高まります。

具体的には、

― どんな内容のプロジェクト

― 何人くらいのプロジェクト

― どんな役割をしていたのか

をご入力ください。

・プロフィールのスキルについては必ずチェックを付ける

自由記述欄に記載いただいたスキルは、プロフィールの業務、スキルチェックボックス欄でも選択してください。選択されていないとお仕事のご案内が出来ない場合がありますので、ご確認をお願いします。

・更新をしたらエントリーをする

お仕事をさがしているのであれば、プロフィールの更新を行った場合、ご自身からいずれかの案件にエントリーいただくことで紹介担当の目に止まりやすくなり、案件をご案内できることが増えます。

ITSTAFFINGでは定期的に、エンジニアの方のソフトスキル・ハードスキルを高めるイベントをご案内しています。イベント情報はエンジニアスタイル上で確認いただくことができます。

また、開催したイベントのイベントレポートは、順次、エンジニアスタイル、およびメールマガジンで公開されます。こちらもぜひご確認ください。