現役データサイエンティストが教える!初心者でもわかる「R」の使い方
データサイエンスを学びたいと思った時に、まず理解したい「R」。今回は、現役データサイエンティストが「R」の基本的な使い方をインストールの方法から解説します。また、機械学習とは何なのか、人間はどう関わるべきなのかという点に…
データサイエンティスト(カテゴリー)に関連した記事をご紹介します。
データサイエンスを学びたいと思った時に、まず理解したい「R」。今回は、現役データサイエンティストが「R」の基本的な使い方をインストールの方法から解説します。また、機械学習とは何なのか、人間はどう関わるべきなのかという点に…
アサインナビ主催で2017年8月に開催された「シリコンバレーに学ぶ、日本のデータサイエンスの現状と未来 ~これからのデータドリブンな時代に本当に必要なこと~」のセミナーレポート第1回目は、シリコンバレーでデータサイエンス…
こんにちは。株式会社エル・ティー・エスの渡辺翔太です。 前回「データサイエンティストのお仕事とは?R導入編」はRとR Studioのインストールを行いました。 今回から実際にR Studioを用いてデータを分析していきた…
こんにちは。株式会社エル・ティー・エスの渡辺翔太です。 前回は機械学習について学習し、その中でもよく利用されるロジスティック回帰モデルについて解説しました。今回も機械学習のひとつであるクラスター分析について解説していきた…
こんにちは。株式会社エル・ティー・エスの渡辺翔太です。 前回に引き続き、クラスター分析について解説していきます。クラスター分析は階層クラスター分析と非階層クラスター分析の2つに分けることができます。今回は実際に2つのクラ…
こんにちは。株式会社エル・ティー・エスの渡辺翔太です。 前回、確率分布についての概要と代表的な確率分布について説明しました。今回は前回記載した代表的な確率分布の具体的な性質を、Rを用いて見ていきたいと思います。
こんにちは。株式会社エル・ティー・エスの渡辺翔太です。 前回「データサイエンティストのお仕事とは?R基礎編」ではRの基本的なプログラミングについて学びました。 今回は、実際に手元にあるデータをRに取り込み、R上で扱ってみ…
第1回目である今回は、データ分析ツールの導入がテーマです。 データサイエンティストは、データ分析でビジネスを加速する必要があります。その際に紙とえんぴつだけで分析を進めるのは時間が掛かりすぎます。世の中に存在する有用な分…
こんにちは。株式会社エル・ティー・エスの渡辺翔太です。 前回は仮説検定についてコラムを書きました。今回は回帰分析について学んでいきたいと思います。
こんにちは。株式会社エル・ティー・エスの渡辺翔太です。 今回は決定木学習と呼ばれる手法について説明していきたいと思います。 決定木学習は教師あり機械学習であり、目的変数の予測・分類に使用します。目的変数、説明変数ともにカ…
こんにちは。株式会社エル・ティー・エスの渡辺翔太です。 仮説検定編(1)に引き続き、今回も仮説検定について進めたいと思います。 前回は仮説検定の概要をお伝えしました。今回のコラムでは、実際にRを用いて仮説検定を行いたいと…
こんにちは。株式会社エル・ティー・エスの渡辺翔太です。今回は主成分分析と呼ばれる手法について学習していきたいと思います。主成分分析は、多次元データの情報量をなるべく保ったまま、低次元化してデータを表現する手法です。 ■目…
こんにちは。株式会社エル・ティー・エスの渡辺翔太です。 今回は機械学習編の続きです。機械学習の手法の1つであるナイーブベイズ分類器について説明していきます。文書の分類に用いられます。 ナイーブという言葉は、日本では「繊細…
ビジネスの成否はデータ活用が鍵と言っても過言ではない昨今、データサイエンティストという職種に注目が集まっています。しかし、日本にはデータサイエンティストの数が少ないのが実情です。 今回はビジネスにおいて求められるデータサ…
こんにちは。株式会社エル・ティー・エスの渡辺翔太です。 前回は回帰分析、特に「線形回帰分析」という分析手法について書きました。今回は「ロジスティック回帰」という手法について説明します。 また、このロジスティック回帰という…
こんにちは。株式会社エル・ティー・エスの渡辺翔太です。コンサルタントとデータサイエンティストの二束のわらじを履きながら仕事をしています。 最近注目の職業でもある”データサイエンティスト”。今回から、データサイエンティスト…
こんにちは。株式会社エル・ティー・エスの渡辺翔太です。 データサイエンティストの仕事内容を紹介するコラムの第4回目となる今回は、仮説検定についてお話しします。分量が多いので、2回のコラムに分けてお送りします。 前半では仮…
こんにちは。株式会社エル・ティー・エスの渡辺翔太です。今回はこれまでの手法的な話から少し逸れて、確率分布についてお話したいと思います。 確率分布というのは、データがどのように分布しているのかを考える上で重要なものになりま…
現代の企業経営において、目標を実現するためにデータサイエンスが注目を集めています。 データサイエンスを活用したプロジェクトとそれを支えるデータサイエンティストの役割について解説します。
こんにちは。株式会社エル・ティー・エスの渡辺翔太です。前回は仮説検定についてコラムを書きました。今回は回帰分析について学んでいきたいと思います。 回帰分析とは、2種類以上のデータの比例的な関係(一方が増えるともう一方も増…