Np-Urのデータ分析教室

オーブンソースデータなどWeb上から入手できるデータを用いて、RとPython両方使って分析した結果を書いていきます

2017-06-01から1ヶ月間の記事一覧

PythonのStatsModelsによる線形回帰分析! 交差項もモデルに入れてみた!

今回は、Pythonを使って実際に重回帰分析をしていきたいと思います。 回帰分析って何?という方はこちらの記事を参考にしてみてください。 randpy.hatenablog.com データの傍観 Pythonにはscikit-learnという機械学習によく使われるライブラリがあります。ク…

Rを使って重回帰分析を実践 野球選手の年俸には何が影響しているのか?

前回は線形回帰について勉強しましたね! randpy.hatenablog.com今回は習った線形回帰を使って、実際にデータを使って分析をしてみます。線形回帰というシンプルなモデルですが、色々な分野に応用できます。 今回は、野球選手の年俸が何によって影響を受けて…

【初心者大歓迎!】線形回帰分析入門 ~ 最小二乗法から決定係数まで

今回は、統計分析の中でも基本的かつよく使われる線形回帰分析についての理論編です。 多少、数式も出てきますが、なるべく図や例を多く使って、直感的に分かりやすく伝えられればと思います。この辺りについては、以下書籍でよくまとまっているので、よろし…

確率分布の基本 正規分布について5分でざっくり理解できる記事

統計学をやるうえで、確率分布を考えることは非常に大切です。 線形回帰でよく用いられるOLS(最小二乗法)という手法がありますが、これはデータが正規分布に従うことを仮定しています。正規分布に従わないデータを持ってきて、正規分布を仮定した手法を用…

Anacondaを使って爆速でMacにPython分析環境を構築する

データ分析ではRやPythonがよく使われますが、こと機械学習の領域になるとPythonユーザーが一気に増える印象があります。 流行りの機械学習、乗り遅れないためにもPythonが使える環境を整えましょう!難しさはほとんどありません。今回は、Anacondaというツ…

AWS上でR(ついでにR studioも)を使用する方法を世界一簡単に解説した

前回は自分のPC上でRの環境をセットアップする方法について書きました。 randpy.hatenablog.com今回は、PCの環境を汚したくないという方に向けて、AWS(アマゾンウェブサービス)を使ったRの環境構築方法についてご紹介します。 AWS自体初めて触る、という方…

データ分析を始める前に! Rの環境をWindows or Macに2分でセットアップする方法

初めての方はよろしければ以下のリンクに本ブログのコンセプトについて書いてありますので、是非一度お読みください。 randpy.hatenablog.com データ分析に特化したプログラミング言語として、有名なものにRやPythonがあります 中でもRは日本人のユーザーが…

本ブログの方針について

記念すべき第1回のブログ更新です!第一回は、本ブログの執筆方針について説明します。 是非最後までご覧ください。執筆者について紹介 -RとPythonユーザーの2人-本ブログの執筆は2名で行っています。1人はある企業にて、アドテク(広告の配信に関する技術)…

プライバシーポリシー

当サイトの掲載広告当サイトでは、第三者配信の広告サービス(Google アドセンス、Amazonアソシエイト)を利用しています。 Google アドセンスでは、ユーザーの興味に応じた商品やサービスの広告を表示するため、当サイトや他サイトへのアクセス情報が含まれ…

お問い合わせフォーム

記事に関して、また筆者に関してのご質問・お問い合わせを受け付けております。