Pythonでデータ分析
久しぶりの記事更新です…!世の中にある実データを可視化や分析してみることはとても楽しいことですよね? 過去に執筆した以下の書籍でも、そのコンセプトで、実際の不動産取引データやTwitterデータを使って色々な分析をしてみてました。Pythonと実データで…
最近、利便性は高いけど少し治安の気になる地域への引っ越しを考えていまして…。 自宅に監視カメラがあれば、心置きなく引っ越しを進められるなと思い、Raspberry Pi と USBカメラを使って自作してみることにしました!エンジニアだったら自分で作って当たり…
今回は、numpyを使う上での備忘録として、universal function(通称ufunc)について整理しておきたいと思います。ufuncとは、何ぞやuniversal functionとは、numpy配列に含まれる全ての要素に対して、何らかの演算を行う関数です。ufuncの良いところとして、 …
「マジ卍」って一体どんな意味なんでしょうか?正直おじさんにはさっぱりです…。そんなときはword2vec先生に質問してみましょう! PythonでTwitterデータを元に実践してみました。
本記事は、python Advent Calendar 2017の23日目の記事です。今回はPythonを高速化するための、numbaとCythonについて紹介します。Pythonを使っている方なら、for文処理が遅い、データの前処理が終わらないといった状況に一度は陥ったことがあると思います。…
タイタニックの乗客データを使い、何が生存率に影響を与えいるのか、決定木とランダムフォレストで分析してみました。
スピードワゴンの小沢さんのツイートを使い、PythonからWord Cloudによる可視化を行いました。Word Cloud関連の記事は、既に多くあり特に目新しいものではないですが、可視化ツールとしてはなかなかインパクトがあるので、テキストマイニング関連の分析の一…
さて、今回は傾向スコアマッチングのPythonによる実践編です。 傾向スコアって何?という方は、まずはこちらの記事を参考にしてみてください。 www.randpy.tokyo www.randpy.tokyo今回の趣旨としては、Pythonでの実装という部分に重きを置いていますので、手…
今回は、前回習った一般化線形モデルの実践編です。 理論編については、以下記事を参考にしてください。 randpy.hatenablog.com分析テーマは、この前行われた都議選です!!立候補者のどのような属性が当選確率に影響したのか、ロジスティック回帰分析を使っ…
今回は、Pythonを使って実際に重回帰分析をしていきたいと思います。 回帰分析って何?という方はこちらの記事を参考にしてみてください。 randpy.hatenablog.com データの傍観 Pythonにはscikit-learnという機械学習によく使われるライブラリがあります。ク…