これで無理なら諦めて!世界一やさしいデータ分析教室

オーブンソースデータなどWeb上から入手できるデータを用いて、RとPython両方使って分析した結果を書いていきます

word2vec(Skip-Gram Model)の仕組みを恐らく日本一簡潔にまとめてみたつもり

word2vecでは、大量のテキストデータを解析し、各単語の意味をベクトル表現化する手法です。単語をベクトル化することで、「単語同士の意味の近さを計算」・「単語同士の意味を足したり引いたり」ということが可能になります。

R shiny Advent calendarを終えての所感

本記事は、Shiny Advent Calendar 2017の25日目の記事です。今日はR Shiny Advent Calendar最終日ということで、この1ヶ月を振り返ってみたいと思います。振り返り11月にR Shinyのカレンダーを作り、募集をかけてみたものの中々参加者が増えず、初めはどうな…

Shiny100本ノック!RユーザーのためのTips集

本ブログではShiny100本ノックと称して、Shinyに関する情報をまとめています。書きたい順で記事を執筆していっているので、情報が乱雑してしまっています……。そこで本記事では、過去に紹介してきた事柄をまとめることにしました。Shinyに関して困ったことが…

Pythonで高速化処理!numbaとCythonの実行速度を比較してみた。

本記事は、python Advent Calendar 2017の23日目の記事です。今回はPythonを高速化するための、numbaとCythonについて紹介します。Pythonを使っている方なら、for文処理が遅い、データの前処理が終わらないといった状況に一度は陥ったことがあると思います。…

AWS + Shiny ServerでShinyアプリケーションを公開する方法

本記事は、Shiny Advent Calendar 2017の22日目の記事です。Shiny100本ノックの第22弾です!これまで、下記記事などでShinyアプリケーションを「どうやって作るか?」ということを中心に行ってきました。 www.randpy.tokyo www.randpy.tokyo今回は、作ったア…

Docker を使ってShinyライブラリなど含むR環境を構築してみる

本記事は、Shiny Advent Calendar 2017の21日目の記事です。Shiny100本ノックもかれこれ第21弾となりました。今回はDockerを使った環境構築周りについて、紹介します。面倒な環境構築Shinyを使うために、多くの方は手元のPCにRやRstudioをインストールし、そ…

Shiny上で作ったファイルをダウンロード! downloadButtonメソッドの使い方

本記事は、Shiny Advent Calendar 2017の20日目の記事です。Shiny100本ノックも区切りの良い第20弾となりました!第19弾の前回は、Shiny上でクラスタリングを行うアプリケーションを作ってみました。 www.randpy.tokyo こんな風にShiny上で色々データをいじ…

Shinyでクラスタリングの楽しさを体感できるアプリケーション制作

本記事は、Shiny Advent Calendar 2017の19日目の記事です。Shiny100本ノック第19弾!今回は、データ分析のあまり経験が無い人に、クラスタリングの面白さを体験してもらえるようなアプリケーションを作ってみます。shinyapps.ioに上げてみました。試してみ…

Shinyを効率よく使うための、reactive関数基礎講座

本記事は、Shiny Advent Calendar 2017の18日目の記事です。Shiny100本ノック第18弾です!そんな今回は、reactive関数を使ってShinyアプリの効率化を図って行きたいと思います。アプリを動かす上で、なるべく計算負荷を減らして効率化させることはとても大事…

【R Shiny】基本となるUIのoutput関数を網羅的に理解する!

本記事は、Shiny Advent Calendar 2017の17日目の記事です。今回はShinyノック第17弾ということで、output関数を一挙に紹介していきたいと思います。 特にShinyを始めたばかりの方に、辞書的に活用して頂ければ幸いでございます。そもそもShinyって何?とい…

【R Shiny】fileInputメソッドでファイルアップロード&散布図プロット

本記事は、Shiny Advent Calendar 2017の15日目の記事です。Shiny100本ノックも気付けば第16弾まできました。今回は、Shinyアプリケーションにファイルをアップロードする機能の実装方法について紹介します。第11弾・第12弾にて、ドラッグ&ドロップによるフ…

ShinyでGoogleスプレッドシートにアクセス【番外編】 ローカル上で事前認証してみる

本記事は、R Shiny Advent Calendar 2017の14日目の記事です。Shiny100本ノック第15弾です。前回は、ShinyからGoogle スプレッドシートにアクセスするアプリケーションを作成しました。 www.randpy.tokyoGoogleアカウントと連携する必要があるのですが、前回…

【RでDeep Learning】R+KerasでCifar10の画像分類に挑戦してみる

本記事は、R Advent Calendar 2017の14日目の記事です。これまで、R言語でロジスティック回帰やランダムフォレストなどを実践してきました。Rは統計用のライブラリが豊富、Pythonは機械学習用のライブラリが豊富。というイメージがありますが、Rでも機械学習…

ShinyでGoogleスプレッドシートにアクセスするアプリケーション作成

本記事は、R Shiny Advent Calendar 2017の13日目の記事です。Shiny100本ノック第14弾の今回は、GoogleスプレッドシートにアクセスするShinyアプリケーションを作成してみたいと思います。スプレッドシートにアクセスできるようになると、 Googleスプレッド…

R Shinyでドラッグ&ドロップ番外編 画像ファイルを読み込んで表示する

本記事は、Shiny Advent Calendar 2017の12日目の記事です。 今回は、Shiny100本ノックの第13弾です。前回・前々回と、Drag&DropでShiny上にデータを読み込み、そのデータをプロットしてみる、ということを実践しました。 www.randpy.tokyo www.randpy.tokyo…

【R Shiny】Drag & Dropでアップロードしたファイルを元にプロットしてみる

本記事は、Shiny Advent Calendar 2017の9日目の記事です。 Shiny100本ノックの第12弾です。前回は、Drag&DropでShiny上にデータを読み込む機能を作ってみました。 www.randpy.tokyo今回はその続編!ということで、読み込んだデータを元にプロットをしてみま…

【R Shiny】ドラッグ&ドロップでファイルをアップロードする方法

本記事は、Shiny Advent Calendar 2017の8日目の記事です。 Shiny100本ノックの第11弾です。今回は、手持ちのデータファイルをドラッグ&ドロップでShinyアプリに読み込ませる機能を実装してみたいと思います。 github.com ソースコードはいつも通り、Github…

R+ShinyでGoogle Mapをいじるアプリケーションを作ってみる

本記事は、Shiny Advent Calendar 2017の7日目の記事です。 Shiny100本ノックも第10弾となりました。そんな区切りの今回は、Google Mapの地図をいじるShinyアプリを作ってみたいと思います。機能としては、 検索した場所をプロットする 2点間の距離を求める …

Google アナリティクス APIからデータを取得してSlackにポストするBotを作成

本記事は、Slack Advent Calendar 2017の6日目の記事です。 以前に www.randpy.tokyo にて、Google AdsenseのデータをSlackにポストするBotを作成しました。今回はその続編ということで、Google アナリティクスのデータをSlackにポストするBot作りに挑戦して…

簡単にShinyのデザインをカッコよく変身! Shiny themesライブラリのすすめ

本記事は、Shiny Advent Calendar 2017の6日目の記事です。 Shiny100本ノックもかれこれ第9回目となりました。体感的には74本は更新しているのですが、まだ9本かと思うとなかなかゾッとします…笑さて、今回はShinyのデザインをカスタマイズするときに便利な…

Google Adsenseの情報をSlackにポストするためのBot作成

本記事は、Apps Script Advent Calendar 2017の5日目の記事です。 皆さんの中には、運営されているWebサイトにてGoogle Adsenseによる広告収入を得ている人もいるでしょう。 私自身、はてなProという有料版のブログを使っているため、「元を取ろう!」と考え…

R ShinyのtabsetPanelを使って複数のタブを持つページを作る

本記事は、Shiny Advent Calendar 2017の5日目の記事です。 Shiny100本ノック、第8回目となります。Shiny100本ノックの前に「そもそもShinyってなんだよ」という方は以下を読んでみてください。 www.randpy.tokyo前回は、navbarPageメソッドを使って複数ペー…

R Shinyで簡単にナビゲーションバーのUIを作る方法と実例を紹介

本記事は、Shiny Advent Calendar 2017の3日目の記事です。 今回は、Shiny100本ノックの第7回目となります。Shinyって何?ということはまず以下を読んでみてください。 www.randpy.tokyoShinyでは、レイアウトを色々自由に変更するためのメソッドが事前に用…

RとShinyで作るWebアプリケーション - CSS・Javascript・画像の設定方法-

本記事は、Shiny Advent Calendar 2017の2日目の記事です。 今回は、Shiny100本ノックの第6回目となります。前回は、第5回目にして「Shinyとは?」という何とも第1回目にやれよ的な記事を書きました。 www.randpy.tokyo今回はそこから少し発展させ、Webアプ…

Shinyって何? ~Rで簡単にアプリケーションを実装する方法~

本記事は、Shiny Advent Calendar 2017の1日目の記事です。 これまでShiny100本ノック、ということでShinyの実装例を紹介してきました。が、いきなり応用編に突入してしまいましたので今回は原点回帰!「Shinyって何なの?」について紹介していきたいと思い…

【ROC曲線とAUC】機械学習の評価指標についての基礎講座

機械学習ではモデルを作って終わり、ということは無く、モデル作成後にテストデータを使って「本当に良いモデルなのか?」という評価を必ず行う必要があります。では具体的にどのように評価をすれば良いのか?という話になりますが、今回は代表的な評価指標…

【SlackでTexを使いたい方へ】数式打つと画像を生成するBotを作ってみました

多くの企業で使われているSlack。色々な外部サービスと簡単に連携することができるのが特徴です。 今回は、SlackにてTexによる数式を画像生成するBotを作成しました。

【Rでランダムフォレスト 】スピワゴ小沢さんと井戸田さんのTweetを分類!

スピードワゴンの小沢さんと井戸田さんのツイートをランダムフォレストで分類に挑戦しています。それぞれのツイートにはどんな特徴があるのでしょうか。

【Pythonで決定木 & Random Forest】タイタニックの生存者データを分析してみた

タイタニックの乗客データを使い、何が生存率に影響を与えいるのか、決定木とランダムフォレストで分析してみました。

【Rでテキストマイニング】他人のタイムラインをWord Cloudで可視化してみる

民進党代表の前原さんと日本維新の会代表の松井さんがツイッターで見ている景色(タイムライン)を可視化してみました。 RからTwitter APIを叩いてテキストを取得し、Word Cloudを使って可視化しています。