Ashley Madison の月別売上推移
カードトランザクションデータを月別に集約してグラフを描いてみた。
> # DBで月毎の売上を集計する
> con <- dbConnect(MySQL(), dbname='xxx', user='xxx', password='xxx)
> rs <- dbSendQuery(con, 'select date_format(date, "%Y%m") yyyymm, sum(amount) amount from creditcard_transactions group by date_format(date, "%Y%m")')
> data <- fetch(rs, n=-1)
> # データの概要を確認する
> summary(data)
yyyymm amount
Length:89 Min. : 79
Class :character 1st Qu.: 3585339
Mode :character Median : 4942854
Mean : 7093373
3rd Qu.: 7363206
Max. :23430359
> # データの先頭を確認する
> head(data)
yyyymm amount
1 <NA> 79.00
2 200803 97676.25
3 200804 266162.40
4 200805 1310610.90
5 200806 1610211.16
6 200807 2324480.04
> # データの末尾を確認する
> tail(data)
yyyymm amount
84 201501 21414885
85 201502 19140610
86 201503 21420715
87 201504 21376923
88 201505 23430359
89 201506 10823819
> # NA の入ったデータを取り除く
> data <- subset(data, complete.cases(data))
> # 軸が指数表示にならないようにする
> options(scipen=5)
> # プロットする
> barplot(data$amount, names=data$yyyymm)
直近では月に2,000万ドル超えですか。女性会員がほとんどいなくても、2,000万ドルですか。2013年夏ころから急激に売上を増やしてますね。