2016年6月11日 星期六

[R軟體]用分布圖來看網頁效能與價值

相信透過用R抓取GA資料 的介紹後, 應該知道怎麼使用R的rga這個套件抓取GA資料了
而抓下來的資料要怎麼使用, 就要回歸到要解決什麼樣的問題這件事了
以內容網站而言, 每一張內容頁透過使用者反映出來的數據相當重要
因此我們以內容頁為例, 我們可以製作一張分布圖, 可以幫助我們在內容頁分析上的判斷

以"瀏覽量"與"瀏覽時間為例"製作分布圖

以下我們先來抓取我們所需的數據資料, 如果你已經安裝好RGA套件, 你可以透過以下指令讀取rga:
library(rga)
rga.open(instance = "ga")
接下來我們透過條件抓取GA資料
id <- "xxxxxxxx"
timepage <- ga$getData(id, start.date = as.Date("2016-05-01"),
 end.date=as.Date("2016-05-31"), metrics = "ga:avgTimeOnPage,ga:pageviews",
 dimensions = "ga:pagePath", sort = "-ga:avgTimeOnPage", filter = "ga:pagePath=~XXX;ga:pageviews>100") 
其中 id部分一樣是填入你的資料檢視id
起始日期可在as.Date與end.date自訂, 指標我們選擇抓取"瀏覽量" 與"平均瀏覽時間"
sort可以調整你的資料排序, 這邊我以平均瀏覽時間做為排序標準
filter則是資料篩選, 這邊請盡量以實際狀況做調整, 因為我是挑選瀏覽量大於100的內容頁, 但實際上每個網站的狀況不一樣.

以上的程式碼, 你可以先用Query Explorer 跑一次看看有沒有問題
以query explorer先確認GA資料正確與否

或是抓取完若沒有出現錯誤訊息, 你可以執行一次"timepage" 或 edit(timepage)看看資料對不對
若無問題, 就可以依照以下的程式碼畫圖:
library(ggplot2)
ggplot(data = timepage) +
  geom_point(mapping = aes(x = avgTimeOnPage, y = pageviews))
若還沒有安裝繪圖套件ggplot2的話請先執行安裝, 之後就可以用ggplot畫出簡單的分布圖:
網頁瀏覽量與平均瀏覽時間分布圖

就可以找出有一定瀏覽量, 但是停留時間高於或低於平均, 或是一些比較沒人氣, 但有高停留時間的網頁等.針對這些網頁做出不同的決策.
當然判斷網頁好壞的標準不僅僅是網頁停留時間, 大家可以試著以跳出率, 或是網頁滾動事件數等加以組合, 或許也可以組合出另一張能夠說明網站狀況的視覺化圖表.

1 則留言: