而抓下來的資料要怎麼使用, 就要回歸到要解決什麼樣的問題這件事了
以內容網站而言, 每一張內容頁透過使用者反映出來的數據相當重要
因此我們以內容頁為例, 我們可以製作一張分布圖, 可以幫助我們在內容頁分析上的判斷
以"瀏覽量"與"瀏覽時間為例"製作分布圖
以下我們先來抓取我們所需的數據資料, 如果你已經安裝好RGA套件, 你可以透過以下指令讀取rga:library(rga)接下來我們透過條件抓取GA資料
rga.open(instance = "ga")
id <- "xxxxxxxx"其中 id部分一樣是填入你的資料檢視id
timepage <- ga$getData(id, start.date = as.Date("2016-05-01"),
end.date=as.Date("2016-05-31"), metrics = "ga:avgTimeOnPage,ga:pageviews",
dimensions = "ga:pagePath", sort = "-ga:avgTimeOnPage", filter = "ga:pagePath=~XXX;ga:pageviews>100")
起始日期可在as.Date與end.date自訂, 指標我們選擇抓取"瀏覽量" 與"平均瀏覽時間"
sort可以調整你的資料排序, 這邊我以平均瀏覽時間做為排序標準
filter則是資料篩選, 這邊請盡量以實際狀況做調整, 因為我是挑選瀏覽量大於100的內容頁, 但實際上每個網站的狀況不一樣.
以上的程式碼, 你可以先用Query Explorer 跑一次看看有沒有問題
或是抓取完若沒有出現錯誤訊息, 你可以執行一次"timepage" 或 edit(timepage)看看資料對不對
若無問題, 就可以依照以下的程式碼畫圖:
library(ggplot2)若還沒有安裝繪圖套件ggplot2的話請先執行安裝, 之後就可以用ggplot畫出簡單的分布圖:
ggplot(data = timepage) +
geom_point(mapping = aes(x = avgTimeOnPage, y = pageviews))
就可以找出有一定瀏覽量, 但是停留時間高於或低於平均, 或是一些比較沒人氣, 但有高停留時間的網頁等.針對這些網頁做出不同的決策.
當然判斷網頁好壞的標準不僅僅是網頁停留時間, 大家可以試著以跳出率, 或是網頁滾動事件數等加以組合, 或許也可以組合出另一張能夠說明網站狀況的視覺化圖表.
1 意見:
非常實用!!
Reply張貼留言