從數據角度觀察媒體在網路社群上的表現/食夢黑貘
筆者最近很喜歡在相關的課程中說一個很重要的觀點:
大數據是一種最準確、但也是偏差最大的觀察研究方法。準確是因為資料的取得可以很客觀且巨量,這樣的資料才能讓誤差最小;但若只用一種角度去看、或是一種方法去搜集,這種巨量的資料反倒會造成巨量的偏見。
大數據實作
先不說「社群」只是眾多經營媒體的觀點與數字之一,單單從Facebook社群來看媒體,也還是有各式各樣的觀點與數字;更不要說我們只用「粉絲團」來看媒體的經營,即使Facebook使用者的資料都能搜集到,若沒有去瞭解各個面向,產生誤會的機會說不定會比正確理解來得更高。
但若不用這些資料來觀察,那又可能是把刻板印象放大,只會讓你又犯了一次次的決策錯誤。
筆者在兩年前嘗試著用林克傳說做了一個社群排行榜,那個系統跟這次用新文易數做基礎的社群排行榜之間最大的差別是:
林克傳說能夠取樣各種媒體,但就單一媒體的資料不夠完整;而新文易數能夠算到單一媒體的所有資訊,但不在列表中的就無法反映出來。
現在新文易數的確已經收錄超過70個媒體的資料,尤其是前30大原創性高的新聞網站都收錄其中;雖然說30名以後的媒體一定有問題,但相對的,前10名應該不會在名單之外。現在就讓我們來看看,這樣的社群排行榜會是怎樣的結果。
大數據結果說什麼?
從總數分析
若是以總數來看,第一名是東森新聞雲,其數值幾乎是第二名蘋果的兩倍;而第三名到第五名是自由時報、壹週刊與雅虎,其數值不相上下,但跟第二名也是差兩倍。第六、七名則是三立新聞網與中時電子報;此外,在前十名的是東森新聞、動網、與聯合新聞網。
這是以總數來看,總數是該媒體在七天內刊出的新聞中,將每則新聞的按讚數、分享與評論數加總的數值。雖然在取樣與區間或多或少有時間差,但理論上大家的條件與範圍都是一致的,並不會差太多。
從按讚/分享/評論總數來看
而從按讚/分享/評論總數來看,會讓一些新聞篇數沒有那麼多的小媒體吃虧;若是用單一則最高的觀點來看,擠進前10名的媒體是風傳媒(事實上總量原本是第11名),被擠下去的是動網,且是跌到第24名。
由此可知,動網的社群很強;但因為是專業媒體,所以讀者族群被限制住,因而最大的數量就沒辦法很高。
平均值與中位數代表的意義
雖然綜合新聞媒體在總量與最高值方面,相對是比較占便宜的,但在平均數上就很吃虧;所以若是以前10名的角度,前面11個媒體還能擠進去的只剩東森新聞雲、壹週刊、跟東森新聞,這三個媒體有甚麼共同點呢?等一下再說。
中位數指的是所有新聞排序後,按讚/分享/評論總數排中間的那則新聞數字。此時不只是只剩動網與東森新聞雲在前10名;甚至前30名也只有這兩個媒體,再加上風傳媒與三立新聞網。畢竟,要能夠讓有一半的新聞都能動,不只是靠內容,記者與編輯自己也要能夠參與社群才能做得到。
什麼是「嗨文率」?
眼尖的讀者會看到系統中有一個「嗨文率」,這個數字相當有趣,計算方式也很簡單,就是「按讚/(分享+評論)」。這個數字越高,代表讀者看完之後很喜歡,然後按讚,但不想要分享與評論。
這代表的是甚麼呢?通常代表的是這些文章即使是有趣、好玩、新鮮,但很難對社會、生活有所影響,甚至不會令人想去討論與推薦。
會造成嗨文率高有兩種可能性:
農場文太多
社群帶動強
而剛剛說到,總數高、同時平均值也高的三個媒體,就是東森新聞雲、壹週刊、跟東森新聞;這三個媒體正巧是總數高、而且嗨文率也高的三個媒體。雖然在嗨文率上,動網比這三個媒體足足多出一倍,但我們知道,動網是個內部社群凝聚力相當夠的專業媒體;而這三個媒體不完全是這因素,代表的是另一個因素機會較高。
若嗨文率高是上面提到的兩個因素;那嗨文率很低的原因又是甚麼?同樣也有兩種很大的因素:
文章內容紮實、很硬
這個媒體完全無法帶動社群
所以,若是把嗨文率從小排到大的話,我們就可以看到,立報、端新聞、風傳媒等媒體要不是很專業、就是新聞多有份量,造成大家的分享與討論機會很高;不然就是像台視或中央社那樣,社群根本嗨不起來,也就不用想有人按讚了。
長尾指數
應該有讀者會看到表格中有個「長尾指數」,它代表著該媒體是有網路媒體可以帶動長尾效應、還是極度利用炒作議題所造成的結果。數字越高,代表越長尾;而這部分的計算與意義,倒是等到畫出一張圖後再來解釋比較方便,請待下回分解。
結語
最後,媒體的社群表現,尤其是只看按讚/分享/評論總數,說穿了用再多種數字來看,也只是眾多面相的一種;但跟真正的導流、所有流量、甚至是媒體的收益相較,往往每一個環結、每一個媒體都有不一樣的轉換率。
這個資料的準確度即使再高,也是種有偏差的觀察;但是對於要參與社群經營的媒體工作人員,卻是相當有用的。請大家一起來思考吧!