青心直說 - 胡孟青 2014年9月24日
青心直說:統計之夢成真
■國家統計局上周五在北京城西總部大樓舉行開放日,展現其「統計之夢」。互聯網
內房剛性需求敵不過實名登記、反貪腐及經濟下行大潮壓力,解鈴還須繫鈴人,唯有望政策打卦,市場對金九銀十願望未必完全落空,望價量齊升日子可短期重臨,已形同發夢。潮流興發夢,習主席有一個「中國夢」,國家統計局也有一個「大資料夢」,所謂大資料夢,就是運用手上被稱為「大數據」的大量各類數據,進行分析整理,中國互聯網界的蝙蝠俠:BAT(即百度、阿里、騰訊),肯定是最大的資料來源。
網上數據助預測走勢
國家統計局上周五在北京城西總部大樓舉行第五屆中國統計開放日,首次公開基於百度搜索資料來預測房地產價格的新工具,雖然工具仍在研究中,但其對北京房價的驚人預測能力,聞說已令在場參觀人士嘆為觀止。當日國家統計局同時展示了新研發的網絡採集資料統計,回想科網泡沫氾濫的千禧之年,有幾多人當年又會明白數據可以擁有如此強大的應用功能。
如何更精確去統計及預測內地房地產價格趨勢,務求及時協助官方製訂及調整相關政策呢?現有統計方法難免會因個人隱私、陰陽合同等問題存在而影響源頭資料真實性,大數據應用新工具基本運用原理,是國家統計局從百度搜索資料中,篩選出與房地產價格相關的一系列關鍵字,再通過這些關鍵字出現的時間頻率及次數,例如網絡上用戶搜尋二手房價格資訊的密度,與以往實際發佈的新建房資料和二手房資料價格走勢合併建立統計模型,再根據模型預測未來房地產價格的走勢。
新工具令官方內部可進一步提前就下月房價的大致走勢提供資訊予市場參考,以提升統計資料的效力。國家統計局最早關注的數據是源自阿里巴巴,原來淘寶網一直是統計部門最先關注的大資料來源,因為在淘寶網上的交易資料都是真實的成交數字,具極高參觀價值。國家統計局旗下的上海調查總隊,早在兩年前就開始試行自網上收集價格,淘寶網上有銷量大卻不被統計於CPI的產品,包括進口的糖果、巧克力、餅乾、奶粉、美容用品等,把這些數據整合至CPI,較抽樣調查更適時及具參考價值。要瞭解書籍銷售價格可從亞馬遜、當當網及京東網獲取,要知道嬰兒用品及食品價格走勢,就可以上淘寶、天貓及嬰兒用品平台取資料。
胡孟青
獨立股評人
胡孟青
青心直說 - 胡孟青 舊文