資訊氾濫衍生統計盲點
2015年04月08日
假設某日你收到封信,原來是份投資報告,羅列各種理由,結論是下周買市升。一周過後,大市真的上升,但你聽飛資歷不淺,深明撞彩機會大於一切。此時你又收到同一源頭的下一份報告,今次睇下周市跌。一周內,果然大跌。上周還只是一笑置之的你,本周之後難免想多加留意。
連鎖信騙局玩心理
但作為謹慎的投資者,又豈能鹵莽行事?先觀察兩個月再說吧。如是者每周收飛,前後十次,每次皆中。正當你靜候下一建議,那公司來函:不好意思,樣板已看夠了吧,恕沒有免費午餐了,要不要讓我們代為操作?
雖然食指大動,但你仍不失理智,細想有何破綻?不會是靠運吧,有好有淡,不是死牛或死熊,當一次機會五五波,連中十元,機會只是千分之一。你深信該炒手乃利弗莫再世、索羅斯秘傳弟子,「無得輸」,下定決心匯去資金。
豈料發達大夢還未開始,已驚見對家人去樓空,原來是斂財騙局。騙子怎能百發百中?很簡單,狂寄一萬封信,一半寫睇升,一半寫睇跌。一周後,只向看對的一半人發第二封信,又是升跌各寄一半,如此類推。十周後,自然有九、 十個人十封全中,當正騙子是炒神。這就是著名的「連鎖信」騙局。
取樣夠多總見規律
這種千術,實際上就是用了人類心理的盲點。統計學上,只要取樣夠多,就算是完全隨機,也總有一些樣本能出現十星連珠的「規律」。時至今日,被這個盲點所騙的人有增無減,卻不再是上述騙局,而是為自己所騙。這裏說的是各路媒介發表,數量龐大的跑贏大市方法。在它們發佈時,往往佔據財經媒體的頭條,但當其他人嘗試複製成果,往往不是那回事。原因無他,就是這些法則的來源,是通過盲目挖掘歷史數據而來。只要測試的數量夠大,自然會跑出一些戰無不勝的公式。情況就像騙子向愈多人出信,連中十次的潛在受害人數就愈多。
Research Affiliates的許教授提供過一項有趣的數據,是歷年以來發掘出影響回報的因素的數量。上世紀六十至九十年代,一年至多僅有單位數的發現,甚至沒有;發佈的研究也是寥寥可數。
到了千禧年代,一年出產的「因素」多達二百個以上,研究數目也等量飛升。發達天橋真的多了那麼多嗎?似乎不是,反倒是電腦運算的速度加快了,數據也比以往容易取得。
電腦輔助更易落疊
據以往的程式交易員憶述,上世紀六十年代如果你好彩,可以接觸到電腦,測試一項參數(可能只是簡單如改變一條移動平均線的日數),麻煩先等半日,才可產出結果;現在的家用電腦,也比當時快上N倍;換言之,就像「連鎖信」騙徒忽然可以寄電郵,不用慢慢貼郵票,自可呃到更多人落疊。
那怎可在實際下注前,判斷一條法則是否只屬統計盲點的產物?許教授提出了三大要點。篇幅所限,下回繼續。
豐盛金融資產管理董事
黃國英
大英Blog物館 - 黃國英 舊文