2009年11月28日 星期六

數據與資料

面對資訊的普及,數據以及資料被大量上傳至網絡,固然方便了我們的生活,
當中當然不乏真實資料及數據,但亦有不少偽資料偽數據,
不慎者輕則誤信資料,以非為是、重則報告出錯害己害人,
現就現代資料數據析論資料數據存取真偽及影響:

資料意思是傳遞不同內容的媒介,而此媒介通常內容較為嚴謹,
可供人應用或參考。分類方法可以接觸次數(第一手資料至第二手資料,以至N手資料)或資料類型(新聞資料、數據資料、照片資料)所分。

容我作出一個假設,即世上本無真確之事,因不同人有不同的解釋,真相有千百種解釋時,只有最接近真確而沒有真確存在。遂無真確之資料,只有最接近真確的資料(即使是殺人,亦只是結果的真確,而非原因或過程的真確)(於是我們有無罪推定原則,保障疑人在接近真確的情況下才可以入罪)

當中,雖以第一手資料最為真確,(但非絕對真確)如史記原文終比再譯本或其他類型的疏注來得真實,只因書是一手,感覺亦是一手,理悟是本我的,而不是經其他人再解釋(但此只是對自己的真確,而非絕對)。但凡文字出現的地方,必然有爭議存在,而追求第一手資料或真相,就是避免爭議或疑惑的存在。於是我們出現了批判性思考,新聞學強調,要從對立兩方的意見中獲取資料,然後分析,才可以得出較為真確的實際情況,若單純從其中一方獲取資訊則資訊利處亦偏向其中一方,則亦不能觀察最接近的真實。

在現實世界,媒體為了嘩眾取寵或其固定立場,對資料生吞活剝。引用明報於三月時的報導「【明報專訊】網上百科全書維基網站,更新資料迅速,內容包羅萬有,成為大家以至全球媒體蒐集資料的好幫手。但多間著名國際媒體最近卻墮入圈套,被揭濫抄維 基資料,不作求證,連維基網站內的「流料」也照搬。愛爾蘭 一名大學生早前進行一次「放蛇」實驗,看看報章是否「只求快不求證」,故意在維基百科上載假資料,未料包括英國 《衛報》、《獨立報》在內的國際媒體竟然真的照抄,鬧出笑話。」部份未經求真的資料流出,此則不但影響了資料的接近真確性,亦損害了部份媒體的名聲,可讚貽笑大方,但這種情況不獨於英國發生,大至政府官員,小至報章雜誌亦有機會三人成虎,想非為是,只因大家說是,事情就算是非亦會成是,明明是鹿,有人會說是馬,不幸真的有人會跟隨說是馬,反智的表現於此途徑表露無遺。

話畢資料,現在是數據,數據亦有可笑或可愛之處,而數據本身無善惡之分,只有人強姦數據而無數據強姦人,此則現作解釋。
假設
「網上調查指三分之二年輕人熱愛運動,當中三分之一人精通多種運動,是次調查人數為3人」
若單看前兩句陳述,好像大抵多數傳媒亦喜歡引用,看起上來真的像有很多人參與運動,全民也很活力很健康,但問題出現了,什麼是熱愛?什麼是精通?三分二或三分一又代表什麼?原來3人便可代表年輕人?數據另一面的人數呢?每當有報章指半數人支持某某議案,其實亦反映了有半數人不支持議案,可惜立場影響事實,半數人突然人間蒸發,是可怖還是可笑?(以上非低智假設數字遊戲,而事情亦有發生)
幸好數據的調查於現今社會仍有其可信性存在,因數據若是多,或精確,或平均,或由公信力高之機構所主導,在一定情況下還可以相信(香港大學民意網站),其實只要個人肯細心研究,數據即使被強行設定立場,還是可以了解事實的情況,還數據一個貞節牌坊。
(現舉一例,某國以數據計算稱其GDP世界最強,但背後又是什麼?)

司馬遷云:「要不是好學不倦,多作觀察,很難明白事情的真確」古代是,現代亦如一。
現代社會,資訊傳遞之快根本不能估計,在過往偽資料偽數據的情況以被動的方式形成(如本國土地之審計在古代難以實行,數據只有估計,而非確實)但現代卻出現了主動製造偽資料偽數據的情況,此則今人不忍見。

1 則留言:

  1. 資料本身是中立的, 只是被有心人利用就成為了不同的結果了!
    特別是隱瞞、蒙蔽, 以及轉移焦點, 此等今天社會時常用的手法, 要避過它們真是不容易.

    回覆刪除

注意:只有此網誌的成員可以留言。