跳到主要內容

[政府資料應用] (巨量)資料分析研究成果發表會心得

今天參與了科技部和工研院的巨量資料成果發表會,那是一場很學術但時間不足的成果發表會,也曝露出:有資源、有關係拿到的資料更齊全的真實狀況。

同樣做空污與健康的研究,同樣是健保資料庫+開放的氣相資料+空污資料,元智大學有資本可以拿到更完整的資料,也因為他們本身是醫事相關學校、願意投入資源,再配合自己的資料庫,做出來的東西更容易令人印象深刻。 另一個案子的成員(學生)在發表前在旁邊碎碎念,念人家拿完整的資料,他們得從零開始,還冒出一句值得深思的話:『他們(元智)也不可能分享出來。』 

在學術研究的角度,當然不可能,但站在為人民的立場呢?如果是為了全國的健康呢?就像Theranos的創辦人Elizabeth Holmes將研究出來的技術都申請了專利,以商業立場來看是應該的,但能救人、改善醫療檢驗的技術申請專利似乎哪裡『不太清爽』。 

Open Street Map的應用和國際案例都被提到了幾次。

另外在台灣的1999因為技術問題一直無法放出資料。 在圖像辨識、文字探勘都提到共通問題-人工作業。為了避免法律責任、網站阻擋或是讓資料定位更準確,所以都會再透過人工再分類、定位。在期望的定義裡, 可透過『人力』解決/清理/定義的資料都不能叫『巨量資料』。 

最後一組是講犯罪資料,有三個子題。其中一個是常看到的犯罪地圖,在英美是透過報案資料來分析,中正大學直接和新北市府合作,結合司法院的開放資料同時直接取得獄政資料庫(校長曾有相關警政背景實在太方便了),在『合法』、不違反個資法的前提下也做了一些犯罪行為的分析,這個資料很敏感,可能還分析家庭背景、精神疾病狀態。 

不過,這些都讓我看到了:政府開放資料並不是同步的。 除非部會機關願意,不然民間人士只能拿到垃圾資料,零散、破碎,還要耗費時間清理;但只要進行研究計畫,相關的人員就有『方法』可以拿更齊全的資料。 

離開前,做犯罪行為研究的學生(剛好坐在附近)私底下問:『以後還拿得到獄政資料嗎?』看似老師的人回:『…繼續再配合的意願不高,再加上政局轉換……』老師搖搖頭。 

今天發表的成果裡,都用了一些時間在講述進行研究前與法務人員確認相關的法律責任,但要講法律責任的話時間依然不足,而成果就只能摘要式的報告了。 

最後,對於資料內容的不同步或是取得資料的方式有差異、政局的轉換也影響了各部會、各政策執行的意願,尤其是政府開放資料,這些都讓人感到氣餒。

歡迎參與相關討論:Taipei.io Google group 

留言

這個網誌中的熱門文章

智慧城市不是只有得獎、入圍而已及參觀智慧城市展感想

之前參與了第8次的火箭聊天室,講者Roy Lin提到了:「當大家在提到『智慧城市』四個字時,想到的多半是:智慧停車、智慧燈柱、智慧巴士...等項目,多是以科技發展的角度,卻沒有自設計師的立場出發,也沒有人想過是要以『智慧』的方式來處理城市生活裡所面臨的各種問題。」不斷反思這段話。

智慧城市不止是在談解決方案,更在談系統整合
打造智慧城市並不是談如何拿到ICF(Intelligent Community Forum)的智慧城市評比,更不是拿裡面的評量標準拿來當作是施政的KPI,若要讓居住於其中的市民有感,應該要先找出都市中需要被解決的問題,例如利用政府開放資料找出都市中的閒置空間,實際去探訪這些閒置空間的規劃是被作為停車場、公園或乾脆荒廢的一塊地,又或是透過資料視覺化來顯示城市的脈動,藉此可以在未來進行商圈規劃或是都市更新發展等。有些國家如新加坡便是與日本合作智慧節能系統,鼓勵國內的新創研發,投資海外的創新研發,並應用在國家發展中,以期讓人民的生活更便利。

感受大數據的威力

小時候和家人外出,學會如何看地圖找方向。在爸爸的腦海裡有一個自動導航系統,當高速公路塞車時,他會從最近出口離開高速公路,找到其他的替代道路,帶我們到達目的地,減少塞車時所受的痛苦。 爸爸教我的一句話:路是長在嘴巴上的,不知道路時,就下車問店家,如檳榔攤、小吃店。 之後出現了車用衛星導航軟體,在車上架個小型面板或機器,設定好目的地後,導航軟體會規劃路線,帶用路人到達目的地。初期最常出現的社會是:車子開入田中、掉入水溝中、開入窄巷或市場、夜市中進退兩難。 有了這些車用導航後,駕駛人都十分依賴它,也不曾再看人下車問路了,但我也沒看過哪個駕駛像爸爸一樣,只要方向沒錯,就可以透過省道、縣道帶我們回家。

也是習慣旁觀他人之痛苦

在參與幾堂NII台權會所辦理的的網路治理課程裡,總是不時被提醒: 在網際網路的世界裡,永遠是WINNER TAKES ALL. 只要有第一家服務出現,就別想當第二,因為不會有第二。

當Dropbox出現後,有提供 30GB免費服務的 COPY,最後出現了Google Drive(不談台灣的Hinet什麼的)。最後,COPY的服務收掉了,Dropbox雖然最初是由病毒行銷打下市場,但近期除了資安問題一直出包外,它也不再是當初的獨角獸。我甚至覺得Google、Amazon會在家用市場開戰,勝利者就可能的雲端儲存會把整個市場吃掉。

也許有不少人聽過Hotmail,這也是曾經紅極一時的郵件服務,剛開始申請時還有10MB的郵件空間,也是透過病毒行銷的方式拓展使用者市場,但當Google Mail(現在的gmail)出現,Hotmail服務也消失了,日後是否還有郵件服務,可能還未確定。