跳到主要內容

[政府資料應用] (巨量)資料分析研究成果發表會心得

今天參與了科技部和工研院的巨量資料成果發表會,那是一場很學術但時間不足的成果發表會,也曝露出:有資源、有關係拿到的資料更齊全的真實狀況。

同樣做空污與健康的研究,同樣是健保資料庫+開放的氣相資料+空污資料,元智大學有資本可以拿到更完整的資料,也因為他們本身是醫事相關學校、願意投入資源,再配合自己的資料庫,做出來的東西更容易令人印象深刻。 另一個案子的成員(學生)在發表前在旁邊碎碎念,念人家拿完整的資料,他們得從零開始,還冒出一句值得深思的話:『他們(元智)也不可能分享出來。』 

在學術研究的角度,當然不可能,但站在為人民的立場呢?如果是為了全國的健康呢?就像Theranos的創辦人Elizabeth Holmes將研究出來的技術都申請了專利,以商業立場來看是應該的,但能救人、改善醫療檢驗的技術申請專利似乎哪裡『不太清爽』。 

Open Street Map的應用和國際案例都被提到了幾次。

另外在台灣的1999因為技術問題一直無法放出資料。 在圖像辨識、文字探勘都提到共通問題-人工作業。為了避免法律責任、網站阻擋或是讓資料定位更準確,所以都會再透過人工再分類、定位。在期望的定義裡, 可透過『人力』解決/清理/定義的資料都不能叫『巨量資料』。 

最後一組是講犯罪資料,有三個子題。其中一個是常看到的犯罪地圖,在英美是透過報案資料來分析,中正大學直接和新北市府合作,結合司法院的開放資料同時直接取得獄政資料庫(校長曾有相關警政背景實在太方便了),在『合法』、不違反個資法的前提下也做了一些犯罪行為的分析,這個資料很敏感,可能還分析家庭背景、精神疾病狀態。 

不過,這些都讓我看到了:政府開放資料並不是同步的。 除非部會機關願意,不然民間人士只能拿到垃圾資料,零散、破碎,還要耗費時間清理;但只要進行研究計畫,相關的人員就有『方法』可以拿更齊全的資料。 

離開前,做犯罪行為研究的學生(剛好坐在附近)私底下問:『以後還拿得到獄政資料嗎?』看似老師的人回:『…繼續再配合的意願不高,再加上政局轉換……』老師搖搖頭。 

今天發表的成果裡,都用了一些時間在講述進行研究前與法務人員確認相關的法律責任,但要講法律責任的話時間依然不足,而成果就只能摘要式的報告了。 

最後,對於資料內容的不同步或是取得資料的方式有差異、政局的轉換也影響了各部會、各政策執行的意願,尤其是政府開放資料,這些都讓人感到氣餒。

歡迎參與相關討論:Taipei.io Google group 

留言

這個網誌中的熱門文章

閱讀歐盟區塊鏈技術運用於身份識別的報告與台灣的數位身分識別證

中午時間,我在查詢相關資料,回覆信件後,回頭問自己:「為什麼自己在查詢資料時,總是先從歐盟的資料著手?很多人會反應為什麼要查歐盟或 OECD 的資料而不先使用國內的資料?其他國家的研究資料不能用嗎?」

這幾年的心得是,在歐盟和 OECD 的報告裡會提供研究方法,公開告訴每個人,他們的數據來源、取得方法、怎麼推估、根據什麼政策框架,有什麼研究限制,這些公開的研究條件,都經得起外界審視和質疑,所以在檢查其合理性後,可以使用這些報告。

以區塊鏈技術運用在身分識別用途來說好了,在 GDPR 公布後,裡面的條件都規範了資料使用和流通的限制,對於喜歡不經告知就擅自挪用、交易的企業來說,使用資料的成本與門檻都提高許多,許多科技業者也質疑,在需要資料發展創新科技,如 AI 和區塊鏈,或是自主駕駛車輛,也需要大量的地理交通資訊,在 GDPR 這麼嚴謹的限制條件下,要如何發展新科技?

對台灣即將更換的數位身分識別證的幾個疑問

在 2017 年時,台灣政府相關部會就不斷用各種藉口,要將現行的卡式身分證更換為結合更多功能的數位身分識別證,例如:多卡合一可以讓民眾的皮夾薄一點、許多國家都換成數位身份證,所以也要換。台灣的人權團體不斷的提出疑慮,提醒民眾若是實施數位身分識別可能會面臨的風險,試圖喚醒民眾的警覺心。

吵吵鬧鬧至今,只要是反對數位身分證的人,就不會收到內政部或是其他相關活動的訊息,就如同當初資安法一樣,反對的人就讓他們不知道訊息一樣,甚至是在社群媒體上對提問也是封閉、選擇性的回答。

今天看了三篇文章:
台灣人權促進會 (台權會):晶片身分證:為誰造橋鋪路? (2019/08/22)中央社:數位身分證明年10月換發 未來結合手機免攜卡 (2019/08/22)中央社:徐國勇:不換新身分證無罰則 恐無法投票 (2019/05/16) 看起來數位身份證是勢在必行了,但報導中的內容則讓我覺得這些都無法構成說服民眾 (我) 更換數位身分證的理由。

關於 2019 年的網路治理議題

註:原文寫於今年三月,刊登在 Medium ,不過再兩個星期就是 TWIGF 了,所以把這篇文章搬回來,也邀請各位讀者們一同參與今年的 TWIGF。如果在現場遇到的話,歡迎一起交流,以下是會議資訊:
TWIGF 2019 年度論壇時間:2019 年7月5~6日(週五和週六)地點:中華電信總公司大樓 (臺北市中正區信義路一段21-3號)主題:建立開放、包容、信任、創新的數位社會TWIGF 網站及議程
在 2018 年時,全球的網路治理活動圍繞著:網路安全、個資保護議題、歐盟的 General Data Protection Regulation (GDPR)、Facebook (或其他企業)販售或不當使用使用者的資料,進行操弄使用者行為…等議題,並在這些議題下衍生出更多隱憂,例如區域合作、各國打造更嚴格的個人資料保護法…等。2018 年的聯合國網路治理論壇(以下簡稱 IGF)的主題是 “ The Internet of Trust” ,在於建立信任,而 2019 年的主題則以三個方向為主(英文頁面):
資料治理 Data Governance 數位包容 Digital Inclusion 安全與具有彈性的網路是數位經濟成長的先決條件和對整體數位環境有益。 Security, Safety, Stability and Resilience: Security and Safety are prerequisites to economic growth and a healthy digital environment beneficial to all.