跳到主要內容

[政府資料應用] (巨量)資料分析研究成果發表會心得

今天參與了科技部和工研院的巨量資料成果發表會,那是一場很學術但時間不足的成果發表會,也曝露出:有資源、有關係拿到的資料更齊全的真實狀況。

同樣做空污與健康的研究,同樣是健保資料庫+開放的氣相資料+空污資料,元智大學有資本可以拿到更完整的資料,也因為他們本身是醫事相關學校、願意投入資源,再配合自己的資料庫,做出來的東西更容易令人印象深刻。 另一個案子的成員(學生)在發表前在旁邊碎碎念,念人家拿完整的資料,他們得從零開始,還冒出一句值得深思的話:『他們(元智)也不可能分享出來。』 

在學術研究的角度,當然不可能,但站在為人民的立場呢?如果是為了全國的健康呢?就像Theranos的創辦人Elizabeth Holmes將研究出來的技術都申請了專利,以商業立場來看是應該的,但能救人、改善醫療檢驗的技術申請專利似乎哪裡『不太清爽』。 

Open Street Map的應用和國際案例都被提到了幾次。

另外在台灣的1999因為技術問題一直無法放出資料。 在圖像辨識、文字探勘都提到共通問題-人工作業。為了避免法律責任、網站阻擋或是讓資料定位更準確,所以都會再透過人工再分類、定位。在期望的定義裡, 可透過『人力』解決/清理/定義的資料都不能叫『巨量資料』。 

最後一組是講犯罪資料,有三個子題。其中一個是常看到的犯罪地圖,在英美是透過報案資料來分析,中正大學直接和新北市府合作,結合司法院的開放資料同時直接取得獄政資料庫(校長曾有相關警政背景實在太方便了),在『合法』、不違反個資法的前提下也做了一些犯罪行為的分析,這個資料很敏感,可能還分析家庭背景、精神疾病狀態。 

不過,這些都讓我看到了:政府開放資料並不是同步的。 除非部會機關願意,不然民間人士只能拿到垃圾資料,零散、破碎,還要耗費時間清理;但只要進行研究計畫,相關的人員就有『方法』可以拿更齊全的資料。 

離開前,做犯罪行為研究的學生(剛好坐在附近)私底下問:『以後還拿得到獄政資料嗎?』看似老師的人回:『…繼續再配合的意願不高,再加上政局轉換……』老師搖搖頭。 

今天發表的成果裡,都用了一些時間在講述進行研究前與法務人員確認相關的法律責任,但要講法律責任的話時間依然不足,而成果就只能摘要式的報告了。 

最後,對於資料內容的不同步或是取得資料的方式有差異、政局的轉換也影響了各部會、各政策執行的意願,尤其是政府開放資料,這些都讓人感到氣餒。

歡迎參與相關討論:Taipei.io Google group 

留言

這個網誌中的熱門文章

問題不在於區塊鏈

這個星期在台灣,有一場盛大的「亞洲區塊鏈高峰會」,因為在準備 TWIGFAPrIGF 2019 的會議資料,就沒有報名。看了INSIDE 整理的逐字稿,不禁坐在電腦前抽動著嘴角。對於需要經過銀行或是第三方、第 N 方擔保的支付工具,都應屬於建立信任的數位支付工具,如果一個以加密貨幣為交換工具卻還要經過銀行,那都不是「區塊鏈應用」,或可說,它還在重建信任的過渡期。

自接觸區塊鏈應用以來,不斷的聽到網際網路的大老們、前輩們、經濟學者們都在極力反對區塊鏈技術,很多人權團體、媒體、各國央行、金融體系都對於區塊鏈的特性大加撻伐:
過度集中、非去中心化。整個網際網路是個過度中心化的系統,大概很少有人去想網際網路的架構和特性。ICO 是詐騙。老實說,這就是一個人要不要被騙一樣,你不能說投資失敗就是被騙,ICO 是一種賺錢手段,但是「投資」還是「投機」?每個人心中都有一把尺。加密貨幣(Cryptocurrency)的應用。加密貨幣是數位(電子)支付的一種,大家常常把加密貨幣作為數位支付的代名詞。台灣政府對於加密貨幣的態度較偏向視之為虛擬貨幣、商品,而不是正式的法幣 (Fiat Money)。無法移除不該保有的資料。有些人權團體表示會有人把婦女、孩童受虐的照片或裸露的影片上傳到區塊鏈上,且無法移除。把這個問題歸咎於區鏈技術實在很莫名其妙,畢竟暴力傷害人類、動物的行為就是非法行為,當影片或照片上網後,會迅速的傳播與擴散,有些是存在私人的硬碟裡。但該注意的重點在於:(1) 這些虐待、強迫裸露、拍攝這些影片與照片的犯罪行為根本就不該發生(犯罪預防)、(2) 這些存在私人硬碟裡的照片與影音檔根本就不該被擴散 (民眾教育)、(3) 基於前面兩點,政府應該加強自己的責任,而不應該強迫平台業者對使用者的內容進行審查,內容審查是侵犯言論自由權的。智財所有權的問題。例如用作品完成時的時間戳記 (Timestamp) 可以證明是自己的作品,但今天如果有人把這篇文章用他自己的帳號,把文字內容上傳到 IPFS (星際檔案系統,Inter Planetary File System),頂多就是在之後加註原始作者是誰,上傳者不是原作者這種尷尬的情況。所以日後若是使用自動化的分潤系統,要怎麼去證明作者是誰?如何分給哪些人?交易速度慢,無法因應全球金融、資料交換的大量工作。反觀,網際網路被大量應用的年代初期…

參與 1 月 11 日的「資通安全管理法」公聽會感想

如果有人讀過由去年諾貝爾經濟學奬得主 Richard H. Thaler 的《不當行為》,也許就會開始學習如何當一個理性的經濟學者,而不被衝動或個人習慣沖昏頭進行不當的消費。書中所提到的一些概念其實更可以運用在各個場域裡,包括已參與幾次的座談會到今日公聽會的「資通安全管理法」。
法學專家們的疑問 大概整理了幾點: 如何避免技術性的規避或離開市場?行政救濟的相關事項。擬這套法案時參考美國、日本、新加坡等這些國家的依據是什麼?是經濟或科技發展情況還是剛好搜尋到這個國家有這套法律,所以拿來用?這部「資通安全管理法」的主管機關是台灣的行政院,行政院主要是整合政策的功能,本身無執法的能力,僅能要求被管制者義務執行,也就是主管機關的管制責任是空虛的。參考的國家都有編制專責的單位與規劃預算,如果在台灣這套法令通過了,開始實行了,有編制的人力嗎?執行的能力嗎?可能沒有。「資通安全管理法」有主管機關,但「個人資料保護法」沒有主管機關。這兩部法一樣重要,但為什麼會有這樣的差異?

關於2018年的台灣網路治理論壇

2017年辦理了台灣網路治理論壇(Taiwan Internet Governance Forum,以下簡稱 TWIGF)後,陸續也有許多單位或有興趣的朋友加入論壇中的 Multi-stakeholder Steering Group (以下簡稱 MSG),TWIGF 今年也舉辦了幾次座談,努力讓台灣的民眾了解什麼是「網路治理」和與其相關的範疇,並持續舉辦會議讓與會者透過親身參與,體驗與了解什麼是「網路治理」和「多方利害關係人機制」。

TWIGF 在 2017 年的主題是「數位衝撞之契機 – 經濟、安全與人權之和諧發展」並將子議題分為:數位經濟、網路安全及網路人權,參與者約有兩百多人也刊登上《Global Information Society Watch(GISWatch) 2017 Special Issue - Internet governance from the edges: NRIs in their own words》,藉由此機會讓國外的讀者了解台灣網路治理的發展狀況。 網路治理論壇的精神:對話才是重點 不同於台灣習慣的研討會、座談會模式,主持人或與談人可能會準備大量的投影片向參與者簡報。TWIGF 會議裡有主持人、與談人和參與者三個角色,與會重點是主持人、與談人、台下參與者三方針對該場次主題的對話,並非與談人的個人演講;三方可能分別在不同領域裡有不同的專業,依照主席宣布的議事規則進行討論,沒有多餘的簡報與演講,在該場次 60 至 90 分鐘的對話時間裡,透過「多方利害關係人機制」找到彼此對議題的共識。對話可能包括了爭論、對談,參與者都是熟悉該議題或對議題有興趣,在彼此尊重與包容的前提下發言與討論,透過對話形成共識。