[政府資料應用] (巨量)資料分析研究成果發表會心得

今天參與了科技部和工研院的巨量資料成果發表會，那是一場很學術但時間不足的成果發表會，也曝露出：有資源、有關係拿到的資料更齊全的真實狀況。

同樣做空污與健康的研究，同樣是健保資料庫+開放的氣相資料+空污資料，元智大學有資本可以拿到更完整的資料，也因為他們本身是醫事相關學校、願意投入資源，再配合自己的資料庫，做出來的東西更容易令人印象深刻。另一個案子的成員(學生)在發表前在旁邊碎碎念，念人家拿完整的資料，他們得從零開始，還冒出一句值得深思的話：『他們(元智)也不可能分享出來。』

在學術研究的角度，當然不可能，但站在為人民的立場呢？如果是為了全國的健康呢？就像Theranos的創辦人Elizabeth Holmes將研究出來的技術都申請了專利，以商業立場來看是應該的，但能救人、改善醫療檢驗的技術申請專利似乎哪裡『不太清爽』。

Open Street Map的應用和國際案例都被提到了幾次。

另外在台灣的1999因為技術問題一直無法放出資料。在圖像辨識、文字探勘都提到共通問題－人工作業。為了避免法律責任、網站阻擋或是讓資料定位更準確，所以都會再透過人工再分類、定位。在期望的定義裡，可透過『人力』解決/清理/定義的資料都不能叫『巨量資料』。

最後一組是講犯罪資料，有三個子題。其中一個是常看到的犯罪地圖，在英美是透過報案資料來分析，中正大學直接和新北市府合作，結合司法院的開放資料同時直接取得獄政資料庫(校長曾有相關警政背景實在太方便了)，在『合法』、不違反個資法的前提下也做了一些犯罪行為的分析，這個資料很敏感，可能還分析家庭背景、精神疾病狀態。

不過，這些都讓我看到了：政府開放資料並不是同步的。除非部會機關願意，不然民間人士只能拿到垃圾資料，零散、破碎，還要耗費時間清理；但只要進行研究計畫，相關的人員就有『方法』可以拿更齊全的資料。

離開前，做犯罪行為研究的學生(剛好坐在附近)私底下問：『以後還拿得到獄政資料嗎？』看似老師的人回：『…繼續再配合的意願不高，再加上政局轉換……』老師搖搖頭。

今天發表的成果裡，都用了一些時間在講述進行研究前與法務人員確認相關的法律責任，但要講法律責任的話時間依然不足，而成果就只能摘要式的報告了。

最後，對於資料內容的不同步或是取得資料的方式有差異、政局的轉換也影響了各部會、各政策執行的意願，尤其是政府開放資料，這些都讓人感到氣餒。

歡迎參與相關討論：Taipei.io Google group

留言

此網誌的熱門文章

聽死神說故事--偷書賊

書名：偷書賊（THE Book Thief）作者：Markus Zusak ISBN：9789866973420 作者網站： Markus Zusak 譯者：呂玉嬋出版：木馬文化封面取自博客來網路書局。購買於小小書房。這個夏天讀《偷書賊》和《失物之書》，會在兩本不同的故事裡看到同一個時空背景所發生的故事，同樣是發生在孩子身上的事，同樣在說文字的力量，但《偷書賊》的節奏比《失物之書》緩慢一些。我盡量不要比較這兩本書，因為這是很無聊的事，但在閱讀的過程裡總驚訝這兩個故事有那麼多巧合之處，不是情節上的相似，而是在人物角色和背景總是有相似或是對立的情況出現。《偷書賊》的女主角是被德國夫妻領養的莉賽爾，原本也要一同被領養的莉賽爾的弟弟卻死於火車上，莉賽爾在遭受與父母分離及弟弟的死亡後，在精神上受了極大的創傷，幸運的是領養她的父母是故事書中最仁慈的角色，給了莉賽爾完整的愛，不同於此時期裡其他的孩子可能瀕臨餓死或是送入集中營或是在街頭流浪被流彈波及，莉賽爾因為養父母的照顧和周遭的朋友、躲在地下室的猶太人…還有偏愛她的死神。這個故事的特別處之一，敘述者不是主角或是任何一個書中的角色，而是沒有時空限制，總是旁觀的第三者，特別是在二戰的年代，無所不在的死神，戰場、集中營、巷弄裡，特別的是，這個死神總是想要表現祂冷酷無情和輕蔑人類的一面，但實際上我們從書中讀到的，是祂憐憫人類、輕視、無奈、驚訝人類的個性，也像人類一樣會抱怨工作、具有詩意、幽默感，也就是具有人性的一面：人類只有在一天的開始與結束時，才會觀察顏色的變化。但是對我而言，一天當中，每個短暫片刻都呈現出不同的色度與調性。光是一個小時的時間，就包含了幾千種不同的顏色：蜜蠟黃、柔絲藍、陰鬱黑。我是做這行的，當然特別注意顏色的變化。 …她貫徹始終，只要經過三十三號的門口，從沒有忘記吐痰，還會外加一句「死豬」。我發現德國人有個特點：他們真的很愛豬。這個具有人性的死神成了說書者，祂說著在戰時會發生在任何一個角落的故事，然而我們透過祂的眼睛，看到一個帶著色彩、煙硝味濃厚、心驚膽跳與眼淚的故事，祂不儘是旁觀者，同時也是貫穿整個故事的主要角色之一。整個故事讀起來有對納粹主義的不滿也有對當時情況的無奈。裡面對於創傷後壓力症候群（ PTSD ）的描寫也很貼切，莉賽爾和猶太人麥克斯分別經歷了不同程度的打擊，也產生了同樣的症狀，

[movie]記憶中失落的迷人氣味 Perfume

書本： Perfume: The Story of Muder 香水作者：Patrick Suskind 徐四金譯者：洪翠娥出版社：皇冠電影：Perfume: The Story of Muder 香水導演：Tom Tykwer 演員：Ben Whishaw, Dustin Hoffman, Alan Rickman, Rachel Hurd-Wood 原聲帶： Perfume: The Story of a Murder - O.S.T. 在博客來網路書局買香水電影原聲帶配樂：Berliner Philharmoniker 柏林愛樂交響樂團演奏相信有不少人都看過德國作家徐四金所寫的著名小說《香水》，對這部電影的上映也是又期待又害怕。今天和排休的偉展兩個人到中和國賓影城看了這部電影後，都覺得這電影票錢花得值得，而且也意猶味盡的準備買下DVD和原聲帶。雖然說這部電影在上映時，作者並未出席首映會，但對於讀者來說，雖然電影的部份有做部份的修改，刪掉書中的部份情節，忽略了小說開頭最重要的部份，但仍是相當好看的，在配樂上、男主角的確有詮釋出葛奴乙對於香氣保存的渴望與對氣味的貪婪，由其是他臉上的肌肉會因為對氣味貪婪而顫動著，難怪導演選角選了很久。在目前所能看到的商業活動文宣裡都提到葛奴乙生來是沒有氣味的，這點其實有些問題。他並非天生就沒有氣味的，在書裡，他出生在一個非常炎熱與臭味衝天的環境裡，小說裡是這麼寫的：「這種臭她感覺起來不像別的臭，而只更像一種令人受不了的醉人的東西，像百合田，或像放太多黃水仙的密封房間」因為這醉人的香氣，她暈了過去並滾到路面上，雖然醒來繼續做生意，但沒多久就上斷頭台了（電影裡是受絞刑）。所以葛奴乙並非是生來無氣味的，在我的解讀裡，他一生中的氣味就在出生的那一剎那散發了出來，也許是回饋給那位沒愛過他且嗅覺已遲鈍的年輕母親。然而一個剛出生的嬰兒會有這樣的味道其實也不尋常，嬰兒的味道其實是一種甜甜的蜂蜜牛奶香，暖呼呼的，當然還帶著點尿布的味道，書裡也有描寫，但如果沒有確實的聞到嬰兒身上的香氣，其實很難想像出來。這也是這部小說和電影成功的地方。在小說的剛開頭章節裡，幾乎都是對於氣味的描寫，讀者要一邊閱讀著文字，大腦裡還要一邊將文字處理成氣味的記憶，但平凡如我，也無法聞過所有的香氣，有

參與 IGF2023-The Internet We Want

Image by Penny from Pixabay 在文章的開頭先說明，這篇文章只會大概提一下自己今年線上參與的每個場次，也不會像未來可能出現的介紹，比較像是我自己從 2017 年參與聯合國網路治理論壇(IGF)至今的感想。有些人寫出國報告，有些人的人緣比較好可以辦分享會，我就在自己的部落格寫自己的感想。在此提醒讀到這篇文章的各位，要參與全球網路治理活動要注意自己的健康，因為這樣跨時區馬拉松式的會議，長久的參與雖然非常刺激也會讓人忘記要睡覺，但長期對身心都會造成傷害，尤其是心理健康，心理健康(Mental Health) 也是今年 IGF 會議討論的重點之一。本篇文章不討論 Global Digital Compact (GDC)，台灣人對 GDC 可能無感，也需要從 GDC 的發展過程去理解，還包括各個社群的意見，所以就留給其他參與者寫出國報告的內容，但建議細心閱讀大會文件「 The Internet We Want 」。 IGF 不是一年一度的盛大廟會台灣一直有很嚴重的資訊不對稱的問題，我在剛開始參與時也以為IGF只有一年一次而已，就像台灣的某些研討會，可能一年一次或一年幾次，像廟會一樣，上台露臉講一下自己的意見就好。其實完全不同，IGF 有更多的年度間會議，在每一次的年會之間都有不同的社群在進行活動，IGF 的社群能否繼續下去，完全視能否有更多的資源，例如最佳實務論壇 (Best Practice Forum, BPF) ，在 2014 年時還有 6 個，2022 年時剩 2 個，到 2023 年只剩下網路安全(Cybersecurity)討論群組，但也會有其他增加的，例如政策網絡(Policy Network, PN) [1] ，平均每年大概都有 2 個 PN，2022年時的重點在網路碎片化，所以有在 2023 年時因為全球對人工智慧的關注，PN 的討論群組就增加為 3 個，也就是多了人工智慧政策網絡(Policy Networks Artificial Intelligencr, PNAI)。至於我每年都會在年度間線上參與的國家區域倡議者工作群組 (National, Regional Initiatives, NRIs)，也會全年度參與全球各國家、區域的網路治理論壇，台灣不是聯合國的會員國，所以他們不會以官方身分來台灣。 IGF的討