跳至主要內容

[政府資料應用] (巨量)資料分析研究成果發表會心得

今天參與了科技部和工研院的巨量資料成果發表會,那是一場很學術但時間不足的成果發表會,也曝露出:有資源、有關係拿到的資料更齊全的真實狀況。

同樣做空污與健康的研究,同樣是健保資料庫+開放的氣相資料+空污資料,元智大學有資本可以拿到更完整的資料,也因為他們本身是醫事相關學校、願意投入資源,再配合自己的資料庫,做出來的東西更容易令人印象深刻。 另一個案子的成員(學生)在發表前在旁邊碎碎念,念人家拿完整的資料,他們得從零開始,還冒出一句值得深思的話:『他們(元智)也不可能分享出來。』 

在學術研究的角度,當然不可能,但站在為人民的立場呢?如果是為了全國的健康呢?就像Theranos的創辦人Elizabeth Holmes將研究出來的技術都申請了專利,以商業立場來看是應該的,但能救人、改善醫療檢驗的技術申請專利似乎哪裡『不太清爽』。 

Open Street Map的應用和國際案例都被提到了幾次。

另外在台灣的1999因為技術問題一直無法放出資料。 在圖像辨識、文字探勘都提到共通問題-人工作業。為了避免法律責任、網站阻擋或是讓資料定位更準確,所以都會再透過人工再分類、定位。在期望的定義裡, 可透過『人力』解決/清理/定義的資料都不能叫『巨量資料』。 

最後一組是講犯罪資料,有三個子題。其中一個是常看到的犯罪地圖,在英美是透過報案資料來分析,中正大學直接和新北市府合作,結合司法院的開放資料同時直接取得獄政資料庫(校長曾有相關警政背景實在太方便了),在『合法』、不違反個資法的前提下也做了一些犯罪行為的分析,這個資料很敏感,可能還分析家庭背景、精神疾病狀態。 

不過,這些都讓我看到了:政府開放資料並不是同步的。 除非部會機關願意,不然民間人士只能拿到垃圾資料,零散、破碎,還要耗費時間清理;但只要進行研究計畫,相關的人員就有『方法』可以拿更齊全的資料。 

離開前,做犯罪行為研究的學生(剛好坐在附近)私底下問:『以後還拿得到獄政資料嗎?』看似老師的人回:『…繼續再配合的意願不高,再加上政局轉換……』老師搖搖頭。 

今天發表的成果裡,都用了一些時間在講述進行研究前與法務人員確認相關的法律責任,但要講法律責任的話時間依然不足,而成果就只能摘要式的報告了。 

最後,對於資料內容的不同步或是取得資料的方式有差異、政局的轉換也影響了各部會、各政策執行的意願,尤其是政府開放資料,這些都讓人感到氣餒。

歡迎參與相關討論:Taipei.io Google group 

留言

此網誌的熱門文章

Power and Information in Digital Governance: The Influence of Tech Giants and the Challenges of Media Literacy

I do not have enough time to organize a team or invite panelists to a roundtable discussion in APrIGF 2024. I have listed some interesting issues for anyone who wants to send proposals to APrIGF 2024 or anyone who wants to discuss these issues in any Internet Governance Forum (IGF). As an observer of the internet or digital technology policy and development, I raise my concerns about how the government regulates the internet technology of tech giant companies and how people enhance media literacy. 1. The Tech Giants may control our lives and be stronger than the government.  Last year, Microsoft announced plans to invest 2.5 billion pound s in artificial intelligence infrastructure in the UK. Of course, The UK government welcomes the investment. Any government welcomes foreign enterprises' investment in emerging technology, especially in cyber(AI or internet)security, talent education, semiconductors, or other technology infrastructures. At the same time, the UK Competition Marke

聽死神說故事--偷書賊

書名:偷書賊(THE Book Thief) 作者:Markus Zusak ISBN:9789866973420 作者網站: Markus Zusak 譯者:呂玉嬋 出版:木馬文化 封面取自博客來網路書局。 購買於小小書房。 這個夏天讀《偷書賊》和《失物之書》,會在兩本不同的故事裡看到同一個時空背景所發生的故事,同樣是發生在孩子身上的事,同樣在說文字的力量,但《偷書賊》的節奏比《失物之書》緩慢一些。我盡量不要比較這兩本書,因為這是很無聊的事,但在閱讀的過程裡總驚訝這兩個故事有那麼多巧合之處,不是情節上的相似,而是在人物角色和背景總是有相似或是對立的情況出現。 《偷書賊》的女主角是被德國夫妻領養的莉賽爾,原本也要一同被領養的莉賽爾的弟弟卻死於火車上,莉賽爾在遭受與父母分離及弟弟的死亡後,在精神上受了極大的創傷,幸運的是領養她的父母是故事書中最仁慈的角色,給了莉賽爾完整的愛,不同於此時期裡其他的孩子可能瀕臨餓死或是送入集中營或是在街頭流浪被流彈波及,莉賽爾因為養父母的照顧和周遭的朋友、躲在地下室的猶太人…還有偏愛她的死神。 這個故事的特別處之一,敘述者不是主角或是任何一個書中的角色,而是沒有時空限制,總是旁觀的第三者,特別是在二戰的年代,無所不在的死神,戰場、集中營、巷弄裡,特別的是,這個死神總是想要表現祂冷酷無情和輕蔑人類的一面,但實際上我們從書中讀到的,是祂憐憫人類、輕視、無奈、驚訝人類的個性,也像人類一樣會抱怨工作、具有詩意、幽默感,也就是具有人性的一面: 人類只有在一天的開始與結束時,才會觀察顏色的變化。 但是對我而言,一天當中,每個短暫片刻都呈現出不同的色度與調性。 光是一個小時的時間,就包含了幾千種不同的顏色:蜜蠟黃、柔絲藍、陰鬱黑。 我是做這行的,當然特別注意顏色的變化。 …她貫徹始終,只要經過三十三號的門口,從沒有忘記吐痰,還會外加一句「死豬」。我發現德國人有個特點:他們真的很愛豬。 這個具有人性的死神成了說書者,祂說著在戰時會發生在任何一個角落的故事,然而我們透過祂的眼睛,看到一個帶著色彩、煙硝味濃厚、心驚膽跳與眼淚的故事,祂不儘是旁觀者,同時也是貫穿整個故事的主要角色之一。 整個故事讀起來有對納粹主義的不滿也有對當時情況的無奈。裡面對於創傷後壓力症候群( PTSD )的描寫也很貼切,莉賽爾和猶太人麥克斯分別經歷了不同程度的打擊,也產生了同樣的症狀,

[movie]記憶中失落的迷人氣味 Perfume

書本: Perfume: The Story of Muder 香水 作者:Patrick Suskind 徐四金 譯者:洪翠娥 出版社:皇冠 電影:Perfume: The Story of Muder 香水 導演:Tom Tykwer 演員:Ben Whishaw, Dustin Hoffman, Alan Rickman, Rachel Hurd-Wood 原聲帶: Perfume: The Story of a Murder - O.S.T. 在博客來網路書局買香水電影原聲帶 配樂:Berliner Philharmoniker 柏林愛樂交響樂團演奏 相信有不少人都看過德國作家徐四金所寫的著名小說《香水》,對這部電影的上映也是又期待又害怕。今天和排休的偉展兩個人到中和國賓影城看了這部電影後,都覺得這電影票錢花得值得,而且也意猶味盡的準備買下DVD和原聲帶。 雖然說這部電影在上映時,作者並未出席首映會,但對於讀者來說,雖然電影的部份有做部份的修改,刪掉書中的部份情節,忽略了小說開頭最重要的部份,但仍是相當好看的,在配樂上、男主角的確有詮釋出 葛奴乙 對於香氣保存的渴望與對氣味的貪婪,由其是他臉上的肌肉會因為對氣味貪婪而顫動著,難怪導演選角選了很久。 在目前所能看到的商業活動文宣裡都提到葛奴乙生來是沒有氣味的,這點其實有些問題。他並非天生就沒有氣味的,在書裡,他出生在一個非常炎熱與臭味衝天的環境裡,小說裡是這麼寫的: 「這種臭她感覺起來不像別的臭,而只更像一種令人受不了的醉人的東西,像百合田,或像放太多黃水仙的密封房間」 因為這醉人的香氣,她暈了過去並滾到路面上,雖然醒來繼續做生意,但沒多久就上斷頭台了(電影裡是受絞刑)。所以葛奴乙並非是生來無氣味的,在我的解讀裡,他一生中的氣味就在出生的那一剎那散發了出來,也許是回饋給那位沒愛過他且嗅覺已遲鈍的年輕母親。然而一個剛出生的嬰兒會有這樣的味道其實也不尋常,嬰兒的味道其實是一種甜甜的蜂蜜牛奶香,暖呼呼的,當然還帶著點尿布的味道,書裡也有描寫,但如果沒有確實的聞到嬰兒身上的香氣,其實很難想像出來。 這也是這部小說和電影成功的地方。在小說的剛開頭章節裡,幾乎都是對於氣味的描寫,讀者要一邊閱讀著文字,大腦裡還要一邊將文字處理成氣味的記憶,但平凡如我,也無法聞過所有的香氣,有