跳至主要內容

從政府開放資料看不同部會間的資訊落差


最近因為想查詢某些資料,而分別向經濟部與衛生福利部請求提供資料,從兩個部會的回應中,可以了解到我們的公務人員對於「開放資料」理解程度的差異:
政府開放資料平臺提問後第四個工作天得到經濟部的回應
目前本局已提供去除個資之104年度違反商品檢驗規定之公開資料,105年度之資料因仍在進行個人資料去識別化動作,預計106年5月將公開。
經濟部的回應
從回應訊息中得到以下的資訊:
  1. 資料已更新。 
  2. 不能開放的原因。
  3.  預計開放的時間。 
  4. 本案的聯絡人、聯絡資訊。
對於「Data Set資料集」的定義是:歷年度、累積的資訊,而非當年度的資訊而已,但也許是問題只問了104年度,對於文字理解上的誤差,所以標準檢驗局只提供當年度的資訊,所以就再向經濟部索取更進一步、完整的政府資料(連結)。
在提問後的第五個工作天得到衛生福利部的回應
檢驗不合格產品與廠商相關資料已於本署網站/不合格檢體專區公開,為確保資料之正確及公允性,相關資訊以PDF檔呈現,民眾若有需求可上本署網站查詢。
衛生福利部的回應
這樣的回應內容相當於「恕難提供」。衛服部的理由是「為確保資料之正確及公允性,相關資訊以PDF檔呈現」,在這個技術躍進的年代,筆者只想回應:「難道PDF就不會被變動嗎?在假新聞充斥的時代裡,政府部門自己提供出來的資料都不能被信任,要民眾信任什麼?」
部份支持政府開放資料的人認為,政府資料能協助民眾監督政府,然而政府資料除了監督政府,這些資料還能讓事件、新聞被驗證、協助閱聽人不受限於政府(與大眾媒體)刻意設計的內容看到檯面下的目的。
例如消費者常在一般的新聞媒體上得知衛福部可能對食品進行檢驗,但完整的不合格商品名單、廠商品單卻無法自媒體上取得,消費者就必須再到衛福部及其相關局處署網站找尋相關的資料。網站裡所提供PDF資料適合在瀏覽器裡閱讀,對於一般的網路使用者來說,也是普遍的閱讀格式。
今天小莉的阿姨送了她一組保養品,小莉想看看這個品牌的保養品是否符合衛福部的檢驗:

  1. 她打開電腦(或手機)
  2. 找到衛福部食品藥物管理署網站(前提是我知道這是由食藥署負責)
  3. 在食藥署網站
  4. 用滑鼠找到「業務專區」下的「化粧品」
  5. 再找到「化粧品優良製造規範(GMP)及通過名單」
  6. 通過化粧品GMP查核名單
  7. 分別是一個Excel檔和一個PDF檔
總共七個步驟。熟悉政府網站編排的筆者,至少也花了三分鐘才找到這個資訊。只是要找這個品牌是否通過檢驗,卻需要透過這麼多的步驟,為什麼不是有個查詢介面讓消費者搜尋呢?
筆者想整理一份資料庫,卻無法直接取得原始檔案,而需要的內容也不觸及個人資訊及公司的機敏資訊,為什麼不能直接透過程式直接對文字格式檔案處理呢?難道還要再清理PDF格式的檔案嗎?引用朋友的說法:「政府開放出來的那些資料真的很糟糕,往往出來的資料要花八個小時以上的時間清理、整理資料,最後花八分鐘跑完統計,再進行分析。」
對比經濟部標準檢驗局的回應,這兩個單位的資訊程度落差有一段距離,衛福部食藥署的回應相當於2012年政府在推動開放政府資料時,所有部會都會拿出來的藉口,彷彿還活在過去的時代,卻不知道在這個時代裡,如果政府部門都不能相信自己的資料,又要民眾如何信任你?
在政府推動開放政府資料這麼多年來,上至行政院,下至其所屬二級機關都有成立「政府開放資料諮詢小組」,也有進行相關的會議、提供會議記錄、擬定自己部會的「政府資料開放行動策略」,透過民間整理的「臺灣政府資料開放諮詢小組」網站,找到了經濟部與衛服部的相關資料:
  1. 經濟部:委員數有21人資料開放行動策略資料開放諮詢小組會議紀錄
  2. 衛福部:委員數有21人資料開放行動策略(撰寫本文時無法下載,已回報)、資料開放諮詢小組會議紀錄
簡單整理如下表:
部會名稱 經濟部 衛生福利部
資料開放行動策略  103年至105年 (另有106至109年)  撰寫本文時無法下載
 會議記錄  七次會議記錄及相關文件  只有一次104年11月17日會議記錄
筆者在經濟部所提供的「經濟部政府資料開放諮詢小組第2屆第3次會議資料」中看到了「106年至109年的經濟部及所屬機關(構)政府資料開放推動策略」(已回報請求更新),在這份推動策略裡,看到了經濟部對於資料盤點、回應格式體例、去識別化所遵從的架構...等資訊,當民眾要求的資料無法開放時,也規範單位解釋不開放的原因或評估可以開放的時程。在這次的經驗裡,也可知標準檢驗局的負責人員是遵循著開放推動策略的規定來回覆。
同樣是在推廣政府開放資料,看得出經濟部較衛生福利部有明確的執行準則。
在新政府團隊就任後,關於要求政府「開放資料」的聲音越來越微弱,許多部會朗朗上口的「數位經濟」、「物聯(連)網」,等應用層面的發展都建構在「開放資料」上,不僅是需要開放政府資料,同時也是政府、企業、民眾三個角色之間的資料交換。
先前許多人在討論的「數位國家創新經濟發展方案(簡稱DIGI+)」分為六大主軸,由國發會主導的主軸三「網路社會開放政府」行動計畫裡,便提到了會優化目前開放政府資料的品質、推動資料服務供應鏈、加強公民參與,所以目前在社群平台上可以看到一些由g0v協助進行的政府資料集、資料平台品質盤點,希望民眾能一同參與,同時也為了因應數位治理,所以想要提升政府內部公務人員的資訊處理能力、資訊安全人員的培訊並提升資訊部門位階與跨單位整合的能量。
姑且不論這新台幣1,700億元預算的政策簡報中KPI與規劃的合理性,近日在各個場合中,都談到了「人才」相關的議題,從產業轉型需要跨領域的人才到政府內部公務人員的數位能力素質的提升,都是在相關的議題中。從這次兩個部會在回答內容的完整性、平時在開放資料上的措施與積極程度可以得知,政府內部本身的資訊落差也不小,衛福部食藥署的人員太低估目前民眾對於資訊處理的能力,這樣的回答反而讓民眾懷疑回答問題的人員自己本身的資訊技能程度,如果真的擔心資訊被篡改,那麼應該是直接開放資料介接,讓使用者只能介接讀取資料庫中的資料,而不是提供PDF檔給民眾。
在DIGI+方案中的主軸三是由經濟部主導的數位經濟,由工業局主導「資料經濟」發展,希望能透過公私協力的方式建構第三方資料流通平台,促進資料流通,涵蓋的議題還包含資訊安全。平台上的資料除了政府自己的資料外,也可能來自於企業、民眾自願性提供資料,如果我們自己公部門的人員在這方面的能力不足,又如何鼓勵企業、民眾放心的將資料回饋至所謂的「第三方資料流通平台」?
大家可以再檢視其他部會對於開放政府資料的積極度,透過支援上述社群團隊的自發性專案,這些除了可以協助政府提供品質良好的資料外,也可以減輕公務人員在平日事務上的負擔(他們要處理的事情真的不少),有了品質良好的資料,民眾也能透過資料的利用來監督一般企業,避免再買到黑心商品、危及生活品質的事件發生,減輕生活中的不安程度,提升生活品質。

留言

此網誌的熱門文章

聽死神說故事--偷書賊

書名:偷書賊(THE Book Thief) 作者:Markus Zusak ISBN:9789866973420 作者網站: Markus Zusak 譯者:呂玉嬋 出版:木馬文化 封面取自博客來網路書局。 購買於小小書房。 這個夏天讀《偷書賊》和《失物之書》,會在兩本不同的故事裡看到同一個時空背景所發生的故事,同樣是發生在孩子身上的事,同樣在說文字的力量,但《偷書賊》的節奏比《失物之書》緩慢一些。我盡量不要比較這兩本書,因為這是很無聊的事,但在閱讀的過程裡總驚訝這兩個故事有那麼多巧合之處,不是情節上的相似,而是在人物角色和背景總是有相似或是對立的情況出現。 《偷書賊》的女主角是被德國夫妻領養的莉賽爾,原本也要一同被領養的莉賽爾的弟弟卻死於火車上,莉賽爾在遭受與父母分離及弟弟的死亡後,在精神上受了極大的創傷,幸運的是領養她的父母是故事書中最仁慈的角色,給了莉賽爾完整的愛,不同於此時期裡其他的孩子可能瀕臨餓死或是送入集中營或是在街頭流浪被流彈波及,莉賽爾因為養父母的照顧和周遭的朋友、躲在地下室的猶太人…還有偏愛她的死神。 這個故事的特別處之一,敘述者不是主角或是任何一個書中的角色,而是沒有時空限制,總是旁觀的第三者,特別是在二戰的年代,無所不在的死神,戰場、集中營、巷弄裡,特別的是,這個死神總是想要表現祂冷酷無情和輕蔑人類的一面,但實際上我們從書中讀到的,是祂憐憫人類、輕視、無奈、驚訝人類的個性,也像人類一樣會抱怨工作、具有詩意、幽默感,也就是具有人性的一面: 人類只有在一天的開始與結束時,才會觀察顏色的變化。 但是對我而言,一天當中,每個短暫片刻都呈現出不同的色度與調性。 光是一個小時的時間,就包含了幾千種不同的顏色:蜜蠟黃、柔絲藍、陰鬱黑。 我是做這行的,當然特別注意顏色的變化。 …她貫徹始終,只要經過三十三號的門口,從沒有忘記吐痰,還會外加一句「死豬」。我發現德國人有個特點:他們真的很愛豬。 這個具有人性的死神成了說書者,祂說著在戰時會發生在任何一個角落的故事,然而我們透過祂的眼睛,看到一個帶著色彩、煙硝味濃厚、心驚膽跳與眼淚的故事,祂不儘是旁觀者,同時也是貫穿整個故事的主要角色之一。 整個故事讀起來有對納粹主義的不滿也有對當時情況的無奈。裡面對於創傷後壓力症候群( PTSD )的描寫也很貼切,莉賽爾和猶太人麥克斯分別經歷了不同程度的打擊,也產生了同樣的症狀,

和 AI 工作三個月的感想

在 ChatGPT 在台灣開始流行後,我和它一起工作了大概 3 個月的時間。這段時間裡有許多出現如何監管、治理AI的文章、也有不少教學、像是有不少如何下關鍵字使它協助你工作。這篇文章純粹以一個使用者的立場來分享,這段時間我與 ChatGPT 一起工作的感想,而不是告訴你怎麼治理它或是如何使用它。 這 3 個月裡如何與 AI 一起工作? 因為我的工作知識涉及的領域不止在網路科技,但網路科技卻是我的所有工作範疇的基礎,網路治理是我的入門磚。 在 2 月底 3 月初時,有一份工作內容是聽 12 場研討會的錄影並摘要,原本我們擔心不了解法庭程序、法律用字、各國的法規和習慣不同,但第一個問題是,怎麼有效率的把錄音裡的話語解釋出來?。後來長官提出了一個方法,有沒有可以聽打字幕的工具?把字幕擷取出來,再翻譯成中文,然後再修改?於是我想到 ICANN 會議、IGF 會議所使用的即時字幕工具,但後來又找到了 Web Captioner 。這是許多 YouTuber 會使用的字幕工具。 也許有人會說,這目前市面上有很多錄音筆可以做到這件事了?我要說的是,如果你面對的是不同國家口音、用字習慣、法律用字、法庭程序,錄音筆能否做到同樣的能力?我沒有實際測試過,但 Web Captioner 已經協助減少初期工作的一項負擔,後續的工作完全要依賴這個第一步,不然沒有辦法接下去。 有用過 Google Translate 的人都知道,它最多就是「堪用」而已,你丟什麼給它,它也就回饋你什麼。就是照字面翻譯,沒有上下文的脈絡,當然後續還很多很好用的翻譯工具,但就便利性來說,Google Translate 的便利性還算是高的。 直到 ChatGPT 出現,我從 3 開始用,再到 3.5版,然後付費使用 GPT 4 和一些外掛工具,它開始讓我感受到身為人的限制、受到體力的限制,還有機器學習的快速,更重要的是,它讓我思考如何去問問題。 基本的翻譯工作在 GPT 3 就已經到90%的滿意程度,那個時候我還擔心 Web Captioner 的文字擷取能力會受限於講者的口音,所以我還是會聽著錄音做即時聽打,以使要翻譯的文字檔更完整。一場 90 分鐘的專家討論需要 4 個工作天全力投入才能翻譯、整理完畢,但如果是一個可以講美式或英式英語的講者的專題演講,只要速度不快,大概 1.5 個工作天就能處理完畢。 GPT

讀歐盟「數位服務法」和「數位市場法」草案心得

在 3 月 24 日時參與了 台灣網路講堂 所舉辦的 活動 ,這個活動是以在台灣較知名的美國 Parler 案為題,來討論歐盟的「數位市場法」 (Digital Market Act. 簡稱 DMA ) 對於「守門人」(Gatekeeper) 平台的管制,並邀請了從競爭法、經濟學、公平會、傳播及科技法律不同角度的講者來討論這個議題。 受限於時間,講者們只能把不同角度的重點讓參與者了解,事後再看 DMA 時,才了解並不是只有單純只對守門人做規範,而是從整個歐盟打算將會員國打造成「數位單一市場」(Digital Single Market)的整個脈絡,並從其發展資料經濟 (Data Economic)所發展不同階段的相關政策、指令與法律,而主管 (也是當天活動的引言人) 也提醒,還可以自歐盟在 2018 年 5 月正式執行的「一般資料保護規範」(General Data Protection Regulation,簡稱 GDPR) 觀察,歐盟當局不是只有外表看到的禁止、設限,更重要的,它是希望藉由明確的「法遵」 (Compliance) 要求,建立一個健全、具有發展與競爭機會的數位經濟市場。 這些法遵要求不論是對歐盟會員國境內發展數位服務的廠商、中小企業、不同規模的平台,到跨國企業進入歐盟市場發展,除了要面臨相關的市場調查外,也同樣要遵守。 如果無法看整個歐盟的數位單一市場發展,應該要了解 DMA 其實是「The Digital Services Act package」的法案之一,另一個則是「數位服務法」 (Digital Service Act. 簡稱 DSA ) ,DSA 規範了不同規模的「線上中介產業」 (online intermediary) 該做的事及責任,而 DMA 則是針對法案草案中所規範的守門人更加上了「義務」(Obligation)。由於台灣網路資訊中心已在其部落格中有整理相關的 摘要 ,且台灣網路堂也會公布當天活動的錄影,所以在這篇文章就不再解釋 DSA 和 DMA ,有興趣的人可以自己再去閱讀兩個法案的草案內容,歐盟執委會也有整理許多相關的問答在其網站中,十分好閱讀。 DSA、DMA 與歐盟其他法案的關係 在歐盟執委會網站中有提到,DSA  是一個水平的計劃,重點關注線上中介業者對第三方內容的責任,網路用戶的安全或對信息社會的不同提供者的不對稱