跳至主要內容

參與 Taiwan Open Data Census心得(1)

TW Open Data Census

首先,我要說這份評比是由許多人合力進行的,而我只就我自己所參與的部份寫下我的心得。
從今年三月至今,看了台灣的各縣市政府的網站,也才了解到平時關注國外網站的時間可能都比瀏覽自己居住地的網站還要多。
在此,我再抄書一下。依照Open Knowledge Foundation對開放資料的定義,開放資料必須具備以下特性:
  1. 能容易取得、可以自由被使用,機器容易讀取,不受著作權法的規範,最多只能註明資料來源及所有人。
  2. 資料允許重覆被使用,也能與其他資料集混合重組後再傳播。
  3. 因為資料可以自由被使用、也允許被使用及散佈,所以不能限定資料的使用範圍。
台灣在今年參與了地方性的開放資料評比,將五都及各縣市政府都列在其中。評比的項目共有15項,分別為:
  1. 即時交通資訊
  2. 年度預決算
  3. 詳細支出(台灣則是觀察是否有提供支付及補助彙整表)
  4. 選舉結果
  5. 空氣品質(空污指數)
  6. 大眾運輸時刻表
  7. 公共設施
  8. 犯罪統計
  9. 採購契約
  10. 食品安全檢驗結果
  11. 交通意外事故記錄
  12. 建築執照許可
  13. 服務意見回饋資料
  14. 營業許可(公司登記資料)
  15. 商工公示資料清冊
台灣地方政府目前有:台北市、新北市、台中市、高雄市、宜蘭縣政府有提供自己的政府資料開放平台,台南市與嘉義市政府則是利用中央的政府資料開放平台提供地方的政府資料使用,多數縣市政府則是以「公開資料的格式」來呈現。在參與評比的過程中有遇到的狀況:
資料查找不易:
依台灣政府資訊公開法第7條的規定,上列的15項項目中,年度預決算、施政計畫、業務統計及研究報告都屬於公開資料。同樣依政府資訊公開法第8條第5項之規定,需要將規定需要公開的資料利用電信網路傳送或其他方式供民眾查找。所以在地方政府網站上所公開的資料,普遍刊載於網站上的公開資料專區中,如台北市政府曾獨立設置一個所謂的公開資料平台,讓瀏覽者直接瀏覽該公開資料網站之資訊。然而有些地方政府可能因為網站版面設計的緣故,將公開資料專區或是放置於不同的功能類別,造成網站瀏覽者在找尋相關資料的困難度。
而犯罪統計的相關資訊只能在內政部的統計資訊網站或是行政院主計處所提供的統計資料網站中查找各地方的犯罪統計數據;而交通意外事故記錄,並無法於縣市政府網站中的公開資料資訊區取得,則需要再連結至縣市政府的警局網站去查找相關的資訊,更可能會因為資料記錄時的行政流程,無法查詢意外事故發生的時間與地點。
關於地方政府所提供的年度預決算及每月的支付補助彙整表則依照行政院主計總處的規定而有一定的格式,一般民眾可能無法自格式中取得足夠的資訊,又或是無法解讀會計報表的意涵。
原始資料取得不易也無法批次下載:
如公共工程採購契約,僅管政府電子採購網上都有提供公開資訊,但需要另外付費下載標案說明書,在結標後卻少見即時更新標案頁面資訊,更無法批次下載相關的資訊。
又如建築執照的查詢,必須透過紙本送件,只能申請人單一申請個案,無法批量的下載資料,又或是無法直接取得資料。

後續:參與 Taiwan Open Data Census心得(2)

留言

此網誌的熱門文章

聽死神說故事--偷書賊

書名:偷書賊(THE Book Thief) 作者:Markus Zusak ISBN:9789866973420 作者網站: Markus Zusak 譯者:呂玉嬋 出版:木馬文化 封面取自博客來網路書局。 購買於小小書房。 這個夏天讀《偷書賊》和《失物之書》,會在兩本不同的故事裡看到同一個時空背景所發生的故事,同樣是發生在孩子身上的事,同樣在說文字的力量,但《偷書賊》的節奏比《失物之書》緩慢一些。我盡量不要比較這兩本書,因為這是很無聊的事,但在閱讀的過程裡總驚訝這兩個故事有那麼多巧合之處,不是情節上的相似,而是在人物角色和背景總是有相似或是對立的情況出現。 《偷書賊》的女主角是被德國夫妻領養的莉賽爾,原本也要一同被領養的莉賽爾的弟弟卻死於火車上,莉賽爾在遭受與父母分離及弟弟的死亡後,在精神上受了極大的創傷,幸運的是領養她的父母是故事書中最仁慈的角色,給了莉賽爾完整的愛,不同於此時期裡其他的孩子可能瀕臨餓死或是送入集中營或是在街頭流浪被流彈波及,莉賽爾因為養父母的照顧和周遭的朋友、躲在地下室的猶太人…還有偏愛她的死神。 這個故事的特別處之一,敘述者不是主角或是任何一個書中的角色,而是沒有時空限制,總是旁觀的第三者,特別是在二戰的年代,無所不在的死神,戰場、集中營、巷弄裡,特別的是,這個死神總是想要表現祂冷酷無情和輕蔑人類的一面,但實際上我們從書中讀到的,是祂憐憫人類、輕視、無奈、驚訝人類的個性,也像人類一樣會抱怨工作、具有詩意、幽默感,也就是具有人性的一面: 人類只有在一天的開始與結束時,才會觀察顏色的變化。 但是對我而言,一天當中,每個短暫片刻都呈現出不同的色度與調性。 光是一個小時的時間,就包含了幾千種不同的顏色:蜜蠟黃、柔絲藍、陰鬱黑。 我是做這行的,當然特別注意顏色的變化。 …她貫徹始終,只要經過三十三號的門口,從沒有忘記吐痰,還會外加一句「死豬」。我發現德國人有個特點:他們真的很愛豬。 這個具有人性的死神成了說書者,祂說著在戰時會發生在任何一個角落的故事,然而我們透過祂的眼睛,看到一個帶著色彩、煙硝味濃厚、心驚膽跳與眼淚的故事,祂不儘是旁觀者,同時也是貫穿整個故事的主要角色之一。 整個故事讀起來有對納粹主義的不滿也有對當時情況的無奈。裡面對於創傷後壓力症候群( PTSD )的描寫也很貼切,莉賽爾和猶太人麥克斯分別經歷了不同程度的打擊,也產生了同樣的症狀,

和 AI 工作三個月的感想

在 ChatGPT 在台灣開始流行後,我和它一起工作了大概 3 個月的時間。這段時間裡有許多出現如何監管、治理AI的文章、也有不少教學、像是有不少如何下關鍵字使它協助你工作。這篇文章純粹以一個使用者的立場來分享,這段時間我與 ChatGPT 一起工作的感想,而不是告訴你怎麼治理它或是如何使用它。 這 3 個月裡如何與 AI 一起工作? 因為我的工作知識涉及的領域不止在網路科技,但網路科技卻是我的所有工作範疇的基礎,網路治理是我的入門磚。 在 2 月底 3 月初時,有一份工作內容是聽 12 場研討會的錄影並摘要,原本我們擔心不了解法庭程序、法律用字、各國的法規和習慣不同,但第一個問題是,怎麼有效率的把錄音裡的話語解釋出來?。後來長官提出了一個方法,有沒有可以聽打字幕的工具?把字幕擷取出來,再翻譯成中文,然後再修改?於是我想到 ICANN 會議、IGF 會議所使用的即時字幕工具,但後來又找到了 Web Captioner 。這是許多 YouTuber 會使用的字幕工具。 也許有人會說,這目前市面上有很多錄音筆可以做到這件事了?我要說的是,如果你面對的是不同國家口音、用字習慣、法律用字、法庭程序,錄音筆能否做到同樣的能力?我沒有實際測試過,但 Web Captioner 已經協助減少初期工作的一項負擔,後續的工作完全要依賴這個第一步,不然沒有辦法接下去。 有用過 Google Translate 的人都知道,它最多就是「堪用」而已,你丟什麼給它,它也就回饋你什麼。就是照字面翻譯,沒有上下文的脈絡,當然後續還很多很好用的翻譯工具,但就便利性來說,Google Translate 的便利性還算是高的。 直到 ChatGPT 出現,我從 3 開始用,再到 3.5版,然後付費使用 GPT 4 和一些外掛工具,它開始讓我感受到身為人的限制、受到體力的限制,還有機器學習的快速,更重要的是,它讓我思考如何去問問題。 基本的翻譯工作在 GPT 3 就已經到90%的滿意程度,那個時候我還擔心 Web Captioner 的文字擷取能力會受限於講者的口音,所以我還是會聽著錄音做即時聽打,以使要翻譯的文字檔更完整。一場 90 分鐘的專家討論需要 4 個工作天全力投入才能翻譯、整理完畢,但如果是一個可以講美式或英式英語的講者的專題演講,只要速度不快,大概 1.5 個工作天就能處理完畢。 GPT

讀歐盟「數位服務法」和「數位市場法」草案心得

在 3 月 24 日時參與了 台灣網路講堂 所舉辦的 活動 ,這個活動是以在台灣較知名的美國 Parler 案為題,來討論歐盟的「數位市場法」 (Digital Market Act. 簡稱 DMA ) 對於「守門人」(Gatekeeper) 平台的管制,並邀請了從競爭法、經濟學、公平會、傳播及科技法律不同角度的講者來討論這個議題。 受限於時間,講者們只能把不同角度的重點讓參與者了解,事後再看 DMA 時,才了解並不是只有單純只對守門人做規範,而是從整個歐盟打算將會員國打造成「數位單一市場」(Digital Single Market)的整個脈絡,並從其發展資料經濟 (Data Economic)所發展不同階段的相關政策、指令與法律,而主管 (也是當天活動的引言人) 也提醒,還可以自歐盟在 2018 年 5 月正式執行的「一般資料保護規範」(General Data Protection Regulation,簡稱 GDPR) 觀察,歐盟當局不是只有外表看到的禁止、設限,更重要的,它是希望藉由明確的「法遵」 (Compliance) 要求,建立一個健全、具有發展與競爭機會的數位經濟市場。 這些法遵要求不論是對歐盟會員國境內發展數位服務的廠商、中小企業、不同規模的平台,到跨國企業進入歐盟市場發展,除了要面臨相關的市場調查外,也同樣要遵守。 如果無法看整個歐盟的數位單一市場發展,應該要了解 DMA 其實是「The Digital Services Act package」的法案之一,另一個則是「數位服務法」 (Digital Service Act. 簡稱 DSA ) ,DSA 規範了不同規模的「線上中介產業」 (online intermediary) 該做的事及責任,而 DMA 則是針對法案草案中所規範的守門人更加上了「義務」(Obligation)。由於台灣網路資訊中心已在其部落格中有整理相關的 摘要 ,且台灣網路堂也會公布當天活動的錄影,所以在這篇文章就不再解釋 DSA 和 DMA ,有興趣的人可以自己再去閱讀兩個法案的草案內容,歐盟執委會也有整理許多相關的問答在其網站中,十分好閱讀。 DSA、DMA 與歐盟其他法案的關係 在歐盟執委會網站中有提到,DSA  是一個水平的計劃,重點關注線上中介業者對第三方內容的責任,網路用戶的安全或對信息社會的不同提供者的不對稱