跳至主要內容

參與 Taiwan Open Data Census心得(2)

*
讀這篇之前請先讀:About Open Data Census Taiwan(初期心得)、參與 Taiwan Open Data Census心得(1)

資料的所有者不是地方政府機關:
在評批的過程中,採購契約、選舉投票資料、商工公示資料清冊、空氣品質資料、公司登記資料,在地方政府的網站上僅提供連結到政府電子採購網、中選會、經濟部商業司、環保署的監測資訊站,有些地區因為未設置空氣監測站而無法提供數據。
即時路況資訊部份地方政府會直接連結到交通部運輸研究所(以下簡稱運研所)或國道高速公路局單位所建置的即時交通資訊網站,有些地方政府會運用運研所之資料,建立一個即時交通資訊網站,但也無法提供使用者下載使用這些資料。
就大眾運輸時刻表,由於當地的交通規劃,可能是由當地運輸業者提供時刻表供人下載參考。
資料格式不易編修、也不易被機器讀取:
依照「政府網站版型與內容管理規範」中第5項第6條中對政府入口網站及主題網站中檔案下載格式之規定,需要提供一種可編輯(如:純文字檔或其他商業文書檔案)或具開放性(如PDF、.odt、HTML)的檔案格式。在政府開放資料平臺中的資料多屬於開放格式的資料,如.csv、XML、.json等機器可以直接讀取的資料,然而不被刊載於開放資料平台中的資料,在其他的政府網站則多會提供PDF或是Word、Excel、PowerPoint、HTML、格式的檔案,並進行加密,讓使用者下載後也無法取得檔案內的資料進行資料分析或運用,這樣的情況不止出現在縣市政府網站,中央機關部會的網站也有同樣的情況。
如前述的交通事故資料而言,有些地方政府的警察局會提供已處理過的分析資料,提醒用路人哪些路口易發生事故,但若是要讓民眾運用資料進行分析或是設計學童的安全上學路線(如:加拿大的School Zone)是無法自由運用的。
就網站評比機制上,相較於其他各國原有較成熟的評審制度,而台灣今年則第一次將地方政府網站加入評比,同時評比的人選也是開放於網路上自由加入,所以可見到以下的情況:
評比者的來源:
目前的評比者的來源主要以自動參與為主,並未設置任何的要求或規範。
無一致的評分標準:
由於部份地方政府已成立資料開放平台或是利用現有的政府資料開放平台提供資料,但有些政府則是以公開資料的方式呈現,在評比時可能也無法公平評分。
由於前述部份資料的擁有者並非當地縣市政府,造成對評比標的網站之標準無法一致。
同時,因為評比者並未先對評分標準有一致的共識,在給予分數的標準也不一致,同一評比人員可能會因為不同時間的加入或評比資料而給予不同分數。
評比者本身對台灣地方政府網站的熟悉度不同
由於評比者對台灣政府網站資料的熟悉度不同,不了解資料可能會散落於哪些地方政府部門,造成可能會誤判該資料不存在的情況出現。
國情及語言的障礙
目前的評比網站介面還是以英文為主,而設計的項目也是以其他國家的架構來擬定,所以相較於台灣,會有國情不同,調查的項目不同,但提供的資料在台灣可能都是同一部會所提供,或是原本就不存有該份資料,而文字上的不同也容易造成進入障礙,有些使用者可能清楚中文資料放在哪個網站的位置,但因為評比項目為英文,卻因為語言進入障礙而在評比上增加阻力。
填寫後不易修改
因為程式設計及為求公平性,若需要更改前次的錯誤,則需要重新再進行一次評分,還需要透過另一位檢視人員審視過後才能進行更正,若是參與的人少,無法即時修改,也同樣造成評分修改上的阻礙。

結語:
由於部份的地方政府對於「資料開放」的觀念仍保留在「公開資料」的階段,所提供的檔案都不具有前面提到的開放資料的特點,而資料的著作權仍然屬於各地方政府部門,使用者若要使用資料仍然無法自由取用,也不易找尋。不需要急著建立自己的政府資料開放平台,因為國家發展委員會所提供的政府資料開放平台並不是只給中央部會機關使用,目前線上可見到台南市政府與嘉義市政府都有使用這個平台。
就台灣本地的評比者、評比平台來說,可能需要評比者們對於評分制度有一個共識、有共同的評比標準,了解各評比項目的內容是什麼及在各地方政府部門的資料位置所在,以著重其內容、架構、資料品質進行評比,才能達到公平也客觀,較能提供有效的建議,讓公部門與民眾之間能平行的交流與互動。

留言

此網誌的熱門文章

聽死神說故事--偷書賊

書名:偷書賊(THE Book Thief) 作者:Markus Zusak ISBN:9789866973420 作者網站: Markus Zusak 譯者:呂玉嬋 出版:木馬文化 封面取自博客來網路書局。 購買於小小書房。 這個夏天讀《偷書賊》和《失物之書》,會在兩本不同的故事裡看到同一個時空背景所發生的故事,同樣是發生在孩子身上的事,同樣在說文字的力量,但《偷書賊》的節奏比《失物之書》緩慢一些。我盡量不要比較這兩本書,因為這是很無聊的事,但在閱讀的過程裡總驚訝這兩個故事有那麼多巧合之處,不是情節上的相似,而是在人物角色和背景總是有相似或是對立的情況出現。 《偷書賊》的女主角是被德國夫妻領養的莉賽爾,原本也要一同被領養的莉賽爾的弟弟卻死於火車上,莉賽爾在遭受與父母分離及弟弟的死亡後,在精神上受了極大的創傷,幸運的是領養她的父母是故事書中最仁慈的角色,給了莉賽爾完整的愛,不同於此時期裡其他的孩子可能瀕臨餓死或是送入集中營或是在街頭流浪被流彈波及,莉賽爾因為養父母的照顧和周遭的朋友、躲在地下室的猶太人…還有偏愛她的死神。 這個故事的特別處之一,敘述者不是主角或是任何一個書中的角色,而是沒有時空限制,總是旁觀的第三者,特別是在二戰的年代,無所不在的死神,戰場、集中營、巷弄裡,特別的是,這個死神總是想要表現祂冷酷無情和輕蔑人類的一面,但實際上我們從書中讀到的,是祂憐憫人類、輕視、無奈、驚訝人類的個性,也像人類一樣會抱怨工作、具有詩意、幽默感,也就是具有人性的一面: 人類只有在一天的開始與結束時,才會觀察顏色的變化。 但是對我而言,一天當中,每個短暫片刻都呈現出不同的色度與調性。 光是一個小時的時間,就包含了幾千種不同的顏色:蜜蠟黃、柔絲藍、陰鬱黑。 我是做這行的,當然特別注意顏色的變化。 …她貫徹始終,只要經過三十三號的門口,從沒有忘記吐痰,還會外加一句「死豬」。我發現德國人有個特點:他們真的很愛豬。 這個具有人性的死神成了說書者,祂說著在戰時會發生在任何一個角落的故事,然而我們透過祂的眼睛,看到一個帶著色彩、煙硝味濃厚、心驚膽跳與眼淚的故事,祂不儘是旁觀者,同時也是貫穿整個故事的主要角色之一。 整個故事讀起來有對納粹主義的不滿也有對當時情況的無奈。裡面對於創傷後壓力症候群( PTSD )的描寫也很貼切,莉賽爾和猶太人麥克斯分別經歷了不同程度的打擊,也產生了同樣的症狀,

和 AI 工作三個月的感想

在 ChatGPT 在台灣開始流行後,我和它一起工作了大概 3 個月的時間。這段時間裡有許多出現如何監管、治理AI的文章、也有不少教學、像是有不少如何下關鍵字使它協助你工作。這篇文章純粹以一個使用者的立場來分享,這段時間我與 ChatGPT 一起工作的感想,而不是告訴你怎麼治理它或是如何使用它。 這 3 個月裡如何與 AI 一起工作? 因為我的工作知識涉及的領域不止在網路科技,但網路科技卻是我的所有工作範疇的基礎,網路治理是我的入門磚。 在 2 月底 3 月初時,有一份工作內容是聽 12 場研討會的錄影並摘要,原本我們擔心不了解法庭程序、法律用字、各國的法規和習慣不同,但第一個問題是,怎麼有效率的把錄音裡的話語解釋出來?。後來長官提出了一個方法,有沒有可以聽打字幕的工具?把字幕擷取出來,再翻譯成中文,然後再修改?於是我想到 ICANN 會議、IGF 會議所使用的即時字幕工具,但後來又找到了 Web Captioner 。這是許多 YouTuber 會使用的字幕工具。 也許有人會說,這目前市面上有很多錄音筆可以做到這件事了?我要說的是,如果你面對的是不同國家口音、用字習慣、法律用字、法庭程序,錄音筆能否做到同樣的能力?我沒有實際測試過,但 Web Captioner 已經協助減少初期工作的一項負擔,後續的工作完全要依賴這個第一步,不然沒有辦法接下去。 有用過 Google Translate 的人都知道,它最多就是「堪用」而已,你丟什麼給它,它也就回饋你什麼。就是照字面翻譯,沒有上下文的脈絡,當然後續還很多很好用的翻譯工具,但就便利性來說,Google Translate 的便利性還算是高的。 直到 ChatGPT 出現,我從 3 開始用,再到 3.5版,然後付費使用 GPT 4 和一些外掛工具,它開始讓我感受到身為人的限制、受到體力的限制,還有機器學習的快速,更重要的是,它讓我思考如何去問問題。 基本的翻譯工作在 GPT 3 就已經到90%的滿意程度,那個時候我還擔心 Web Captioner 的文字擷取能力會受限於講者的口音,所以我還是會聽著錄音做即時聽打,以使要翻譯的文字檔更完整。一場 90 分鐘的專家討論需要 4 個工作天全力投入才能翻譯、整理完畢,但如果是一個可以講美式或英式英語的講者的專題演講,只要速度不快,大概 1.5 個工作天就能處理完畢。 GPT

讀歐盟「數位服務法」和「數位市場法」草案心得

在 3 月 24 日時參與了 台灣網路講堂 所舉辦的 活動 ,這個活動是以在台灣較知名的美國 Parler 案為題,來討論歐盟的「數位市場法」 (Digital Market Act. 簡稱 DMA ) 對於「守門人」(Gatekeeper) 平台的管制,並邀請了從競爭法、經濟學、公平會、傳播及科技法律不同角度的講者來討論這個議題。 受限於時間,講者們只能把不同角度的重點讓參與者了解,事後再看 DMA 時,才了解並不是只有單純只對守門人做規範,而是從整個歐盟打算將會員國打造成「數位單一市場」(Digital Single Market)的整個脈絡,並從其發展資料經濟 (Data Economic)所發展不同階段的相關政策、指令與法律,而主管 (也是當天活動的引言人) 也提醒,還可以自歐盟在 2018 年 5 月正式執行的「一般資料保護規範」(General Data Protection Regulation,簡稱 GDPR) 觀察,歐盟當局不是只有外表看到的禁止、設限,更重要的,它是希望藉由明確的「法遵」 (Compliance) 要求,建立一個健全、具有發展與競爭機會的數位經濟市場。 這些法遵要求不論是對歐盟會員國境內發展數位服務的廠商、中小企業、不同規模的平台,到跨國企業進入歐盟市場發展,除了要面臨相關的市場調查外,也同樣要遵守。 如果無法看整個歐盟的數位單一市場發展,應該要了解 DMA 其實是「The Digital Services Act package」的法案之一,另一個則是「數位服務法」 (Digital Service Act. 簡稱 DSA ) ,DSA 規範了不同規模的「線上中介產業」 (online intermediary) 該做的事及責任,而 DMA 則是針對法案草案中所規範的守門人更加上了「義務」(Obligation)。由於台灣網路資訊中心已在其部落格中有整理相關的 摘要 ,且台灣網路堂也會公布當天活動的錄影,所以在這篇文章就不再解釋 DSA 和 DMA ,有興趣的人可以自己再去閱讀兩個法案的草案內容,歐盟執委會也有整理許多相關的問答在其網站中,十分好閱讀。 DSA、DMA 與歐盟其他法案的關係 在歐盟執委會網站中有提到,DSA  是一個水平的計劃,重點關注線上中介業者對第三方內容的責任,網路用戶的安全或對信息社會的不同提供者的不對稱