跳至主要內容

語言是進入網際網路的第一把鑰匙

Image by Pete Linforth from Pixabay 

全球化與網際網路發展的影響下,英文成了國際間通用的語言。使用網際網路必須要先透過26個英文字母,或至少得先記住幾個入口網站或搜尋引擎網站的英文位址,再自透過搜尋或入口網站的連結找到自己的目的地。

自圖 1 可以得知在網際網路裡最常被使用的前十大語言:英文的使用人口數為第一,其次是中文 (無特別區分正體中文或簡體中文),第三為西班牙文,除了英文的普及性造成使用人口較多外,中文的使用人口數也不遑多讓。雖然這三種語言為全球使用人數居多的語言,然而在網際網路的內容上,則有不同的呈現。

圖 1 網際網路使用的前10大語言與其使用人口數統計
資料來源:Internet World Stats - Top Ten Languages Used in the Web (2019.04.30)

從 圖 2 可以得知,至2019年9月17日前,網際網路中的內容過半以上都是以英文來呈現,其他語言占比多數都不超過10%,中文僅占1.6%。就比例上而言,中文使用者是網際網路使用人口數的第二多人口,但網路上中文內容的資料僅佔整體的1.6%,更遑論其他更少見的語言內容不到0.1%。
圖 2網際網路內容使用的語言文字
資料來源:W3Techs.com - Percentages of websites using various content languages (2019.09.17)
除了網路的內容多是以英文呈現外,網站位址也是由英文的26個字母 (a到z)、阿拉伯數字 (0到9) 與連字符號 (-) 組成,透過對應 IP 位址,讓一般網路使用者不需要記住 IP 位址就能找到網站,然而非原生語言的網址,對於其他語言的使用者來說,仍有進入障礙。

對於非英語系國家人民來說,因為傳統文化的影響,讓性別因素影響了女性接受教育的權利,或是因為戰亂、經濟等因素,造成女性或是弱勢族群無法接受第二或其他外語的教育,在聯合國17個永續發展目標中的第 4 個目標,便是「確保包容和公平的優質教育,並為所有人提供終身學習機會」,在各國倡導網路教育平台及各大學都藉由網際網路開設課程的趨勢下,如果能降低女性與弱勢族群的進入網際網路的門檻,將會有助於達成該目標的達成,而國際化域名將會提供一定的助力,讓非英語系的族群較容易進入網際網路領域。

網際網路相關組織在國際化域名的努力

ICANN則自2003年開始著手進行國際化域名(Internationalized Domain Names,簡稱IDNs)的相關工作,讓不同語言的使用者都可以透過自己熟悉的語言及文字輸入網址,進入網際網路的世界,取得網路上的資訊。IETF在 2003 年 3 月發布了三則與 IDNs 相關的 RFC,分別為:
  1. RFC 3490 IDNA: Internationalizing Domain Names in Applications
  2. RFC 3491 Nameprep: A Stringprep Profile for Internationalized Domain Names
  3. RFC 3492 Punycode: A Bootstring encoding of Unicode for Internationalized Domain Names in Applications
在2009年之前,我們所知的頂級域名 (Top-Level Domain,簡稱 TLD)僅可使用英文字,但2009年11月之後,便可以藉由IDNs,申請不同語言文字,如中文、阿拉伯文、西里爾文的頂級域名。2010年至2014年之間,則是透過快速通道計畫(Fast-track),在根區域 (Root Zone)讓38個國家和地區頂級域名(Country code top-level domain,簡稱ccTLD)可以使用不同語言的文字,例如:”.台灣”。 直到2018年12月31日止,已有302個ccTLD被放入根區域中。

除了頂級域名外,ICANN也在2013年時進行為根區域(Root Zone)「標籤生成規則」(Label Generation Rules),藉由該機制來協助不同語言文字中,有效的IDN標籤和異體字的存在。

IDNs在全球發展狀況

ICANN 除了利用 Universal Acceptance 計畫來實踐真正的多語言的網路社會理想外,也持續執行推廣IDNs。

圖3 是由 IDN World Report 藉由開放的 gTLD 文件與每個 gTLD IDN 相關的"A記錄"國家與 ccTLD 社群的年度調查表所得到的數字,將 gTLD 與 ccTLD 的 IDN 申請數量合計所得到的數字。該圖顯示了自2013年後至2018年間,申請IDN數目的增長。俄羅斯、南韓、德國、台灣、日本在這段期間都有所增加,也顯示了有其需求存在。
圖 3 World Map Growth of IDNs
資料來源:IDN Report

申請 IDNs 的好處與挑戰

DNS讓每個網路的使用者不需要依賴記 IP 位址,而是可以透過對應可讀性較高的域名,讓每個人容易記得網址,而 IDNs 則是更進一步打算做到透過網路使用者習慣的原生語言,就可以輸入網址、寄送 E-mail,方便讓使用者取用(Access),並降低進入網路的第一道門檻。

就網際網路的商務應用來說,如果是打 算到其他語言國家建造在地化的網站,以協助在當地市場的銷售,也可以在自己國家申請該當地語言的泛用型域名(Second Level)。在台灣除了可以申請中文的泛用型.tw域名外,在 2018 年裡,也陸續開放了泰文、日文、韓文、法文、德文的泛用型.tw 域名服務,也就是網站的擁有者若想針對前述語言使用者提供相關的服務,不妨也將IDN的申請搭配該語言文字的內容,作為增強網站服務的在地化 (localization) 的手段之一,也能加強在該語言使用者心中的印象。

IDNs 的最終目的是希望能協助降低語言門檻,讓各個不同語言的人,不需要藉由學習英文或其他語言,而是以使用者本身習慣的原生語言輸入網址,進入網站。由於 IDNs 的對象屬於熟悉該語言文字的使用者,所以頁面內容也需要使用同一種文字,以達到整體網站的一致性並增加留住使用者在網站上的時間,也較能降低抗拒的心態。

自另一個角度觀察 IDNs 的優點,除了降低進入網路的使用門檻外,同時也可以使該語言的文字在網際網路上流通,維持網路的多樣性,增添對不同文化的包容性。網際網路在討論「包容」(inclusive)時,不是只有談論如何縮短數位落差與經濟成長,同時也包含了對性別、種族、文化、語言的包容,也能該整體網際網路生態體系更為健康。

在全球化(Globalization)的浪潮下,大家可能會由於使用人數偏多的語言,認為單一外語即可。但全球化並不代表英語化,使用 IDNs 還是要回到最原始的目的:「讓對使用該語言的使用者,可以使用自己較習慣的語言來進入、閱聽網站的內容,讓網際網路的文化具多樣性。」

儘管如此,IDNs 的實踐與通用仍有相當高的挑戰,例如瀏覽器、郵件伺服器、行動載具對不同文字在網址上的包容性並不一致,使用者本機所安裝的應用程式、操作系統對於特殊文字的包容性,又例如在漢字的使用上,日本、韓國、中國、台灣⋯⋯等使用漢字的國家也有所謂的異體字或同義字的複雜,且非拉丁語系文字與 DNS 的對應需要依照前述的三個 RFCs 來轉換、處理、對應。有許多消費者末端所使用的應用程式並不支援 IDNs,而電子郵件的往來更是重要,郵件伺服器若無法接受 IDNs,也無法讓訊息通過電子郵件傳遞。例如,當使用者在網站上申請註冊成為網站會員,在填寫電子郵件位址時輸入「中文繁體字@中文.台灣」時,有可能會因為以往的郵件伺服器的 IDNs 通用性不足,而無法傳遞註冊確認信。

在 IDNs 無法在全球完全普及的情況下,反而增加了進入門檻,也只會讓消費者對於 IDNs 的推動與使用完全無感。不愉快的消費經驗只會讓消費者更抗拒使用這樣的服務,也影響了網站擁用者使用 IDNs 的意願。除此之外,消費者可以透過搜尋引擎、社群平台來找尋相關的網頁內容,加上英語教育日漸普及、網際網路的科技也不斷的在改進,可以透過線上同步翻譯來減少閱讀英文或非慣用語言的頁面內容⋯⋯等各種方式來降低非英語慣用國家進入網際網路、取得網路上知識的門檻,這些對於 IDNs 的推動都有一定的挑戰。

結語

儘管網路科技進步與英語教育愈來愈普及,都能降低網路使用者進入網際網路的門檻,使用IDNs 時也要注意網站內容是要與 IDNs 呼應,有可能增加相對應的管理成本,但也不應該因此而停止實踐IDNs與通用性、易取用性的相關作為。反而更應該站在少數族群的立場,降低他們便利的網路使用門檻,更能增加網際網路的多樣性與對不同文化的包容。

參考資料:
  1. Internet World Stats - Top Ten Languages Used in the Web (April 30, 2019) 
  2. W3Techs.com - Percentages of websites using various content languages (Sep. 17, 2019)
  3. United Nations, Sustainable Development Goals Knowledge Platform
  4. ICANN, Internationalized Domain Names
  5. At-Large , Background: IDN
  6. World Map Growth of IDNs, IDN World Report
  7. TWNIC, 國際化域名標準-標準介紹
本文亦刊登於台灣網路資訊中心blog-語言是進入網際網路的第一把鑰匙,版權屬台灣網路資訊中心,若需轉載本文,請先向台灣網路資訊中心洽詢。

    留言

    此網誌的熱門文章

    面對平台隱私變革:使用者的角色轉變與應對之道

    在 X (原 Twitter)這個曾經是自由言論的社群媒體上,因該平台最近改變隱私條款,以致於又興起一股使用者搬到其他社群平台上的浪潮,這是很熟悉的場景,從 Facebook 的言論管制,到 X 目前讓被封鎖的使用者自討沒趣的去看封鎖他的人的訊息。我開始在想,在這一次又一次的搬遷潮裡,我學到什麼。 Google 曾經提供一個名為 Google Reader 的服務,使用者可以自訂資訊來源,將有提供 RSS 服務的網站或 Blog 資訊加入其中。當時,許多網站或 Blog 都提供 RSS 服務,讓使用者能方便更新資訊來源。然而,隨著社群平台的興起,越來越多使用者開始利用社群媒體的演算法來獲取資訊,Google 最終在 2013 年停止 Google Reader 的服務。這使得一些使用者選擇依賴社群平台提供的資訊,而另一些人則轉向其他類似的 RSS 閱讀服務,例如 Feedly。Google 停止 Google Reader 的一個好處是,其他類似的平台得以有機會生存,而不再由 Google 壟斷這類資訊來源的服務。 最近 Google 反對紐西蘭的新聞議價法案 (Fair Digital News Bargaining Bill),這件事的後續影響可能是 Google 會移除資料庫中紐西蘭新聞的來源。此外,Google 和 Meta 也因類似的法案移除過澳大利亞和加拿大的新聞內容。 這代表網路使用者不應該再如以往般依賴搜尋引擎、社群平台取得資訊來源,而是開始建立及掌握自己的資訊來源,對於新聞媒體而言,應該著力於提供品質良好的新聞,讓使用者願意付費訂閱,而不是使整個新聞版面充斥廣告,依賴廣告收入,讓使用者無法取得要閱讀的資訊,也讓廣告服務平台掌控收入來源,而有些新聞網站的版面看起來更像是內容農場一樣。 我使用 Twitter 已超過十年,有很長一段時間迷失於Facebook此類社群平台上的互動,直到我感受到社群平台的公開性,使某些惡意的使用者會追蹤社群平台內容,造成隱私隱憂時,便決定不再使用 Facebook,也改變我使用社群平台的策略,讓不同平台有不同的功能,也因為這樣,服務平台變動使用者服務條款或隱私權條款,對我並沒太大影響。 至於使用者們擔心 X 平台使用使用者內容訓練人工智慧,在講究著作權、智財權的年代,這乎是要發展人工智慧服務的平台會做的事。目前的平台使用者

    各國政府在談資料跨境傳輸時,台灣需要什麼?

    保護個人資料可能是各行各業的一個重要議題,不止增加了企業的資安相關成本也增加了法遵成本。尤其是需要跨國傳輸(個人)資料的企業,除了要配合各國的資料保護法(規範、規則)外,也要擔心資料外洩事件後續的成本,還有許多額外的行政手續。許多國家已經感受到資料流動的重要性,也紛紛的透過數位經濟協議、各種雙邊或多邊協議,來減輕企業跨境傳輸資料時的相關成本,以促進(數位)經濟發展,例如2018年時,美國、墨西哥、加拿大已簽署「美國-墨西哥-加拿大協定」(United States, Mexico, and Canada Agreement),讓這三個國家的企業可以在北美境內自由傳輸資料。 2019年由日本前首安倍晉三在世界經濟論壇和2019年的G20大阪峰會中提出提出「Data Free Flow with Trust」(簡稱DFFT),其核心概念是「基於信任的資料流通」。這樣的概念主要是建立彼此信任的跨境資料傳輸,促進資料自由流動,同時確保對隱私、安全和智慧財產權之信任。 在2019年G20大阪峰會時就已談出了DFFT的發展概念,2021年時已擬定發展的藍圖。當時也討論了所謂的資料在地化、資料主權等議題,並且也有著「資料的連結與使用是可提升生產力的重要因素,限制跨境資料流動,會是國際貿易體系的沉重成本之一,且資料在地化的要求可能會提高企業的生產與法遵成本」之共識。 到了2023年,因當時聯合國網路治理論壇(UN IGF)在日本京都舉辦、及G7日本廣島峰會的緣故,DFFT的概念再次被提出,且被熱烈討論著。G7廣島峰會裡則是建立了夥伴關係機制 (Institutional Arrangement for Partnership,IAP),並由OECD擔任協調的單位,來建立所謂的IAP;日本的JICA(Japan International Cooperation Agency)也在UN IGF 中提出執行 DFFT 之相關倡議。 如果有興趣進一步了解DFFT,可以閱讀: Digital Agency, Data Free Flow with Trust (DFFT) , World Economist Forum, Data Free Flow with Trust (DFFT): Paths towards Free and Trusted Data Flows 網路上的資料很多,

    Niki的異想世界

    展覽名稱:妮基的異想世界(The World and Fantasy of Niki de Saint Phalle) 藝術家:Niki de Saint Phalle wikipedia 、 中文維基百科 塔羅公園網站( The Tarot Garden official website ) 展期:2007/02/09~04/29 地點: 國立歷史博物館 , 展覽頁面 已移除連結。 票價:全票+導覽手冊300元、語音導覽120元 優惠:每天下午三點有免費的中文導覽 圖片取自展覽網頁。 知道這個展覽很久了,一直到昨天,天氣陰雨,自己一個人搭公車去看這個展覽。 從正門進去右手邊是展場的入口,不能帶傘進去,所以傘必須放在門口傘架,這讓我提心吊膽的,畢竟這把傘要是不見了我會被念到臭頭。其實歷史博物館主館的作法我蠻喜歡的,等等再說。 Niki是個才貌雙全的藝術家,導覽手冊的第一頁就是她美麗的照片。展場開始是她的集合藝術系列作品,這系列是個特殊的作品,她收集各種不同的素材,再依照它們的屬性集合創作成不同主題的作品,這一系列有點複雜,彷彿她要表達出一種情緒,但一直到1961年以後的射擊藝術作品才感受出她在作品中所發洩出的憤怒。 第二個展示廳就是她的射擊藝術作品,藝術家在木板上放置物件,很像是她先前的集合作品,同時預藏了放置了顏料的汽球或罐子,再覆上一層白石膏,最後,再向這幅作品開槍射擊。當子彈打中顏料時,迸發的顏料流洩在其他物品上,形成一種詭異的感覺,我所感受到的,是她的憤怒。藉由這樣的創作方式,她創造了一種與觀眾互動的行動藝術-觀眾欣賞美女藝術家對自己的作品開槍射擊-這本來就是一幅賞心悅目的畫面,同時,她也讓觀眾參與創作,在她的第一個射擊作品「我情人的肖像」這幅作品裡,每個人都可以對著那件襯衫投擲飛鏢。在這樣的創作過程裡,她也治癒了自己的憂鬱。 在這兩個展示廳的作品裡看到的都是破碎和憤怒,很多作品裡都會看到支離破碎的娃娃軀體,在導覽手冊裡表示她曾經有一段不愉快的童年回憶,我想,也許「成為母親」這件事可能也讓她有一段對於身份轉換上的不適應。在孩童時期受到創傷的後果通常會很嚴重,這點在心理學上確實有所根據,在孩童時期若是受到性侵犯,在成長過成裡可能會有自卑、自閉、反社會、暴力的傾向,長大後暴力犯罪或是重蹈覆轍成為性犯罪者的可能性也相當高,同時受到性侵犯的孩童在成人後,對性會抱