跳到主要內容

語言是進入網際網路的第一把鑰匙

Image by Pete Linforth from Pixabay 

全球化與網際網路發展的影響下,英文成了國際間通用的語言。使用網際網路必須要先透過26個英文字母,或至少得先記住幾個入口網站或搜尋引擎網站的英文位址,再自透過搜尋或入口網站的連結找到自己的目的地。

自圖 1 可以得知在網際網路裡最常被使用的前十大語言:英文的使用人口數為第一,其次是中文 (無特別區分正體中文或簡體中文),第三為西班牙文,除了英文的普及性造成使用人口較多外,中文的使用人口數也不遑多讓。雖然這三種語言為全球使用人數居多的語言,然而在網際網路的內容上,則有不同的呈現。

圖 1 網際網路使用的前10大語言與其使用人口數統計
資料來源:Internet World Stats - Top Ten Languages Used in the Web (2019.04.30)

從 圖 2 可以得知,至2019年9月17日前,網際網路中的內容過半以上都是以英文來呈現,其他語言占比多數都不超過10%,中文僅占1.6%。就比例上而言,中文使用者是網際網路使用人口數的第二多人口,但網路上中文內容的資料僅佔整體的1.6%,更遑論其他更少見的語言內容不到0.1%。
圖 2網際網路內容使用的語言文字
資料來源:W3Techs.com - Percentages of websites using various content languages (2019.09.17)
除了網路的內容多是以英文呈現外,網站位址也是由英文的26個字母 (a到z)、阿拉伯數字 (0到9) 與連字符號 (-) 組成,透過對應 IP 位址,讓一般網路使用者不需要記住 IP 位址就能找到網站,然而非原生語言的網址,對於其他語言的使用者來說,仍有進入障礙。

對於非英語系國家人民來說,因為傳統文化的影響,讓性別因素影響了女性接受教育的權利,或是因為戰亂、經濟等因素,造成女性或是弱勢族群無法接受第二或其他外語的教育,在聯合國17個永續發展目標中的第 4 個目標,便是「確保包容和公平的優質教育,並為所有人提供終身學習機會」,在各國倡導網路教育平台及各大學都藉由網際網路開設課程的趨勢下,如果能降低女性與弱勢族群的進入網際網路的門檻,將會有助於達成該目標的達成,而國際化域名將會提供一定的助力,讓非英語系的族群較容易進入網際網路領域。

網際網路相關組織在國際化域名的努力

ICANN則自2003年開始著手進行國際化域名(Internationalized Domain Names,簡稱IDNs)的相關工作,讓不同語言的使用者都可以透過自己熟悉的語言及文字輸入網址,進入網際網路的世界,取得網路上的資訊。IETF在 2003 年 3 月發布了三則與 IDNs 相關的 RFC,分別為:
  1. RFC 3490 IDNA: Internationalizing Domain Names in Applications
  2. RFC 3491 Nameprep: A Stringprep Profile for Internationalized Domain Names
  3. RFC 3492 Punycode: A Bootstring encoding of Unicode for Internationalized Domain Names in Applications
在2009年之前,我們所知的頂級域名 (Top-Level Domain,簡稱 TLD)僅可使用英文字,但2009年11月之後,便可以藉由IDNs,申請不同語言文字,如中文、阿拉伯文、西里爾文的頂級域名。2010年至2014年之間,則是透過快速通道計畫(Fast-track),在根區域 (Root Zone)讓38個國家和地區頂級域名(Country code top-level domain,簡稱ccTLD)可以使用不同語言的文字,例如:”.台灣”。 直到2018年12月31日止,已有302個ccTLD被放入根區域中。

除了頂級域名外,ICANN也在2013年時進行為根區域(Root Zone)「標籤生成規則」(Label Generation Rules),藉由該機制來協助不同語言文字中,有效的IDN標籤和異體字的存在。

IDNs在全球發展狀況

ICANN 除了利用 Universal Acceptance 計畫來實踐真正的多語言的網路社會理想外,也持續執行推廣IDNs。

圖3 是由 IDN World Report 藉由開放的 gTLD 文件與每個 gTLD IDN 相關的"A記錄"國家與 ccTLD 社群的年度調查表所得到的數字,將 gTLD 與 ccTLD 的 IDN 申請數量合計所得到的數字。該圖顯示了自2013年後至2018年間,申請IDN數目的增長。俄羅斯、南韓、德國、台灣、日本在這段期間都有所增加,也顯示了有其需求存在。
圖 3 World Map Growth of IDNs
資料來源:IDN Report

申請 IDNs 的好處與挑戰

DNS讓每個網路的使用者不需要依賴記 IP 位址,而是可以透過對應可讀性較高的域名,讓每個人容易記得網址,而 IDNs 則是更進一步打算做到透過網路使用者習慣的原生語言,就可以輸入網址、寄送 E-mail,方便讓使用者取用(Access),並降低進入網路的第一道門檻。

就網際網路的商務應用來說,如果是打 算到其他語言國家建造在地化的網站,以協助在當地市場的銷售,也可以在自己國家申請該當地語言的泛用型域名(Second Level)。在台灣除了可以申請中文的泛用型.tw域名外,在 2018 年裡,也陸續開放了泰文、日文、韓文、法文、德文的泛用型.tw 域名服務,也就是網站的擁有者若想針對前述語言使用者提供相關的服務,不妨也將IDN的申請搭配該語言文字的內容,作為增強網站服務的在地化 (localization) 的手段之一,也能加強在該語言使用者心中的印象。

IDNs 的最終目的是希望能協助降低語言門檻,讓各個不同語言的人,不需要藉由學習英文或其他語言,而是以使用者本身習慣的原生語言輸入網址,進入網站。由於 IDNs 的對象屬於熟悉該語言文字的使用者,所以頁面內容也需要使用同一種文字,以達到整體網站的一致性並增加留住使用者在網站上的時間,也較能降低抗拒的心態。

自另一個角度觀察 IDNs 的優點,除了降低進入網路的使用門檻外,同時也可以使該語言的文字在網際網路上流通,維持網路的多樣性,增添對不同文化的包容性。網際網路在討論「包容」(inclusive)時,不是只有談論如何縮短數位落差與經濟成長,同時也包含了對性別、種族、文化、語言的包容,也能該整體網際網路生態體系更為健康。

在全球化(Globalization)的浪潮下,大家可能會由於使用人數偏多的語言,認為單一外語即可。但全球化並不代表英語化,使用 IDNs 還是要回到最原始的目的:「讓對使用該語言的使用者,可以使用自己較習慣的語言來進入、閱聽網站的內容,讓網際網路的文化具多樣性。」

儘管如此,IDNs 的實踐與通用仍有相當高的挑戰,例如瀏覽器、郵件伺服器、行動載具對不同文字在網址上的包容性並不一致,使用者本機所安裝的應用程式、操作系統對於特殊文字的包容性,又例如在漢字的使用上,日本、韓國、中國、台灣⋯⋯等使用漢字的國家也有所謂的異體字或同義字的複雜,且非拉丁語系文字與 DNS 的對應需要依照前述的三個 RFCs 來轉換、處理、對應。有許多消費者末端所使用的應用程式並不支援 IDNs,而電子郵件的往來更是重要,郵件伺服器若無法接受 IDNs,也無法讓訊息通過電子郵件傳遞。例如,當使用者在網站上申請註冊成為網站會員,在填寫電子郵件位址時輸入「中文繁體字@中文.台灣」時,有可能會因為以往的郵件伺服器的 IDNs 通用性不足,而無法傳遞註冊確認信。

在 IDNs 無法在全球完全普及的情況下,反而增加了進入門檻,也只會讓消費者對於 IDNs 的推動與使用完全無感。不愉快的消費經驗只會讓消費者更抗拒使用這樣的服務,也影響了網站擁用者使用 IDNs 的意願。除此之外,消費者可以透過搜尋引擎、社群平台來找尋相關的網頁內容,加上英語教育日漸普及、網際網路的科技也不斷的在改進,可以透過線上同步翻譯來減少閱讀英文或非慣用語言的頁面內容⋯⋯等各種方式來降低非英語慣用國家進入網際網路、取得網路上知識的門檻,這些對於 IDNs 的推動都有一定的挑戰。

結語

儘管網路科技進步與英語教育愈來愈普及,都能降低網路使用者進入網際網路的門檻,使用IDNs 時也要注意網站內容是要與 IDNs 呼應,有可能增加相對應的管理成本,但也不應該因此而停止實踐IDNs與通用性、易取用性的相關作為。反而更應該站在少數族群的立場,降低他們便利的網路使用門檻,更能增加網際網路的多樣性與對不同文化的包容。

參考資料:
  1. Internet World Stats - Top Ten Languages Used in the Web (April 30, 2019) 
  2. W3Techs.com - Percentages of websites using various content languages (Sep. 17, 2019)
  3. United Nations, Sustainable Development Goals Knowledge Platform
  4. ICANN, Internationalized Domain Names
  5. At-Large , Background: IDN
  6. World Map Growth of IDNs, IDN World Report
  7. TWNIC, 國際化域名標準-標準介紹
本文亦刊登於台灣網路資訊中心blog-語言是進入網際網路的第一把鑰匙,版權屬台灣網路資訊中心,若需轉載本文,請先向台灣網路資訊中心洽詢。

    留言

    這個網誌中的熱門文章

    [Movie] Longford--是使命而非成就

    電影名稱:迷情(Longford)文中台詞出處及電影資訊:IMDb--LongfordWikipedia--Myra Hindly:Myra Hindley米拉·韓德麗朗福德伯爵的真實身份:Frank Pakenham圖片來源:Amazon:Longford這部電影在星期六下午播了一次,星期日的颱風夜又播了一次。中文片名被翻為《迷情》,大概是譯者或片商覺得片中的朗福德伯爵(Lord Longford)對獄中的Myra Hindley有份特殊的感情,所以把中文片名取得這麼煽情吧!然而這部電影叫Longford,所以重點不是放在到底Myra Hindley是不是謀殺孩童的主要兇手,也不是伯爵對Myra是否有特殊的情感,而是,在經過這些考驗後,伯爵對於自己信仰及寬恕的信念是否依然堅定。從影片中可以知道伯爵曾經是個德高望重的上議院成員,平時會去探望監獄中的囚犯,輔導他們並幫助他們重回人生的正途,甚至不惜幫他們大肆舉行慶祝會。這樣的行為看在其他人的眼中自然不是滋味,好事的記者甚至在報紙上刊出標題抨擊他為犯人的付出。Myra Hindley和她的男友Ian Brady因為犯下令人髮指的謀殺孩童案件被判終身監禁,伯爵在見過Myra後,決定幫她爭取申請假釋的機會,中間也因為年事已高及自己特立獨行的行事作風在政治鬥爭中喪失了升為議長的機會,甚至被強迫退休,在他曾經見過Ian Brady,懷疑Myra在獄中的良好表現是否只是作戲,甚至為了Myra,毀了女兒的新書發表會,與妻女不諒解的連續挫折下,他還是支持著Myra,堅守著人性本善的信念,直到Myra說出其他兩個孩童的命案,這對努力為她奔走的伯爵和後來轉為支持為Myra申請假釋的妻子Elizabeth而言是最大的背叛,也是對信念最大的考驗。伯爵本身是個由新教改宗的天主教徒,從劇情裡也知道他曾經精神崩潰過,靠著妻子與信仰的支持,他重新了自己的人生,但當他知道自己所有的努力都只是被Myra所利用,再回顧自己為了這件案子所損失的一切,最大的不值則是當他發現自己對Myra的信任只是被利用時,他再度面臨了對人性與信仰的考驗。他的名聲被毀了,讓人以為他對於Myra有著遐想,他幫助虐殺兒童的兇手是個令人無法接受的事實。他無助的在告解室裡告解,也許他也想起了Myra曾對他說,她已重返天主教的懷抱,也向神父告解,她讀了《懺悔錄》,感受到她心中的兩個聲…

    參與網路治理線上課程的經驗與感想

    「網路治理」四個字在台灣,對多數網路使用者來說,是很陌生的詞。從2016年中旬開始參與相關的會議活動,到現在2020年,四年的時間在這個領域裡,但處於台灣的我,一直覺得缺少了某些重要的資訊,每年開完台灣網路治理論壇,我最常問自己的問題是:「這就是網路治理嗎?」我相信每年的議題都具有當年度的代表意義,也極具有當年的代表性,只是對我自己來說,就像是拼圖裡少了幾片什麼,在台灣似乎不會在這個場合裡談到、政府或其他利害關係人也不希望再增加議題的更多或直接的利害關係人,就像是看到公開在網路上的法律案件,有一大段被抹除,身處於其中,只能霧裡看花,愈走愈偏頗。也曾經向一些朋友請教自己該補足的知識,但我的目標也不是成為工程師,許多很棒的建議,也無法解決我的問題。台灣有很多很棒的線上教育平台,也有很多傑出的講師,相信與參與的學生們也都有很好的互動。但目前台灣的網路治理裡,有很多經驗豐富的前輩、專業人員、學者,可以從不同面向切入各個議題,但還沒有完整的線上課程內容,如果只聽一位或兩、三位講者來講,加上缺少國際與會的機會,可能會和我面臨同樣的疑惑。全球網路治理其實有著共同面臨的問題:「語言」,就算是聯合國有六種官方語言,但在舉辦各種會議時、網路治理論壇時,還是以英文為主要的溝通語言。以2017年線上參與的實際經驗,聯合國的官方中文口譯是會打馬虎的,當他翻譯來不及時,就會以「這個、那個」來呼攏線上的中文聽眾。亞洲國家有不少國家、經濟體系是以英文為官方語言,但有些專業人員還是習慣以自己的母語、常使用的語言來表達意思,於是也會面臨英文說得流利的參與者不見得可以說出正確的技術知識;而具有專業知識的技術人員,不見得可以準確的用英文表達出自己的意見。因為平時交流還是以普通話為主,所以我也在2018年的 APrIGF 會議上吃過一次語言的虧,所以我也想藉著參與國外的課程來增加英文的能力。當然,每個專業組織都致力於將知識用當地的語言表達出來,希望能讓更多人參與,所以一直努力的鼓勵參與者用自己的語言寫作,這我會在稍後提到今年所參與的Internet Society課程裡再細談。ICANN、APNIC、Internet Society 都有提供免費且十分專業的線上課程,今年還有 Virtual School of Internet Governance 也加入了網路治理的線上課程教學,如果要參與國際網路組織…

    [電影筆記]愛情之必要-編織戀愛夢

    導演:Jocelyn Moorhouse配樂:Thomas Newman演員:Winona Ryder、Anne Bancrot、Ellen Burstyn、Kate Nelligan、Alfre Woodard原著:How to make an American Quilt作者:Whitney Otto曾經在HBO看過這部電影兩三次,印象裡沒有全部看完,但對幾幕有非常深刻的印象。基本上它並不符合目前市場上的胃口,對現在的年輕人而言可謂老套,但配樂很不錯,裡面有一些感情橋段卻是在現實世界裡常常看到。在 這部電影裡談到幾段不同的愛:母女、姐妹、夫妻、友情、愛情,除了兩性關係外,還有親子關係。記得小的時候,身邊就有幾個單親家庭的同學,由於來自單親家庭,他們無法肯定自己,也許在待人接物上給人感覺特別的孤傲,但其實他們的心裡缺乏自信,他們的心裡常會像電影中的Finn,在小時候會懷疑父母的分離是 不是因為自己的關係,直到他們成長後,可能因為單方面父親或母親的言行而無法對婚姻或是感情擁有信心,甚至會像Finn一樣的採取逃避的態度。Finn 在夏天時藉著寫論文為由,來到姨婆家並考慮是否要與未婚夫Sam共同經營兩人世界,但她就和所有的女人一樣,對於婚姻生活無法肯定,也由於因為父母離異, 較常與母親接觸的她很難想像一段感情能長遠的維持下去,甚至有著現代女性的獨立自主觀念,就算結婚了,也想要在婚後保有自己的私人空間。從電影裡看起來,會進行拼布這項手工藝的年代應該是很久很久以前的年代,從我閱讀的小說裡有提到街坊鄰居們一起做拼布棉被的年代,女人還沒有投票權。現在應該很少會有人進行集體做拼布棉被了吧?當我看到一群女人在進行這項工藝時想起蒙哥瑪利寫的「清秀佳人」系列的小說。這其實是三個世代女人的故事,Quilt的成員是屬於兩個世代的女人,對於愛情,她們勇敢的去追求,即使她們的丈夫(情人)只是玩弄感情、老是拈花惹草、不 在身邊或是與自己的姐妹不小心發生了關係,她們始終都待在丈夫的身邊,這是舊世代的女人的愛情觀,如中國那句古言:「嫁雞隨雞,嫁狗隨狗」。中間的世代, 如Marianna和Finn的母親。Finn的母親是嬉皮族(從服裝、結婚照和Finn自己說名字很嬉皮猜測),她在相當年輕時與Finn的父親結婚, 但又離婚,離婚後不斷的換著男朋友,因為她想找到屬於自己的愛情,同時也與前夫保持著朋友的關…