主計處全字庫- 老黃的電腦窩 - Google Sites

文章推薦指數: 80 %
投票人數:10人

解決個人電腦中文字數不足問題; 解決自造字交換問題:以電腦傳送的文件 ... 中文碼查詢:5.0版全字庫目前可供查詢的字共87,047個中文字、10,771個拼音 ... 老黃的電腦窩搜尋這個協作平台 協作平台地圖最近的協作平台活動 首頁Home精選要聞新聞聯播資訊科技資源協作平台地圖 ContactUs聯絡我們 意見調查論壇建置意見調查 2699天前是除夕 資訊科技‎>‎Desktop‎>‎中文化‎>‎ 主計處全字庫 張貼者:2010年12月14日清晨5:07書空 Byhching-Postedon05三月 2009 http://www.cns11643.gov.tw/AIDB/welcome.do 全字庫的建置目的: 解決個人電腦中文字數不足問題 解決自造字交換問題:以電腦傳送的文件如電子郵件、公文等如使用到自造字時,因編碼不一而無法正確呈現;CNS11643國家中文標準交換碼(簡稱國標碼)收編字數將達九萬餘字,字數充足,故以國標碼傳輸,是目前解決自造字交換問題的唯一方法;全字庫網站上建有「轉碼工具」,可供使用者進行國標碼與常用中文碼之互轉。

解決機關、企業、團體內部同字不同碼的問題:使用者各自造字或下載字型後,將造成機關、企業內部自造字「同字不同碼」現象,頻增繁複之轉碼工作;全字庫網站上的「全字庫應用工具4.0」建有「造字分享」機制,可供機關或企業內部所有個人電腦安裝相同的自造字,以維護「同字同碼」原則。

協助機關、企業、團體整合及管理個人電腦上的中文字集 解決網頁上自造字顯示問題:網頁上用到個人自造字時,瀏覽者將無法看到或正確的呈現;全字庫網站上建有「字型即時顯示」機制,可供使用者以適合的字體、顏色、大小顯示在螢幕上。

適用環境:WindowsXP 系統功能: 中文碼查詢:5.0版全字庫目前可供查詢的字共87,047個中文字、10,771個拼音文字及894個符號 字型下載:全字庫提供下載國標碼第一至第十五字面八萬餘個中文字、一萬餘個拼音文字、894個符號的字型,可使用總筆畫數、注音符號、倉頡碼、拼音、筆順序、部件及複合等方式查詢後下載其字型及注音、倉頡屬性資料;符號字,可依符號類別查詢後下載其字型。

中文碼轉換:由全字庫下載的字型及注音、倉頡屬性資料,除可安裝於電腦造字區,並將同時自動建立使用者自用的BIG-5自造字碼與國標碼對照表,再使用全字庫所提供的轉碼工具,進行純文字檔中常用內 碼BIG-5、EUC、Unicode、GBK(繁體字)與國標碼的互轉,以達成資訊之正確交換。

共用(相同)造字集安裝:全字庫自2.0版起提供造字分享機制,供機關、企業或團體內部所有個人電腦安裝相同的自造字集,以維護「同字同碼」原則,減少轉碼次數(機關、企業團體外之單機使用者,亦可以使用此機制安裝與他人相同之中文字集)。

關企業團體自造字集整合及管理:全字庫自3.0版開始提供的自造字集整合的工具,可供機關、企業團體的自造字管理者能順利整合各電腦上 個人原有的自造字,並有效管理新增的自造字。

網頁上自造字顯示:全字庫自3.0版起即提供「字型即時顯示」,可使網頁上用到的自造字,不需下載、安裝字型,即時到全字庫讀取自造字的字型轉換完圖形檔,再依設計者所需字體、顏色、大小顯示於瀏覽者的電腦上。

內部網路複製全字庫:為紓解全字庫網站的壅塞情形,自3.0版起即提供的全字庫複製機制,可供組織較大或使用較頻繁的政府機關於內部網路上安裝全字庫,不需再經網際網路,就可使用所有的全字庫應用工具與機制。

安裝BIG-5E字集:自4.0版起全字庫新增BIG-5E安裝工具,可將原安裝之24x24明體點矩陣字型更換為40x40字型,並提供楷體向量字型功能。

轉碼閘門:提供各種中文內碼與傳輸碼與國家標準交換碼(CNS11643)等之間進行正確之轉碼作業,並以CNS11643為核心,建立符合中文資訊互通規範中所訂之中文對照表規範之各中文碼與國家標準交換碼(CNS11643)的對照表檔案,以提供最合適的轉碼服務。

轉碼服務以Web Service(符合SOAP1.2規格)方式進行,可提供字串轉碼、文字檔線上轉碼與文字檔離線轉碼功能。

並提供Web Service呼叫介面,供程式開發者引用本系統之轉碼服務。

此外,為協助一般民眾建立個人造字集與國家標準交換碼(CNS11643)之標準對應,以達到資料交換正確性的確保,故提供全字庫軟體包供一般民眾下載(見工具下載頁面)。

民眾在使用全字庫軟體包建立個人造字集並申請成為全字庫網站會員後,可透過全字庫的轉碼閘門網頁上傳個人造字集,亦可查詢或下載其他人上傳之造字集,達到造字集分享的目的。

http://www.cns11643.gov.tw/AIDB/statistics.doCNS11643與 Unicode對映表CNS11643共97842字對映到Unicode第0,15字面碼位之字數共97835,沒有對映到的是7個字. http://www.cns11643.gov.tw/AIDB/encodings.do#encode1各種中文碼介紹 ------------專有名詞(http://www.cns11643.gov.tw/AIDB/terms.do)內碼(Internal Code)電腦系統或其應用程式所使用的碼,侷限在該系統或該程式使用,會隨系統之不同而異。

交換碼(InterchangeCode)不同系統間通訊或作資料交換所使用的碼。

字集(Characters Set)由不同字元所組合成之有限集合,它們係一完整且已被認同的字元集。

一般均採用已具共識地相同字集,再依不同需求訂定不同的字碼;例如:BIG5、EUC碼都採用CNS 11643中文標準交換碼的字集。

CNS11643中文標準交換碼(ChineseNationalStandard Code),於民國75年8月4日公布為國家標準。

為二位元組(byte)之編碼,編碼區共十六個字面,各字面字集之排列,以使用頻率為序,字集及字體係以教育部〈國字標準字體表〉為基準。

Big5指PC系統五大模組,即:系統公用程式、字的組成、狀態列設定、字形及列印設定等模組。

1985年制定,為二位元組(byte)編碼,目前PC系統中,Windows95/98/ME內碼即為BIG5碼,共編13,053個字。

EUCUNIX作業系統上使用的內碼(ExtendUnix Code,簡稱EUC),為四位元組(byte)編碼,編碼區間龐大,足以容納全國人民戶籍登記的姓名用字,故內政部以之做為全國戶役政作業的中文內碼。

UnicodeUniversal Code;簡稱Unicode,由美國萬國碼制訂委員會於1988-1991年間訂定,故亦稱萬國碼,目前已成為ISO認證之標準,故字集與ISO 10646完全相容;是目前個人電腦(PC)中,WindowsNT/2000/XP的內碼。

GBK大陸的漢字編碼標準,GB即“國標”,K是“擴展”的漢語拼音第一個字母。

全稱《漢字內碼擴展規範》(GBK),英文名稱Chinese InternalCodeSpecification。

ISO10646UniversalMultiple-OctetCodedCharacterSet(簡稱 UCS,廣用多八位元組編碼字元集),為國際標準化組織ISO所編的全球文字碼標準,與Unicode組織的Unicode編碼完全相容,是一個包括世界上各種語言的書面形式以及附加符號的編碼體系。

Comments 推薦用firefox或chrome瀏覽 allrightsreserved Signin|RecentSiteActivity|ReportAbuse|PrintPage|PoweredByGoogleSites



請為這篇文章評分?