中文《全字庫》網站「內碼查詢」之探討- 王國良的部落格
文章推薦指數: 80 %
在全字庫用任何方法查得的漢字,皆會標註BIG5碼,在單字查詢選項之下,若輸入BIG5字碼,即可查得漢字,例如輸入A440,可查得「一」字;若輸入C67E,可查得 ...
Contents...
udn網路城邦
王國良的部落格 (到舊版)
探討國語與臺語的語文園地,歡迎大家賞光和指教。
文章相簿訪客簿
中文《全字庫》網站「內碼查詢」之探討
2010/04/1023:33
瀏覽5,319
迴響0
推薦28
引用0
中文全字庫網站共提供了13種查詢方式,其中共有8種是整合在「複合查詢」之下。
本文將介紹的內碼查詢是指UNICODE查詢和BIG5查詢,這兩種查詢並未整合在「複合查詢」之內。
全字庫網站的內碼查詢到底應如何善用,請看本文之探討。
(一)UNICODE查詢
在UNICODE查詢之下,共分成「段落查詢」和「單字查詢」這兩個選項:
(1)段落查詢
以Vista的中文系統為例,Unicode的字集分成標準字集和增補字集,標準字集的內碼是4E00至9FA5,字數共計20,902個。
使用全字庫的Unicode查詢,若選第0(BMP)字面,選段落查詢,字碼輸入4E00~9FA5共查得字數20,907個;若選第2字面,共查得字數20,900個;若選第15字面,共查得字數3,930個。
增補字集的內碼是3400至4DB5,字數共計6,258個。
使用全字庫的Unicode查詢,若選第0(BMP)字面,選段落查詢,字碼輸入3400~4DB5,共查得字數6,581個;若選第2字面,共查得字數6,582個;若選第15字面,共得查字數0個。
段落查詢選項,適合用來查詢Unicode內碼區間所包含的漢字。
(2)單字查詢
在全字庫用任何方法查得的漢字,皆會標註Unicode碼,在單字查詢選項之下,若輸入Unicode字碼,即可查得漢字,例如輸入4E00,可查得「一」字;若輸入9FA5,可查得「龥」字;若分別輸入3400和4DB5,可分別查得各該漢字。
單字查詢選項,適合已知該漢字的Unicode碼。
(二)BIG5查詢
在BIG5查詢之下,共分成「段落查詢」和「單字查詢」這兩個選項:
(1)段落查詢
BIG5的字集分成常用字集與次常用字集,常用字集的內碼是A440至C67E,字數共計5,401個;次常用字集的內碼是C940至F9D5,字數共計7,652個,兩者字數合計13,053個。
使用全字庫的BIG5查詢,選段落查詢,若字碼輸入A440~C67E,共查得字數5,401個;若字碼輸入C940~F9D5,共查得字數7,650個;若字碼輸入A440~F9D5,共查得字數13,051個。
段落查詢選項,適合用來查詢BIG5內碼區間所包含的漢字。
(2)單字查詢
在全字庫用任何方法查得的漢字,皆會標註BIG5碼,在單字查詢選項之下,若輸入BIG5字碼,即可查得漢字,例如輸入A440,可查得「一」字;若輸入C67E,可查得「籲」字;若輸入C940,可查得「乂」字;若輸入F9D5,可查得「龘」字。
單字查詢選項,適合已知該漢字的BIG5碼。
經由上述的探討可知,全字庫上面的UNICODE查詢的段落查詢,配合第0、2或15字面的選定,會出現不同字數的漢字,總字數比起Vista作業系統上的漢字還多。
照理說應是一碼一字,不知全字庫上面是否一碼多字?這一部份有待日後再研究。
[相關閱讀]
1.Vista作業系統到底含有多少漢字?
2.電腦上的漢字字數計算
回覆
推薦引用
有誰引用
我要引用
引用網址
列印
全站分類:興趣嗜好|
電腦3C
自訂分類:辭典的使用
上一則:中文《全字庫》網站的「筆順序查詢」之使用心得下一則:淺談中文的字辭典網站之檢字法
你可能會有興趣的文章:
以專科學校為名的路街名
舊的蘆洲警分局位在哪裡?
《來吧!營業中》的拍攝地點
「輔大醫院」是位在泰山區
認識新北市三峽區各國小的所在地
土城區的「暫緩發展區」的老照片
加入好友
推薦部落格
訂閱關注
留言給他
王國良(阿國)
部落格推薦:93
等級:8
點閱人氣:8,949,392本日人氣:897
文章創作:802 相簿數:2
輸入關鍵字:
搜尋
prev
7月(1)
6月(2)
5月(3)
4月(3)
3月(4)
2月(2)
1月(3)
12月(3)
11月(3)
10月(3)
9月(3)
8月(3)
7月(3)
6月(4)
5月(2)
4月(3)
3月(3)
2月(3)
1月(3)
12月(3)
11月(2)
10月(4)
9月(3)
8月(3)
7月(3)
6月(3)
5月(3)
4月(3)
3月(4)
2月(2)
1月(3)
12月(3)
11月(3)
10月(2)
9月(3)
8月(4)
7月(2)
最新發表
最新回應
最新推薦
熱門瀏覽
熱門回應
熱門推薦
以各級學校為名的路街名
以「國立高雄大學」為名的多條路街名
以專科學校為名的路街名
巷弄的「弄」你唸對了嗎?
舊的蘆洲警分局位在哪裡?
中和區有5處金門眷村
解析電影《大尾鱸鰻》的主題曲〈我是恁老爸〉的歌詞(感謝聯合新聞網列入「意見評論》部落客開講》」)
報紙含有「國台語夾雜」的標題還真不少!(上)(感謝聯合新聞網列入「意見評論》部落客開講》」)
報紙含有「國台語夾雜」的標題還真不少!(下)(感謝聯合新聞網列入「意見評論》部落客開講》」)
「新北市」有沒有簡稱?(感謝聯合新聞網列入「意見評論》部落客開講》」)
認識含有12生肖的地名(感謝聯合新聞網列入「首頁新聞頭條區網評」)
這種小事找我做應該OK的!
如果日本沒有發動太平洋戰爭,臺灣會怎樣?
邁阿密我們來啦!
一輩子都在爭取別人的肯定,你不累嗎?
教育是造橋鋪路,研發是探險拓荒,我都有貢獻了!
夏季疲勞
任它狂風暴雨,心中波瀾不驚
白尾八哥
臺灣清末至日本殖民地時代的文教故事-學校創始
我沒錢的!詐騙集團就別費事來找我了!
RSS部落格聯播
▲top
本部落格刊登之內容為作者個人自行提供上傳,不代表udn立場。
刊登網站廣告︱關於我們︱常見問題︱服務條款︱著作權聲明︱隱私權聲明︱客服
Poweredbyudn.com
粉絲團
udn部落格
延伸文章資訊
- 1字元碼查詢 - 科技宅人生
字元碼查詢. R6打中文方式:alt+字元碼(例alt+44647 = 射). 查詢字元碼. 相關文章:https://forum.gamer.com.tw/Co.php?bsn=01054&s...
- 2中文標準交換碼 - 國家發展委員會
目前全字庫收納逾10萬5,000字,採全域伺服器負載平衡機制,提供7x24小時之服務,其功能有:中文碼查詢(以總筆畫數、注音符號、倉頡碼、拼音、筆順序、部件及複合等方式查詢 ...
- 3字碼查詢- 快速查詢- CNS11643 中文全字庫
您可以「輸入」或「複製與貼上」欲查詢之單字、符號、字碼(CNS、Big5、Unicode)或倉頡碼, · 所查詢之單字,必須是電腦作業系統支援之字型,圖形字或使用者自造字無法查詢。
- 4CNS11643中文標準交換碼全字庫(簡稱全字庫)
zip壓縮檔,內容包含全字庫字型、屬性資料及中文碼對照表三部分,其中全字庫字型提供明 ... 本平臺係提供「全字庫資料集」之內容,您提的問題與「全字庫網站的字碼查詢 ...
- 5中文標準交換碼- 维基百科,自由的百科全书
中文標準交換碼(CSIC, Chinese Standard Interchange Code),編號CNS 11643,舊名國家標準中文交換碼(CISCII, Chinese Ideograp...