Editing SGB
From Phonology
Warning: You are not logged in.
Your IP address will be recorded in this page's edit history.
The edit can be undone.
Please check the comparison below to verify that this is what you want to do, and then save the changes below to finish undoing the edit.
Current revision | Your text | ||
Line 38: | Line 38: | ||
部_____立 | 部_____立 | ||
| |_口 | | |_口 | ||
- | + | |___阝 | |
長於思考的讀者讀到這裏大概就要發難了,因文中已出現了一些自相矛盾的地方——至少表面上看起來。 | 長於思考的讀者讀到這裏大概就要發難了,因文中已出現了一些自相矛盾的地方——至少表面上看起來。 | ||
Line 55: | Line 55: | ||
對第三箇疑問,我回答:SGD的原則是就字論字,眞書作何字,SGD就解何字。㕻(⊟丶否)和咅(⊟立口)在眞書中雖然有正奇的關係但絕不是一箇字, IDS的不同就是明證。對SGD對漢字的解析不限於unicode 3.1中的CJK字集,SGD與異體字的問題見下文,㕻咅是否同字的辯證請參閱The Unicode Standard 4.0 Chapter 11中對unification的解釋。 | 對第三箇疑問,我回答:SGD的原則是就字論字,眞書作何字,SGD就解何字。㕻(⊟丶否)和咅(⊟立口)在眞書中雖然有正奇的關係但絕不是一箇字, IDS的不同就是明證。對SGD對漢字的解析不限於unicode 3.1中的CJK字集,SGD與異體字的問題見下文,㕻咅是否同字的辯證請參閱The Unicode Standard 4.0 Chapter 11中對unification的解釋。 | ||
- | + | SGD 中的構字式 | |
- | + | ||
+ | 〘一〙部件樹與獨立漢字 | ||
【1】獨立的漢字也是構字式。沒錯,我們有必要把獨立的漢字也看成是構字式。比如漢字「天」、「地」、「玄」、「黃」,就是四箇構字式。我將獨立漢字的構字式稱作獨立型-singleton。之所以要引入這個概念,就是因為:1,幾乎*所有更複雜的構字式都可以被分析成singletons。2,構字式可以包含子構字式,依前文所述,每條子構字式描述一箇部件,整條構字式描述一箇字。比如,前例的「部」字,可解析爲「◫咅阝」,又可進一步解析作「◫⊟立口阝」,咅本身是一個獨立的字,它在構字式的功能與⊟立口相當,在字與構字式之間竝不存在一道不可逾越的鴻溝,而與此同時,「部」字又可以充當其他字的構成部件,如:「廍」=「◲广部」,所以,在字和部件之間也沒有甚麼明晰的疆界。SGD 將所有的漢字都看成是潛在的構字部件,同時,每一條構字式(包括子構字式。相信各位讀者已然意識到了,這箇「子」字是無關緊要的)都對應一箇潛在的構字部件。所以說,獨立漢字也是構字式,這是對IDS的一條必要補充。 | 【1】獨立的漢字也是構字式。沒錯,我們有必要把獨立的漢字也看成是構字式。比如漢字「天」、「地」、「玄」、「黃」,就是四箇構字式。我將獨立漢字的構字式稱作獨立型-singleton。之所以要引入這個概念,就是因為:1,幾乎*所有更複雜的構字式都可以被分析成singletons。2,構字式可以包含子構字式,依前文所述,每條子構字式描述一箇部件,整條構字式描述一箇字。比如,前例的「部」字,可解析爲「◫咅阝」,又可進一步解析作「◫⊟立口阝」,咅本身是一個獨立的字,它在構字式的功能與⊟立口相當,在字與構字式之間竝不存在一道不可逾越的鴻溝,而與此同時,「部」字又可以充當其他字的構成部件,如:「廍」=「◲广部」,所以,在字和部件之間也沒有甚麼明晰的疆界。SGD 將所有的漢字都看成是潛在的構字部件,同時,每一條構字式(包括子構字式。相信各位讀者已然意識到了,這箇「子」字是無關緊要的)都對應一箇潛在的構字部件。所以說,獨立漢字也是構字式,這是對IDS的一條必要補充。 | ||
Line 66: | Line 67: | ||
【2】與singleton對應,樹形的類IDS的構字式就稱作複合型- composition.例略。 | 【2】與singleton對應,樹形的類IDS的構字式就稱作複合型- composition.例略。 | ||
- | + | 〘二〙對composition 的分析 | |
【1】僅由一箇連接符和相應箇數的singletons組成的compostion構字式,我們稱其爲簡單的複合-simple compound。 | 【1】僅由一箇連接符和相應箇數的singletons組成的compostion構字式,我們稱其爲簡單的複合-simple compound。 | ||
【2】包含兩箇以上連接符的composition構字式,稱作複雜的複合-complex compound。 | 【2】包含兩箇以上連接符的composition構字式,稱作複雜的複合-complex compound。 | ||
Line 84: | Line 85: | ||
All simple compostions are simplest,反之則不然。 | All simple compostions are simplest,反之則不然。 | ||
- | + | 〘三〙對singleton的補充 | |
IDS的全部材料都取自現有字集,確切說就是unicode cjk unified及ext a/b。現有字集中的可拆解字符(直觀上)並不能全部以現有字集中的字符來描述,比如郎的左部、即的左部、经的右部等,unicode現有字集中並沒有這些字或部件。另有一些字從造字機理上看包含某獨立漢字的省形,如「傷」字依《說文》從「𥏻」省,「度」從「庶」省,而「𥏻」省、「庶」省都不成字。此外,還有一些部件,雖然從造字機理上講不通,但在眞書中確有類推應用,如「秦、泰、春、舂」的上部,「表、毒、青、責」的上部等。前文反復強調,SGD以客觀原則而就字論字。所以有必要補充一些客觀存在的部件以滿足ids解析的需要。SGD是反對主觀臆斷的字根的,它以如下兩種方式來描述這些補充部件。 | IDS的全部材料都取自現有字集,確切說就是unicode cjk unified及ext a/b。現有字集中的可拆解字符(直觀上)並不能全部以現有字集中的字符來描述,比如郎的左部、即的左部、经的右部等,unicode現有字集中並沒有這些字或部件。另有一些字從造字機理上看包含某獨立漢字的省形,如「傷」字依《說文》從「𥏻」省,「度」從「庶」省,而「𥏻」省、「庶」省都不成字。此外,還有一些部件,雖然從造字機理上講不通,但在眞書中確有類推應用,如「秦、泰、春、舂」的上部,「表、毒、青、責」的上部等。前文反復強調,SGD以客觀原則而就字論字。所以有必要補充一些客觀存在的部件以滿足ids解析的需要。SGD是反對主觀臆斷的字根的,它以如下兩種方式來描述這些補充部件。 | ||
Line 93: | Line 94: | ||
既然上述兩種特殊的部件表述方式都被看做singleton,那麼對simple compound的定義可以擴展爲:只包含一個連接符和相應個數singlegons/X-singletons/V-singletons的 composition構字式。如「◲◲庶X又」(度)、「H纟V巠」(经)也都是simple的。 | 既然上述兩種特殊的部件表述方式都被看做singleton,那麼對simple compound的定義可以擴展爲:只包含一個連接符和相應個數singlegons/X-singletons/V-singletons的 composition構字式。如「◲◲庶X又」(度)、「H纟V巠」(经)也都是simple的。 | ||
- | + | 〘三〙SGD中的IDS連接符 | |
在SGD中,IDS表達式中的連接符號以「神似」的大寫羅馬字母代替,這是因為;一方面,在utf-8格式中羅馬字母只占一箇字節,比較經濟;另一方面, postgres對ids operators和上文所用的一些幾何符號的處理有一些bug;再者就是,羅馬字母也能給用戶帶來方便,畢竟現在通行的IME和鍵盤佈局中還很少有支持這些字符的錄入的。 | 在SGD中,IDS表達式中的連接符號以「神似」的大寫羅馬字母代替,這是因為;一方面,在utf-8格式中羅馬字母只占一箇字節,比較經濟;另一方面, postgres對ids operators和上文所用的一些幾何符號的處理有一些bug;再者就是,羅馬字母也能給用戶帶來方便,畢竟現在通行的IME和鍵盤佈局中還很少有支持這些字符的錄入的。 | ||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- |