更新時(shí)間:2024-05-01 08:27:49作者:佚名
這要從信息熵開始。
無論任何語言,最常用的單詞都在 2,000 到 20,000 個(gè)左右。 符號(hào)字符中的單詞由字母組合組成,CJK字符由部首組成。
如果字母數(shù)量太少,比如只有兩個(gè)0和1,那么一個(gè)單詞就會(huì)由很長(zhǎng)的重復(fù)字母組成。 例如,如果將英文單詞轉(zhuǎn)換為ASCII碼,則幾乎沒有可讀性。 對(duì)于記憶的使用和表達(dá)來說非常不方便。
如果字母太多,比如100個(gè),其實(shí)也可以。
這涉及到一種語言的設(shè)計(jì)哲學(xué),是用相對(duì)較少、簡(jiǎn)單的字母組成符號(hào)字符,還是用非常大、復(fù)雜的字母組成象形文字。
如果把每個(gè)漢字看成一個(gè)字母,那么單詞和字母幾乎是同義詞,相當(dāng)于一個(gè)單詞一個(gè)字母。 那么每個(gè)字母都有很強(qiáng)的表達(dá)能力,但是也很復(fù)雜。
符號(hào)語言的設(shè)計(jì)理念是單個(gè)字母是簡(jiǎn)單的,單詞是由有限長(zhǎng)度的字母組合而成。
漢語的優(yōu)點(diǎn)是字母的表達(dá)能力強(qiáng),信息量大。 通過兩個(gè)字母的組合二十六個(gè)字母是什么,幾乎所有新的科學(xué)術(shù)語都可以表達(dá)意義,甚至達(dá)到字面上毫無意義的程度,這對(duì)于科普普及很有幫助。 它的缺點(diǎn)就像它的優(yōu)點(diǎn)一樣。 由于每個(gè)字母都有很強(qiáng)的含義,組合詞帶有字母本身的強(qiáng)含義,不利于形成新的抽象詞。
英語的優(yōu)點(diǎn)是字母有限、簡(jiǎn)單,而且字母沒有任何意義,所以很容易組成新單詞。 缺點(diǎn)也是它的優(yōu)點(diǎn)。 由于字母沒有意義,很難理解文本二十六個(gè)字母是什么,所以英語發(fā)展了詞根,每個(gè)詞根都類似于一個(gè)中文單詞。 信件在一定程度上解決了這個(gè)問題。
一般來說,符號(hào)書寫的靈活性和象征性比漢語更適合現(xiàn)代書寫系統(tǒng)。
那為什么是26呢? 根據(jù)上面的討論,兩種哲學(xué)思想都會(huì)走向數(shù)字的兩端。 漢字希望字母多,英文希望字母少。 少足以顯示符號(hào)系統(tǒng)的優(yōu)越性,但同時(shí)也不能太少,導(dǎo)致字?jǐn)?shù)很長(zhǎng)英語作文,可讀性很差。
所以結(jié)果可能是 20 到 30 個(gè)符號(hào)之間的系統(tǒng)是最有效的。 字母既少又簡(jiǎn)單,但又足夠多,使單詞不會(huì)太長(zhǎng)、重復(fù)而難以記憶和表達(dá)。
另一個(gè)原因是20到30個(gè)字母的數(shù)量也可以與音節(jié)的數(shù)量很好地一致。
音節(jié)數(shù)和字母數(shù)大致相同的數(shù)量級(jí)并非巧合。 因?yàn)樗鼈兌际菫楸磉_(dá)相同語義而開發(fā)的文字和聲音系統(tǒng),所以簡(jiǎn)單而有效的原則同時(shí)在這兩個(gè)系統(tǒng)中發(fā)揮作用。
另外,20到30正是單手10個(gè)手指打字最舒適的范圍。 這也是一件很有趣的事情。 手指太少,不夠靈活有效,表達(dá)能力也受到限制。 手指太多效率太低,付出的代價(jià)太高。 它很大但是好處太小,就是性價(jià)比太低,所以最后10個(gè)手指是表現(xiàn)力足夠強(qiáng)、效率最高的數(shù)字,打字可以覆蓋26個(gè)字母的范圍。
你會(huì)發(fā)現(xiàn)宏觀世界里很多數(shù)字恰好能夠在一個(gè)數(shù)量級(jí)的范圍內(nèi)相互適應(yīng),這是非常有趣的。 它們都是密不可分的。 根本原因之一可以用信息熵來解釋。
最后,所有西方符號(hào)文本都來自腓尼基符號(hào)系統(tǒng)。 該系統(tǒng)是為記錄業(yè)務(wù)中的事件而開發(fā)的實(shí)用文本。 當(dāng)然,它的設(shè)計(jì)理念是用盡可能少的、有效的符號(hào)來形成可用的文本。 書寫系統(tǒng)。