東方,西方
時間:2024-11-07 08:07:39
1975年,歲月不饒人,王選已38歲,接近不惑之年,年輪也在他臉上刻下了比别人更多的東西。因為喘息,甚至在兩肋有深紋。别看隻有38歲,王選幾乎有一種特殊年齡,不老,但也不年輕,身體虛弱,但眼睛放光,自有了陳堃銶後再沒熄過。甚至有時亮得出奇,似乎把全身的火焰都集中在了自己的眼睛上,比如工作時,查閱資料時。當然,由于過分集中在眼睛,别處也有時更顯虛弱。換句話說,他能調動全身的火焰,但卻隻能拆東牆補西牆,無法達到整個身體的平衡。然而,正是這樣一個拆東牆補西牆的身體卻靈敏地感覺到那個時代最重要的東西、革命性的東西:r1971年,英特爾研制出世界上第一塊四位字長微處理器4004;1974年英特爾再度推出比4004快20倍的微處理器8080;同年美國MITS公司利用8080設計出世界第一台微型電子計算機,預示着革命性的微機時代的到來。然而,計算機是西方人發明的,建立在英文基礎上,對中國而言簡直是另一星球的事,高不可攀:古老的已經使用了幾千年并且還在使用的象形文字漢字,能進入微機編碼嗎?顯然不可能——這幾乎是一種常識的常識;很多人認為漢字太落後了,已經是人類之外的文字——這也是微機時代到來許多所謂有識之士普遍的共識。但王選不這麼看,至少把這看成挑戰。他是幹什麼的?就是為解決這事而來,他的奇妙而晦澀的身體這麼多年來在一種特殊的運行中,已擁有了某種東西,而這東西仿佛就是上帝為漢字文明準備的。r1974年春暖花開時,北大有了一台電子計算機,不想閑着,這朵“微機之花”不能總是含苞欲放,應該開出點什麼,于是決定用計算機把學校的管理工作抓起來。一天學校組織一大批人分頭到學校印刷廠、物資部門及财務部門進行調查,陳堃銶參加了調查。之前的幾個月,确切地說1974年初,陳堃銶得了暈眩症,類似美尼爾,時常發作,天旋地轉,無法再給學生上課,不知道是否受到王選病體的“影響”,教研室不再安排教學任務,讓陳堃銶管些雜物,管管資料,對付教學之外的一些活動。這讓人不由得想到王選的狀況,有人開玩笑:這兩口子真是天生的一對,是夫妻相,夫妻病。陳堃銶也因此參加了對印刷廠的調查了解工作。在印刷廠,事情就是這麼湊巧,這麼宿命,陳堃銶意外地了解到國家有一個關于漢字信息處理技術的重點科研項目,代号為“748工程”。回到家陳堃銶将這一消息告訴了王選,王選嗅覺非常靈敏,越是病人嗅覺就越靈敏,内心仿佛得到某種如同計算機内部的指令,突然感到某種沉默已久的“主機”啟動,聽到了嗡的一聲。事實上多年來他一直在為内心的某種主機工作,此時王選眼睛放光,似乎也看到了陳堃銶眼睛放光,從此兩人眼睛裡多了一種東西。很難說是激光或者類似的東西,反正是隻有他們倆相視時才有的東西。r“748工程”總共包括精密漢字照排系統、漢字情報檢索系統、漢字通信系統和漢字終端設備等内容的研究。王選認為精密漢字照排系統最為關鍵,這是書刊和報紙編輯排版工作的專用系統,對已延續了五千年的漢字意義重大,這是一場跟上世界文明潮流、使漢字不至被排除在外的革命。陳堃銶了解到在“748工程”中,已有五家單位在研制精密漢字照排系統,五家分别是上海印刷技術研究所、中華印刷廠、北京新華印刷廠、清華大學計算機系、中國科學院自動化研究所,這五家都實力雄厚,并且還有諸多合作夥伴。r這是國家工程,與獨立的個人無關,更與病人無關。r但王選一眼便看到這五家單位的緻命缺陷,王選準備單幹。r主機一旦啟動,王選進入了從未有過的計算機般的工作狀态,以個人之力查看了大量資料:世界上第一台手動式照排機是1946年在美國問世的,第二代是光機式照排機,第三代是陰極射線管照排機,如今已發展到第四代激光照排機:字模以數字化點陣的形式存儲在計算機中,輸出時,用受控制的激光束在底片上直接掃描打點。西方從第一代機發展到第四代機,經過了漫長三十年。五家單位包括背後的專家群,當然也知道這個進程。但王選單挑五家,單挑國家工程,他不相信這種事情能靠協作、集體完成,這是個人的事,或者天才的事。反過來在許多人看來,王選的個人行為無異于天方夜譚,堂吉诃德戰風車。甚至這堂吉诃德不但瘋,而且病。r精密漢字照排系統的方案,其創造性、先進性和可行性是能否研制成功的關鍵,上述五家恰恰在這三個方面都存在着嚴重的缺陷;王選很想告訴他們——第三代西文照排機已在西方大量推廣,第四代機也正在一些技術先進的國家加緊研制,中國的五家單位,你們選擇的是二代機與三代機,即使費了九牛二虎之力研制出來,又有多大價值?此外,王選想說,更重要的一點是,五家在漢字字形存儲方面采取的全部是模拟存儲方式,而不是數字,模拟存儲方式能解決存儲和輸出等技術難關嗎?但如果一個多年的“病人”告訴他們這些,他們會改變嗎?不要說改變,面對這樣一個說話都上氣不接下氣的人,即使五家單位的“專家群”不把王選看作堂吉诃德,也會把王選看作一個貨真價實的病人。r但王選不是堂吉诃德,某種意義上也不是病人,而是天才。r是孟子所說的天将降大任的那種人,甚至有過之。r王選的目光掠過第一代、第二代和第三代照排機,直接瞄準了國外正在研制的第四代機——激光照排機。王選知道(好像那五家單位不知道似的)最早開始研制激光照排機的英國蒙納公司(Monotype公司)對四代機剛剛進入試制階段,尚未形成商品;日本雖然搞出了第三代照排機,但功能很不完善,僅能勉強應付日文中的少量漢字。這是挑戰,也正好是機會,跟在别人後面往往是集體的行為,是一緻的看得清的行為,也是平庸的行為,這便是王選和五家單位的區别。在這個意義上說,創造性很多時候不來自集體,相反很多時候集體會内耗掉遮蔽掉集體中的天才。很多時候,個人即意味自由,而創造性的工作與自由直接相關,創造怎麼少得了自由呢?這是一對天生的孿生姐妹。千年以前,宋代畢昇發明活字版印刷術是個人行為,在這個意義無論如何我們個人化的行為太少了,在印刷術上千年後繼無人。世界從20世紀40年代起,古老的印刷術便融合當代的機械、電子、光學等先進技術成果,把照排技術發展到了第四代。這種技術與計算機相連,組成編輯排版系統,取代了鉛字(泥字),實現了書報自動排版,大大提高了生産率。目前激光照排機直接制版的前景事實上更加誘人:激光束直接打在感光版材上,經自動處理後即可直接膠印;底片的顯影、定影及制版等一系列工序都可以免除,勞動生産率還将進一步提高。但是在畢昇的故鄉中國,卻仍在按照1488年德國古登堡的辦法:以火熔鉛,以鉛鑄字,以鉛排版,以版印刷,仍停留在500年前歐洲中世紀的“鉛與火”時代。王選直接延續宋朝的個人創造精神,挑戰世界。其實,就根本而言,王選誰也沒挑戰,他挑戰的是自己。r當然,把古老的象形文字——常用字3000字以上非常用7000字以上——融進電子計算機,時間跨度達千年,談何容易?況且漢字印刷用的字體、字号又特别多,每種字體起碼也需要7000多字,每個漢字從特大号到七号,共有16種字号。如果考慮到不同字體和不同字号在内,印刷用的漢字字頭數高達100萬字以上。因此,漢字點陣對應的總存儲量将達200億位。這是一個吓人的天文數字,難怪五家單位的五個技術專家群在一起做。即使畢昇活在當世能應對嗎?r能,這就是王選的感覺。事情常常就是這麼吊詭,正常人覺得不能的時候病人覺得能。必須找到一種方法,對漢字信息進行大大壓縮,這是關鍵的第一步。王選唯一擔心的是自己身體,靈魂過分強大,身體往往不堪使用,他的身體能支撐他嗎?自從确立了“戰風車”的目标,王選常常整夜整夜不睡覺,坐着研究不行就躺着研究,幸好有陳堃銶,簡直就是他的另一半,他們太一樣了。兩個病人的能量絕非兩個正常人能比的,因為愛是一種化學反應,是那個時代最大的正能量。陳堃銶早已習慣了王選,兩人奇迹般地完全達到兼容,甚至很多時候他們就是一個人。王選着了魔似的拿着字典,查報刊,在床上翻來覆去、苦心孤詣研究浩如煙海的漢字:字形的特點,規律,沒有規律的規律,沒有邏輯的邏輯。不能按西方的邏輯分析,那樣永遠走不通,中國文明有自己的奇怪的邏輯。r但是說怪也不怪,不過是自成體系。隻是要用這種自成一體的體系思維出一種規律性的東西,西方性的東西,即計算機性的東西,老實說當時整個中國也隻有王選與陳堃銶這樣奇迹的組合才能做到。為什麼說千年等一回?為什麼說雙重的千年等一回?就是這個意思。中國文明要過計算機這個坎就需要千年等一回。王選與陳堃銶不是通常的過日子,而是過事業,生活得再簡單不過,但他們慢慢歸納出漢字的橫、豎、折等規則筆畫:它們由基本直線和起筆、收筆及轉折等筆鋒組成;歸納出撇、捺、點、鈎不規則筆畫:它們都有一定的曲線變化。有一天躺着的王選氣喘地對陳堃銶說,能不能想辦法對這些筆畫進行統計,看看能否選出一些典型的筆畫,供整套字合用,然後,再研究怎樣用更少的信息描述它們?這樣說的時候,漢字或中國邏輯已然隐現,陳堃銶非常敏感,更有女性對空間想象的本能,認為可行。打毛衣,織帽子,這些陳堃銶也是要做的,而這也是一種空間能力。陳堃銶從印刷廠找來字模,将字模稿上的一個個漢字字形放大,放在坐标紙上,再描出字形的點陣和統計筆段,就像毛活的圖案,發現橫、豎、折的基本部分比較固定,變化的是頭和尾。而頭和尾的樣式不是很多,因此可以挑選出若幹個供所有字合用的典型。但撇、捺、點這些不規則筆段,筆畫變化太多,很難挑出幾種可供所有漢字合用的典型。r王選拿着一張張字模稿,輾轉反側,寤寐思服,也正在此時,慢慢的,在漢字古老的邏輯中,亦即中國的邏輯中,王選的西方邏輯——高等數學,發揮了作用:兩者神奇地幾乎不可能地在融合,在對接,在交互。而融合點正是用類似數學拓撲學的“輪廓”來描述漢字字形:用折線輪廓逼近漢字字形,然後在輪廓上選取合适的關鍵點,再将這些點用直線相連,成折線,用折線代表漢字的輪廓曲線,隻要點取得合适,就能保證文字放大或縮小後的質量。r這就是王選想到的:數字與漢字的結合。r無論古老漢字多麼桀骜不馴,還是被數學描述了。r然而,在進行字形變倍實驗時筆畫出現了粗細不均,特别是橫、豎、折這類規則筆畫最甚,明顯影響了文字質量。為了保證筆畫的勻稱,需要對這些筆畫進行特殊控制。王選與陳堃銶粗略統計,漢字中規則筆段的比例占差不多一半,一套七八千字的字模會包含幾萬個橫和同樣多的豎,但分類後可能就隻有幾十個類型的橫和豎了——王選精密的腦子運行到這兒,一個絕妙的幾乎自動生成的設計又一次形成了:他氣喘噓噓,上氣不接下氣,分了幾次才把想法說完:r“我們可以用參數方法描述規則筆段,就是把筆畫的長度、寬度、起筆筆鋒、收筆筆鋒、轉折筆鋒——橫肩、豎頭、豎尾,還有,筆畫的起始位置等用參數編号表示。其餘撇、捺、鈎、點不規則筆段仍用輪廓表示,這樣不但可以保證字模變倍時橫、豎、折等筆畫的勻稱,解決文字變倍後的質量問題,還可以使信息進一步大大壓縮……”r王選起來喝了一大口水,躺下來,接着說:r“另一方面,由于我們可以實現不失真的變倍,不必把所有的字号壓縮信息都存到計算機裡去,可以隻選擇其中一兩種有代表性的字号,放大或縮小變出别的各種字号,這樣就能達到更高的壓縮倍數!”r陳堃銶不但在家幫助計算,還把壓縮信息拿到系裡計算機上進行各種模拟實驗。陳堃銶驚訝地發現,這種“輪廓加參數”壓縮信息表示法,達到了信息最大限度的節省,使漢字信息存入計算機的問題迎刃而解!r陳堃銶把這個消息告訴了喘息的王選。r自己激動得也有點喘。兩人的目光完全一緻,是激光。r兩人馬不停蹄,又設計了壓縮信息的緊湊形式,陳堃銶用黑、宋、仿、楷四種字體的十種字号,以及長宋、扁宋、長黑、扁黑等點陣的總存儲量與壓縮後的存儲量相比,發現總體壓縮倍數達500多倍。到了最關鍵時刻,即如何使存入計算機的壓縮信息還原成字形點陣。陳堃銶白天還要常去上課,王選就一個人或坐或卧或在屋子中轉磨,或在床上輾轉反側。有一天陳堃銶剛回來,王選大聲說,我想出辦法啦!由于聲音過大,停了好半天才說:“我們,可以用數學公式的推導,推導出一個壓縮信息複原的遞推公式!”r兩人馬上按王選說的驗算,得出的結果驚人的漂亮。試驗了一批字,無論放大縮小,完全一樣,分毫不差,毫不變形。數字與漢字,東方與西方,兩種不同的文明在王選的身體裡以科學的方式融合。誰能想到,這種融合竟然選擇的是王選這樣一個病體?誰又能想到上天又送給他一個仙女?r确如愛因斯坦所說,上帝是微妙的。r