《古今圖書集成》預告


一、緣起
二、簡介
三、分工
四、富蘭克林精神
五、既既後未濟
待續

       《古今圖書集成》     東吳計畫主持人  陳郁夫
                                        民國88年08月20日  初稿

  故宮與東吳合作開發《古今圖書集成》電子版已於八月六日正式簽約。
這是一件國際學術大事,重任一肩承擔,不可不在此做一些說明。

一、緣起:
  故事要從把一些古典文獻資料放在故宮說起。
  大約一年之前,由於十幾年來眾緣匯聚,累積了不少資料。那時深恐
「屯膏不發,凶(周易.屯.九五)」,便有意找個地方放,供學者使用。
恰好某圖書館有人來電話,我說出了「願意完全免費贈送」的意願,但對
方沒回應。我與故宮文獻處長吳哲夫雖是初中同學,但只心儀。自師大退
休後來東吳,才有機會交往,並且相處甚得。有天與他談起這事,他說「
放在我們故宮」。本來我也以為說說而已,沒想到第二天他便與秦孝儀院
長報告,又一天院長便招見。反應之快,大出意料之外。「寒泉」古典文
獻資料庫於是在故宮建立起來。
  我在故宮建站,到現在為止,一點兒遺憾也沒有。不僅因為資料放在
世界最知名的博物院,不覺委屈;秦院長給我的禮遇之隆,無可復加;與
吳處長與宋館長的配合,更暢順無比。因為這樣,雙方建立了《古今圖書
集成》這工程的互信基礎。
  《古今圖書集成》是吳處長一直想整理的典籍,一年多以來一直與某
大學談合作,但只聞雷聲,不見雨降。有一天東吳劉源俊校長與蔡明哲教
務長參觀「三星堆」文物之餘與吳處長相見,吳處長與之談這事。劉校長
與蔡教務長都極有興趣,問在下要多少錢﹖我報給他們一個不大的數目。
他們願提供資金、人力和場所,積極與故宮談合作。沒有多久,合約便簽
下。
  這事讓我有很多感想,其中一點一定要告訴讀者。自從十幾年前開始
從事「古籍數位化」工作,就好像走對了路,善緣不絕,好像只要我努力
向前,便會有菩薩拿著我要的東西等著。起初寫了個「全文檢索」雛程式,
中研院謝清俊教授便邀去發表,現在還感覺到那時的興奮和受鼓勵。後來
程式漸成熟,便想做資料,恰好「中國投資教育基金會」前來資助。等到
與基金會關係終止,想把資料供學界使用,故宮的因緣便來。而今又有《
古今圖書集成》這大工程進行,除了自覺幸運之外,更萬分感謝這些成就
因緣的菩薩們。

二、簡介:
  名稱:古今圖書集成
  編纂:陳夢雷編著,蔣廷錫校訂
  底本:故宮博物院典藏雍正四年銅字活版本
  份量:八百冊、一萬卷、五十多萬頁、一億七千多萬字
  內容:「彙編」六,「典」三十二,典下分6117「部」。
     (一)曆象彙編:乾象、歲功、曆法、庶徵
     (二)方輿彙編:坤輿、職方、山川、邊裔
     (三)明倫彙編:皇極、宮闈、官常、家範、交誼、氏族、
             人事、閨媛
     (四)博物彙編:藝術、神異、禽獸、草木
     (五)理學彙編:經籍、學行、文學、字學
     (六)經濟彙編:選舉、銓衡、食貨、禮儀、樂律、戎政、
             祥刑、考工
  體例:每「部」中有彙考、總論、圖、表、列傳、藝文、選句、
     紀事、雜錄、外編,無者闕之。
  價值:
     形式佳:分類編纂,具有百科全書與資料彙編二種優點。
     規模大:集古代圖書之大成。
     內容富:搜集康熙以前政治、經濟、軍事、文化、藝術、
         哲學、宗教、歷史、地理、天文、曆法、礦產、
         農漁、工技、數學等資料,明代資料保存尤多。
     體例善:分類細密,體例完善。
     用途廣:檢索某一事物,可得知其源流與歷史上相關資料,
         國內外文史、科研界常用。

三、分工:故宮與東吳分段分工,三年完成。
  故宮:
     拆裝原典
     分頁影印
     掃瞄成圖
  東吳:
     圖檔完稿(修正、索引、瀏覽)
     文字辨識(ocr、除雜訊)
     文字完稿(五校)
     登錄資料庫
     上網與製作光碟


四、「富蘭克林精神」:
  富蘭克林曾做了這樣一個聰明的實驗:他要知道一個分子究竟有多大,
把一點點油倒入平靜無波的池面,然後計算其面積,所得的數值,居然與
現代應用昂貴設備測得的幾乎一樣。這種研究方法被熱那稱為「富蘭克林
精神」。「富蘭克林精神」包括以下三點:
 (一)經濟:只用少量金錢
 (二)創意:運用富於創意的方法
 (三)正確:達到科學追求的目標
  《古今圖書集成》製成現代人適用的電子版,將遵循這種精神。這工
程如由別人來做,至少要五倍以上的金額。我們沒有那麼大的經費,所以
盡可能用電腦程式來取代人工,譬如本文檔的輸入,我們採用OCR光學
辨識系統,省下大量輸入費。試想一億八千萬字如用人工輸入,至少花上
一千八百萬元,我們那有這麼多經費﹖不僅如此,其他像校對、圖文去雜
訊等,都用程式來做。如果我們不在正確上更進一步要求,幾乎用電腦程
式就可完成全部工作了。
  我們的創意也不少,譬如像「活字原版」就是其一。內行人都曉得,
以現代的網路頻寬,要傳一張三百K的圖檔要費近十分鐘,所以一般網路
版便只能文字全文檢索,無法看到原版圖檔資料。但我們有能力解決這問
題,讓網路上使用者看到《古今圖書集成》原版真面目。
  大部分的金錢花在追求正確上,有點兒像化學家提煉純粹的結晶,真
有一種奇怪的感覺。

五、既既後未濟:
  易經最後二卦是「既濟」和「未濟」,這代表我們中國人對事情的看
法。未來完成了合約是「既濟」,到時只是可以交差,新的工作才開始。
 (一)我們還要進行標點、分段。因為整理古籍如不加標點、分段,終
    「未濟」,使用價值也低不少。
 (二)《古今圖書集成》插圖極為精美,我們會特別加以分類整理出來,
    也希望能著色,使它成為非常好的教學參考資料。
 (三)這是一部系統分明的古代資料匯編,我們要利用其中資料,整理
    出一部「古代分類辭典」。這辭典價值決不在電子版之下。
 (四)我們要利用其中資料,依現代百科全書體例,改寫成一部「古代
    百科全書」。這百科全書的價值,也不在電子版之下。
 (五)這書的資料只到清康熙年間,以後的資料付諸闕如。我們希望把
    康熙之後的資料補上去。這工程當然十分浩大,也許再用十年還
    「未濟」呢。
  以上五項工程,難度與工時一項比一項高。我盼望有人也具慧眼,繼
續支援,使我們一次又一次渡河,走向真正完工。

--待續--
  隨著工作進行,我們將陸續為你報導。