《古今圖書集成》預告
《古今圖書集成》 東吳計畫主持人 陳郁夫 民國88年08月20日 初稿 故宮與東吳合作開發《古今圖書集成》電子版已於八月六日正式簽約。 這是一件國際學術大事,重任一肩承擔,不可不在此做一些說明。 一、緣起: 故事要從把一些古典文獻資料放在故宮說起。 大約一年之前,由於十幾年來眾緣匯聚,累積了不少資料。那時深恐 「屯膏不發,凶(周易.屯.九五)」,便有意找個地方放,供學者使用。 恰好某圖書館有人來電話,我說出了「願意完全免費贈送」的意願,但對 方沒回應。我與故宮文獻處長吳哲夫雖是初中同學,但只心儀。自師大退 休後來東吳,才有機會交往,並且相處甚得。有天與他談起這事,他說「 放在我們故宮」。本來我也以為說說而已,沒想到第二天他便與秦孝儀院 長報告,又一天院長便招見。反應之快,大出意料之外。「寒泉」古典文 獻資料庫於是在故宮建立起來。 我在故宮建站,到現在為止,一點兒遺憾也沒有。不僅因為資料放在 世界最知名的博物院,不覺委屈;秦院長給我的禮遇之隆,無可復加;與 吳處長與宋館長的配合,更暢順無比。因為這樣,雙方建立了《古今圖書 集成》這工程的互信基礎。 《古今圖書集成》是吳處長一直想整理的典籍,一年多以來一直與某 大學談合作,但只聞雷聲,不見雨降。有一天東吳劉源俊校長與蔡明哲教 務長參觀「三星堆」文物之餘與吳處長相見,吳處長與之談這事。劉校長 與蔡教務長都極有興趣,問在下要多少錢﹖我報給他們一個不大的數目。 他們願提供資金、人力和場所,積極與故宮談合作。沒有多久,合約便簽 下。 這事讓我有很多感想,其中一點一定要告訴讀者。自從十幾年前開始 從事「古籍數位化」工作,就好像走對了路,善緣不絕,好像只要我努力 向前,便會有菩薩拿著我要的東西等著。起初寫了個「全文檢索」雛程式, 中研院謝清俊教授便邀去發表,現在還感覺到那時的興奮和受鼓勵。後來 程式漸成熟,便想做資料,恰好「中國投資教育基金會」前來資助。等到 與基金會關係終止,想把資料供學界使用,故宮的因緣便來。而今又有《 古今圖書集成》這大工程進行,除了自覺幸運之外,更萬分感謝這些成就 因緣的菩薩們。 二、簡介: 名稱:古今圖書集成 編纂:陳夢雷編著,蔣廷錫校訂 底本:故宮博物院典藏雍正四年銅字活版本 份量:八百冊、一萬卷、五十多萬頁、一億七千多萬字 內容:「彙編」六,「典」三十二,典下分6117「部」。 (一)曆象彙編:乾象、歲功、曆法、庶徵 (二)方輿彙編:坤輿、職方、山川、邊裔 (三)明倫彙編:皇極、宮闈、官常、家範、交誼、氏族、 人事、閨媛 (四)博物彙編:藝術、神異、禽獸、草木 (五)理學彙編:經籍、學行、文學、字學 (六)經濟彙編:選舉、銓衡、食貨、禮儀、樂律、戎政、 祥刑、考工 體例:每「部」中有彙考、總論、圖、表、列傳、藝文、選句、 紀事、雜錄、外編,無者闕之。 價值: 形式佳:分類編纂,具有百科全書與資料彙編二種優點。 規模大:集古代圖書之大成。 內容富:搜集康熙以前政治、經濟、軍事、文化、藝術、 哲學、宗教、歷史、地理、天文、曆法、礦產、 農漁、工技、數學等資料,明代資料保存尤多。 體例善:分類細密,體例完善。 用途廣:檢索某一事物,可得知其源流與歷史上相關資料, 國內外文史、科研界常用。 三、分工:故宮與東吳分段分工,三年完成。 故宮: 拆裝原典 分頁影印 掃瞄成圖 東吳: 圖檔完稿(修正、索引、瀏覽) 文字辨識(ocr、除雜訊) 文字完稿(五校) 登錄資料庫 上網與製作光碟 四、「富蘭克林精神」: 富蘭克林曾做了這樣一個聰明的實驗:他要知道一個分子究竟有多大, 把一點點油倒入平靜無波的池面,然後計算其面積,所得的數值,居然與 現代應用昂貴設備測得的幾乎一樣。這種研究方法被熱那稱為「富蘭克林 精神」。「富蘭克林精神」包括以下三點: (一)經濟:只用少量金錢 (二)創意:運用富於創意的方法 (三)正確:達到科學追求的目標 《古今圖書集成》製成現代人適用的電子版,將遵循這種精神。這工 程如由別人來做,至少要五倍以上的金額。我們沒有那麼大的經費,所以 盡可能用電腦程式來取代人工,譬如本文檔的輸入,我們採用OCR光學 辨識系統,省下大量輸入費。試想一億八千萬字如用人工輸入,至少花上 一千八百萬元,我們那有這麼多經費﹖不僅如此,其他像校對、圖文去雜 訊等,都用程式來做。如果我們不在正確上更進一步要求,幾乎用電腦程 式就可完成全部工作了。 我們的創意也不少,譬如像「活字原版」就是其一。內行人都曉得, 以現代的網路頻寬,要傳一張三百K的圖檔要費近十分鐘,所以一般網路 版便只能文字全文檢索,無法看到原版圖檔資料。但我們有能力解決這問 題,讓網路上使用者看到《古今圖書集成》原版真面目。 大部分的金錢花在追求正確上,有點兒像化學家提煉純粹的結晶,真 有一種奇怪的感覺。 五、既既後未濟: 易經最後二卦是「既濟」和「未濟」,這代表我們中國人對事情的看 法。未來完成了合約是「既濟」,到時只是可以交差,新的工作才開始。 (一)我們還要進行標點、分段。因為整理古籍如不加標點、分段,終 「未濟」,使用價值也低不少。 (二)《古今圖書集成》插圖極為精美,我們會特別加以分類整理出來, 也希望能著色,使它成為非常好的教學參考資料。 (三)這是一部系統分明的古代資料匯編,我們要利用其中資料,整理 出一部「古代分類辭典」。這辭典價值決不在電子版之下。 (四)我們要利用其中資料,依現代百科全書體例,改寫成一部「古代 百科全書」。這百科全書的價值,也不在電子版之下。 (五)這書的資料只到清康熙年間,以後的資料付諸闕如。我們希望把 康熙之後的資料補上去。這工程當然十分浩大,也許再用十年還 「未濟」呢。 以上五項工程,難度與工時一項比一項高。我盼望有人也具慧眼,繼 續支援,使我們一次又一次渡河,走向真正完工。 --待續-- 隨著工作進行,我們將陸續為你報導。