歷史書籍的體裁難道就不能再進化嗎?

中國的歷史,從魯國史書《春秋》到二十一世紀,已經寫了兩千五百年,撰寫的體裁由最早的《春秋》「編年體」,慢慢又發展出了以人物為中心的「紀傳體」、如司馬遷的《史記》,最後再演變成為「紀事本末體」、如袁樞的《通鑑紀事本末》,以事件為主軸來呈現歷史的進展。編年體、紀傳體、與紀事本末體三足鼎立了千年,而這三種史書寫作方法,也各有其長處與短處。近代歷史學家偏好接近紀事本末的體裁,如楊天石寫《終結帝制:簡明辛亥革命史》、龔書鐸與方攸翰寫《中國近代史綱》,皆以事件為主。雖然如此,這三種體裁當中,還是沒有一種體裁能單獨取代其他兩種,通常學者會建議學子遍讀這三類書籍,取其之長、來補其之短,這才能將歷史融會貫通,明確了解每件事情的來龍去脈 。

歷史沒有辦法單獨用一種體裁寫清楚,這要怪誰呢?

我想主要是因為,書嘛,它是一個適合線性閱讀的媒體,既然每一句話、每一段字、每一個章節等都要依次續一字排開,那作者不可避免地,只能擇選一個「主軸」,將繁雜的材料依此主軸排序。所以編年體採「時間」為主軸,紀傳體取「人物」為主軸,而紀事本末體以「事件」為主軸。

從一個資訊業者的觀點來看,我禁不住要問:「難道在這個科學如此進步的時代, 史書體裁就不能再繼續進化嗎?」

去年 Al Gore 在 iPad 平台出版了 Our Choice (2011),有些人或許讀過這本電子書,接下來我要討論的東西,相信只要是「用」過此書的讀者,應該不難猜想得到。也許有些人聽說過 Hans Rosling 這個人,那我對中國歷史「研究電腦化」的理想,尤其是針對辛亥革命歷史的研究,大約您也隱約可見。有興趣的人可以參考 Rosling 2009年的演講:「讓我的資料改變你的心智」,有心人還可以比較更早在2006年的演講:「用前所未有的方法詮釋數字統計」。

實際上,要「數據可視化」或「科學可視化」,在這個時代、在iPad 滿街可見的世界裡,並不是什麼難事,但要將歷史書籍搬上如 iPad 這樣的「互動平台」,那就不簡單了。主要的問題出在「數據」上,更正確的說明應該是出在,「沒有數據」的這個問題上。

要彌合「文字歷史」與「數據可視化」之間的鴻溝,乍看下好像挺棘手的,但事實上,這並不是做不到的事情。以下嘗試解釋我對這個問題的一點小看法。

第一,我們可以先剖析「史學」到底是在講什麼。以現今史學家普遍喜好「紀事本末體」的情形來看,我們可以說歷史,便是許多大大小小的「事情」,依據時間、因果等因素,把它們排列整理,就是了。那「事情」又是什麼東西呢?如何把它數據化呢?

如果以一個語言家的觀點來看,所謂「事情」,便是「某人」對「某他人」在「某時」於「某地」以「某方法」為了「某目的」「做了某事」,用英文就說:Who Does What to Whom, When, Where, How, and Why?在這幾個「某東西」裡面,有三種是可以數據化的,那就是我們的先祖已經給我們啟示過的、相信大家都耳熟能祥的「天時」、「地利」、與「人和」。

時間能夠數據化,這也就不須浪費口舌來解釋了,但「地方」如何來數據化呢?不就是把每個事情發生的地方,於兩度空間的地圖上畫出來嗎?也可以把參與某事件的人物,依他們各自成長的家鄉,拿大頭針在個地圖上釘出個位置來,如此,我們將各個地方以兩個數據在笛卡兒坐標系統上表示出來。接下來,每兩個地方之間,可以採取在通訊上、交通上、方言不同上、與族類差距上的距離來畫長短不同的連接線、做出各樣的「網圖」。將「地方」以最小單位、如鄉鎮等數據化後,可以聚鄉鎮為城市、聚城市為州省、聚州省為大區域(如中國東南方)等,成為不同基本粒度單位的「群體」。各種單位的群體圖,加上各種不同的距離度量,可以運用排列組合的原理,來畫出更多的網圖。如果將這些圖畫用動畫方法顯示出來,那又可以看見更多原始資料裡不存在的衍生訊息。

同樣的,「人」與「人」之間的關係也可拿來畫網圖,比如敵友關係,可以用正數代表友善程度,負數代表敵對程度。更可以運用方言不同、族類差距、教育程度懸殊等因素來類聚,產生可分析、可顯示的數據。以血緣、師生、主僕、同事、買賣等關係,又可以產生更多的資料,用來畫網圖或群體圖,甚至將兩種圖畫在一起,成為「數據聚類」圖,來顯示如這樣的社會性網路人際關係。

表面上看起來雖然不怎麼有用,實際上運用數據化的地圖、網圖,通過互動式的使用者界面來顯示不同程度的群體,可以讓一個原是史學圈外的人,在很短的時間內,頓悟出歷史學者花了大半人生才發掘出來的歷史關鍵。從2010年起,依據以上講的歷史分析原理,我開始將辛亥革命的歷史資料分門別類,把各種大小事件拆散成人物、人際關係、群體、發生時間、地點等,再將之輸入電腦資料庫。不久我便發現了許多有趣的故事,通常是在書籍裡讀不到的。比如只要將革命人物依家鄉分類,可以看見幾個大群體,如廣東、香港、福建、湖南、湖北、江蘇、浙江、安徽、四川等,如以方言地理再類聚,產生廣東團、兩湖團、與江浙團體。把人與人之間在事件中的聯繫關係畫成數據聚類圖,如留日學生辦刊物、抗俄等活動、國內起義活動等,顯示出來的群體,竟然也與簡單的家鄉分類圖相似,很顯然的,共同的方言與成長環境,在革命團體裡是個重要的內聚因素。

如果資料庫裡有充足的群體資料,如各學堂、書院等師生的名單與在學日期,可用歐拉圖來顯示各群體之間,因成員相同而互相重疊的關係 。舉湖南長沙的「嶽麓書院」、「時務學堂」與來說就好了,比較書院學堂的成員、畫歐拉圖,再比對網圖,可以發現唐才常、譚嗣同與熊希齡在「維新運動」裡的啟發貢獻。再加入「南學會」、「萬木草堂」、(設於日本的)「大同學校」與「高等大同學校」,可以發現將整個湖南維新界引進康有為的大同世界裡,是梁啟超的功勞 。再加上「自立軍」,又發現(最後被康有為出賣的)自立軍根本便是由當初「時務學堂」的一群熱血青年(蔡鍔、劉揆一、秦力山、林圭等)與他們的導師唐才常發起的。加入「三合會」、「興中會」、「興漢會」等,很清楚地可以看見畢永年是聯繫康有為、唐才常與孫文的中心人物。加入「湖北武備學堂」、「拒俄義勇隊」、(日本)「陸軍士官學校」、「丈夫團」等,可看出吳祿貞在新軍、留日學生、「自立軍」與「興中會」中的重要地位。加入「軍國民教育會」、「華興會」與「同盟會」,發現當初讀「嶽麓書院」的陳天華是留學生革命運動的啟蒙人。加入「同仇會」、發現劉揆一的革命人生,從「拒俄義勇隊」、「華興會」、「同仇會」、到「同盟會」,都是與黃興並肩共戰一路走出來的。加入「科學補習所」、「日知會」、「軍隊同盟會」、「群治學社」、「振武學社」、「文學社」等、才知道原來黃興的學生、「華興會」會員胡瑛是「武昌起義」的幕後指揮人(當時人在監獄),也是「同盟會」與武昌革命人之間的主要聯繫人。

以上所舉的例子,只是革命歷史中的一小部份,忽略了孫文的黨人、江浙革命人、與其他人的貢獻。上述的歐拉圖、網圖等,如果再加上孫文與日人的群體,可以看見海外華人、日人與洋人在辛亥革命裡所扮演的角色。再加入江浙黨人,如「光復會」等,可明白看見一開頭所提的、所謂廣東黨人、兩湖黨人與江浙黨在革命歷史與「同盟會」裡三分天下的事實,更可以清楚的看見黃興的偉大情操。黃興柄棄個人成見,不像其他革命人搞同鄉小圈子,為了遠長的理想,他配合、支持與捍衛孫文,用他的領袖魅力,將兩湖黨人與廣東派拉合,成為一股強大的力量。武昌起義後不久,黃興到達武昌,革命人騎馬舉旗、上寫三個大字:「黃興到!」用以振奮人心,這是有道理的。

諸如以上的發現,當然在這百年來,也有許多學者指出。再說,如果不是史書裡先把重要人物指點出來,上述學堂、組織由上百、上千人組成,我要電腦存檔、數據可視化,也不能這麼方便簡單。不過話再說回來,應用新科技來研審千萬學者已經翻遍了的史料,還是能找出被前人忽略的史實。

在我開始將辛亥資料存檔於資料庫裡不久,就發現了一個很特殊的人物。如前所提,我先將歷史資料拆散成時間、人物、地點、群體、物件等元素,以便能依照我制定的規格輸入電腦資料庫。有了基本資料,再將分散的片段拼湊回來,以全新的面貌呈現出原先的歷史過程,所使用的「黏膠」,就是通常我們稱為「事情」的那個東西。假設我們用「多維度」的歐幾里得空間來代表「事情」,將全部的資料元素如時間、人物、地點等,排列在不同的空間軸上(有些因素可使用多於一個以上的空間軸或維度),那「事情」就是在這個多維度空間裡的「固體」,它的形狀可能因人物分散各地而扭曲。如果一個固體在時間軸裡某一段時期中,於人物軸上分裂成兩個個體,我們說,「這運動起了內鬨」,於地點軸上分裂,我們說,「他們在兩地分頭進行大事」,但如果固體在時間軸上的某一點終止,那就是「沒戲唱了」。用這個觀點來察看歷史,各事件的前因後果馬上就顯露出來;只要觀察多維度空間許多的固體如何互動連接,便是了。

在我將資料一一存檔的過程中,有一個人的名字每過一陣子便出現一次,但通常在書裡都是輕描淡寫地揭過,一開頭我既然看不出這人在歷史洪流中有什麼緊要角色,也就經常省略了此人的資料。有一天又讀到了這個名字,一時興起,以這個人在多維度空間裡,依著時間軸所畫出來的一條線隨便察看了一會兒,不料竟然看出了個所以然來。在整個清末民初的歷史中,有很多大人物,立下了很多顯赫的功績,但沒有一個人從年輕時與「太平天國」打交道開始,連續參加了「洋務運動」(自強運動)、「戊戌維新」、「君主立憲運動」、「興中會革命」等活動。在辛亥前夕、清末六十年之中,每一個最重要的運動裡,都有他的足跡。這個「太平天國」時代的人,一生奉獻、致力於中國的建設,最後,老天讓他在有生之年,看見了孫文就任中華民國第一任臨時大總統。如果我沒有追毛求疵的將資料「存檔」、搞「數據可視化」,很可能我會忽略了這個人。

下回有時間,再講這人吧。

作者:辛亥生
發表日期:2012年3月5日
最後一次更改:2012年3月10日

About Xinhai Dude 辛亥生

The name Xinhai Dude 辛亥生 is a pun in Chinese, as it means both “he who was born in Xinhai” as well as “he who studies Xinhai”. I had an ambitious plan to write something about the great Xinhai Revolution of 1911, thus my blog https://xinhaidude.com. But after an initial flurry of activities the initiative petered out. One day I will still carry it through. But for now, this website has turned into a conglomerate of my work on various topics of interest to me, including travel pictures, RC model airplane flying, ice skating, classical music composition, science fiction short stories, evolution and atheism.
This entry was posted in 辛亥革命研究, 辛亥革命書籍 and tagged , , , , , , , , , , , , , , , , . Bookmark the permalink.

6 Responses to 歷史書籍的體裁難道就不能再進化嗎?

  1. Wayne says:

    I just read some where that the Chinese Communist Party spend more on domestic 维稳 than on China’s national defense. Which means that you can use powerful computers to monitor all the chatters, but in the end it is still very labor intensive to “data mine” all those collected information, and not to mention the man power it requires to react to all those possible threats.

    • 辛亥生 says:

      The idea is to develop software that can make connections and rank events based on the level of human intervention required. If the software is good enough, little human reactions are needed. Only the events that truly warrant human eyeballing are called out by the computer.

      • Wayne says:

        By now, I think the terrorists had move all their communication activities “off the grid” and will try to leave as little electronic or cyber foot prints as possible. But, how would a computer program deals with cryptic conversation such as
        put the “package” on the “bird” ?
        Where the word “package” and “bird” means something else.

        • 辛亥生 says:

          The artificial intelligence field has advanced greatly in the past decade. I am sure IBM’s Watson will be able to parse that sentence and piece together a semantic meaning that makes sense. The key to a useful AI is the ability to adapt to changing language uses. I am sure Watson can over time figure out code names based on context.

          But note that what I am doing is quite different from that needed by Homeland Security or the Chinese Communist Party. I am just trying to painstakingly enter data as I interpret them from books into a huge database, and make connection graphs.

  2. Andrew says:

    Very much like what is being developed at Dept of Homeland Security.

    • 辛亥生 says:

      Ah, that is completely right! Do you think they’ll open source their event analysis and visualization software? Surely they have been monitoring and analyzing social media; all interactions are conveniently presented already in structured forms that they can categorize programmatically, store away and data mine later. To take it to the next level, though, they need to deploy natural language processing to parse out useful information from emails, etc. But for that we’ve already got the IBM Watson.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s