分享文章

【何倩彤專欄】怎麼計算亦難料沉迷程度

去年十月,紐約作家Emily St. John Mandel發表了一篇有趣的研究,文章題為〈The Gone Girl With The Dragon Tattoo On The Train〉。她發現「她」的身影老是常出現。在二零一六年的英語出版業間,「Girl」出現次數之頻繁,是二十年來之冠,還有節節上升之勢。她收集了八百多本有「Girl」在標題裡的作品進行研究。數據顯示,65%以「Girl」為名的小說,主角其實已經是成年女性;而如果該書是由男性作者寫成,這個「她」的存活率便會大大降低⋯⋯

讓數字與文字共舞,誰會踩到誰的腳?不少人唯恐理性科學的冷燈會把藝術照得慘白,但也有人樂此不疲。Ben Blatt的新書《Nabokov's Favorite Word Is Mauve》以統計學切入文學,嘗試驗證一些耐人尋味的疑難:哪個作家使用感嘆號的頻率最高?(喬伊斯!)男女作家筆下的男女可有定型?(女人總是在「尖叫」和「打斷」,男人如是說。)小說的第一句往往都是天氣談?(而且總不在晴朗的一天出發。)誰最常以獸為喻?(又捕魚又獵獅的海明威三甲不入。)哪個作家在書封上的大名佔地最廣?(不是史蒂芬・金。)英美的色情小說吐露情慾的方式又可有不同?(原來連德州和紐約也有相異的咸味。)

這些冷知識除了充作趣聞,也不乏嚴肅。把文字化成數據,能使作者本人也未必自覺的寫作習慣無所遁形,讀者的評論不再單純依賴主觀印象,更形言之鑿鑿。統計學更可協助破解歷史懸案──為美國憲法奠基的《聯邦論》(The Federalist Papers),由詹姆斯・麥迪遜、亞歷山大・漢密爾頓、約翰・傑伊三人共同撰寫,史學家一直為了誰寫了哪一個部份爭論不休。但只要我們檢閱個別作者的用字偏好及其頻率,要推算那些文句的源頭,可收立竿見影之效。同樣的方法也可以替我們辨認暢銷作品中幽靈作家的身影,令我們對作家有更公允的判斷。

哈拉瑞在《人類大命運》中說道,未來其中一個關鍵的問題是,無意識但具備高度智能的演算法已經/將會比我們更瞭解自身,人類要如何自處?文學作品被數碼化為可量算的數據,的確使研究和統計的人力和時間大大縮減,但背後仍必須有人先發出有意義的疑問,並為大數據過境後的無差別心得去蕪存菁。

我們也大可把這些數據看作另一個世界的入口。像Anne Carson的詩集《The Albertine Workout》,以散文詩寫普魯斯特《追憶似水年華》第五卷中出現的角色Albertine。詩集就從一些有關Albertine的數據開展:她在807頁出現在他的世界。她的名字出現了2,363次。他愛她的沉睡,而她有19%的時間都在睡⋯⋯這些訊息有何用?或者完全沒有。又或者數字是一種咒語,讓我們的呢喃更精準,也更朦朧。

 

Nabokov's Favorite Word Is Mauve
作者 / Ben Blatt
出版 / Simon & Schuster

何倩彤

藝術家。

Success!

Thanks for subscribing.

13

淺田次郎

16

第九屆九龍城書節:在哪裡看書

12:00nn-8:00pm