【書評介紹】電腦/語言:模稜兩可的含混之美
。「溫暖的天氣有多暖?貧窮線應該怎麼劃?你跟昨天的你是同一個人嗎?」蘇格蘭亞柏丁大學的電腦語言學者狄姆特在他今年二月出版的書中,橫跨邏輯、語言學和人工智慧,討論語言「曖昧性」。程度與概率比起清楚的二分法更符合實際,狄姆特認為電腦語言的趨勢是讓電腦也能跟人腦一樣判斷曖昧的語句。
《Not Exactly: In Praise of Vagueness》
作者:齊斯‧馮‧狄姆特(Kees van Deemter)
出版社:牛津大學出版社,2010年,368頁?
定價:16.99英鎊
?
科學家總在努力釐清觀念、增進量測準確度,但是模稜兩可往往才是促成新思想的推手。模糊的物種概念使得年輕的達爾文開始思考演化的可能。而克里克回想從前,他和華生若在一九五〇年代就想嚴謹定義基因,分子生物就不會有所進展。克里克在自傳中寫道:「科學的尖端研究撲朔迷離。」甚至到了今天對於基因的定義仍無共識。
《模稜兩可的含混之美》(暫譯)一書探討各種含混不清的現象研究。電腦科學家狄姆特認為,精確的定義也許沒有意義也不合邏輯。八〇年代狄姆特在飛利浦公司發展會自動與人對答的機器,研究人工智慧的經驗讓他體會到,要讓電腦像人類一樣說寫有多困難。他在書中針對模稜兩可舉出邏輯、語意和哲學上的觀點。
比起程式語言,一般人所說的自然語言充滿曖昧不明的語意。英文中「大」(large)這個形容詞用在蜘蛛、大象或星球上都沒問題,說話的人依據上下文決定自己的意思。依照狄姆特的定義,「大」就是個含混的觀念,因為這個字「沒有明確的界線」。雖然「肥胖」有好一點,還是不夠精準:太瘦、剛好、太重、肥胖的界線難道不是因人而異?
界線對於精準描述有其必要,但界線的定義卻不一定有邏輯。書中花了很大篇幅討論堆垛悖論(sorites paradox)的各種分支。堆垛悖論是一個古希臘的難題,問的是沙堆(soros為希臘文的沙堆之意)的大小。一粒沙不成堆,兩粒沙不成堆,若依照亞里斯多得邏輯和布林代數(Boolean algebra)的理論,一個論述非對及錯,那不管你加上多少粒沙都不成堆。沙堆的界線無法按古典邏輯學定義。
同樣的,一個東西就算歷經多次改變也不會失去原本的身份。一九九〇年倫敦一個高等法院有一個案例,一個名貴跑車的賣家告買方取消交易,原因是車子替換太多零件已非真品。法官判決賣方勝訴,因為「新的零件在長時間內緩慢替換,已被內化為整體的一部分,車子並未失去本身價值。」
狄姆特認為,就算修正古典邏輯學也無法成功解決堆垛悖論。與其採用非黑及白的命題,我們需要的是定義從零到百分之百「真實度」的邏輯方法。
這種分級定界線的方式有助於人們下決定。作者說了一個故事:中國皇帝的鑽石被偷了,小偷是一千名太監的其中一個。唯一的目擊者只來得及說出「小偷很高」就死了。皇帝要怎麼抓小偷呢?古典邏輯學會將嫌疑犯分成高或不高兩群,只在比身高超過平均值的那群太監中搜尋。採用「真實度」邏輯的作法或許可以更快找出犯人;小偷越高,證人越可能用高這個形容詞,所以應該從最高的人開始往下調查起。
若有多種限制條件,「真實度」的高低就需用更多邏輯判斷。這種「模糊的邏輯」在資訊科學領域很常用,例如協助醫生診斷的自動系統。但狄姆特又說,這些組合方式仍是採取非黑及白的假設,「模糊的邏輯」搞不定自然語言中所有不甚清楚的地方,也拿「堆垛悖論」沒輒。
雖然作者在書中點綴了生動的小說筆觸,本書對於沒有程式語言經驗的讀者仍有些艱澀。不過這本書成功傳遞它的主旨;日常對話中我們需要更多含混不清的空間,而不是程式語言中「錯誤的精確度」。在科學領域中,有時模稜兩可有其好處,特別是電腦若想有天能通過圖林測試,顯示具有人類的智力,還需多多拜「似是而非」為師。
?
原載於【知識通訊評論月刊八十九期】2010.03.01???????????????????????????????????????????????????? ?CASE網誌好讀版 by MissZoe
延伸閱讀:Dominic Hyde's Sorites Paradox(The Stanford Encyclopedia of Philosophy)、Not Exactly: in Praise of Vagueness 介紹頁面
當唯一的目擊者說小偷很高時,應該加以考量目擊者本身的身高...