語意網:電腦也能看懂(1/3)

語意網:電腦也能看懂(1/3)

撰文/Tim Berners-Lee、James Hendler & Ora Lassila|譯者/高虹|審訂/黃居仁
轉載自《科學人》2002年8月第6期

一種新的網路內容形式,能讓電腦理解其中的語意,勢必帶來新一波網路革命!

電話鈴聲響時,音響系統正大聲播放著披頭四的歌曲。皮特拿起電話後,電話機給室內所有帶音量控制的設備發了個訊號,聲音就降了下來。原來是他妹妹露西從醫生的辦公室打來:「媽媽需要看專科醫生,然後要連續做幾個物理治療療程。大約要一週兩次。我要讓網路代理(agent)安排一下預約時間。」皮特馬上同意負責開車接送。

露西在醫生的辦公室裡,用可攜式網路瀏覽器給語意網(Semantic Web)的代理下了指令,它迅速從醫生辦公室的網路代理取得了母親的處方治療資訊,並開始查閱幾份物理治療所的名單,找出母親住處方圓32公里內,所有母親保險特約物理治療所中評鑑者。網路代理從各個物理治療所網站代理取得可預約時間,並開始與皮特和露西兩人緊湊的日程中尋找能配合的時間。(紅字表示其語意已由語意網為網路代理下了定義)

幾分鐘內,網路代理就提了個方案。皮特不喜歡這個方案,因為大學醫院離母親家很遠,在城的另一邊,而且他回程時還會碰上交通尖峰期。他對時間地點做了更嚴格的限定,讓自己的網路代理重新預約。露西的網路代理,在這個任務上完全信任皮特的網路代理,因此露西的代理會自動協助它,提供路徑許可和捷徑,讓它擷取之前搜尋到的資料。

新的方案馬上就出現:診所的位置較近,時間也提前了。但有兩點必須注意:第一,皮特需要更改幾個較不重要的約會。他查了一下,結果是「可以改,沒問題」。另一問題是,該診所不在保險公司簽約的物理治療師名單中。代理保證「服務形式和保險問題有其他方式解決」,並提供查看詳情的按鍵。

就在皮特嘀咕「詳情就免了吧」的同時,露西已同意掛號,大功告成。(當然,皮特還是忍不住看了詳情,他的網路代理也在當晚解釋了如何找到不在名單中的診所。)

表達意義

皮特和露西能用他們的網路代理完成上述工作,仰賴的不是今天的全球資訊網(WWW),而是明日逐漸形成的語意網。現在網上內容大多只能讓人類讀懂,電腦程式不了解其中的語意,無法處理這些網上內容。雖然電腦能夠輕易從語法來分析網頁的版面設計和例行性程式,如找出標題或網頁連結的位置等,但總的說來,它沒有可靠的方法來處理語意,像是「這是哈特曼和斯特勞斯物理治療診所的網頁」、「這是連到哈特曼醫生簡介的連結」之類的。

語意網將把網頁有意義的內容結構化,以此建立一個環境,讓網路代理可以在網頁間漫遊,完成使用者交付的各種工作。這樣的網路代理來到診所網頁時,將不僅知道網頁上有諸如「治療、醫學、物理的、療法」等關鍵詞(這些目前網路已能做到),還會告知哈特曼醫生在診所看診的時間是星期一、三、五;網頁程式接受的日期排列格式 yyyy-mm-dd,以及傳回排定的預約時間。而且,這些網路代理「知道」這一切內容的意義,並不需要人工智慧,不像「2001:太空漫遊」中的HAL或「星際大戰」中的C-3PO那樣。診所經理連基本的電腦課都沒修過,僅用編寫語意網頁的現成軟體,加上物理治療協會網站提供的資源,就能成功把上述語意編碼上載到網站上。

語意網並不是另一個獨立的網路,而是當前網路的延伸。語意網上資訊的意義已經明確定義(well-defined),讓人機之間能有更好的互動合作。把語意網織入現有全球資訊網結構中的工作已經展開,不久之後,這些發展將開發出更多嶄新的網路功能,使機器能進一步處理並「理解」資料(目前機器只能單純「顯示」資料)。

通用性是全球資訊網的基本特性。超文件連結的威力在於「任何東西都可以相連」。因此,網路技術對各種內容不能有差別待遇:塗鴉的草稿和精緻的完稿、商業資訊和學術資訊,或不同的文化、語言、媒體等,統統一視同仁。資訊對於不同的主體會有不同的意義,其中供人使用的資訊與供機器使用的資訊就大不相同。對人而言,資訊可以是五秒鐘電視商業廣告或詩歌;對於機器則可以是資料庫、程式和感應器的輸出。至今,網路已是飛速發展的文件載體,卻未能自動處理資料和資訊,語意網的目標就在於補此不足。

如同網際網路(Internet),語意網將盡可能分散開來。這種網路系統,會讓大小公司到個人用戶都興奮不已,更將帶來難以估計的利益。分散式架構的缺點就是:網路必須放棄保持所有連結完全一致的理想,於是臭名昭彰的「錯誤404:沒找到」就難免會大量出現,甚至呈指數增長。(待續)

(本文由教育部補助「AI報報─AI科普推廣計畫」取得網路轉載授權)

(Visited 1 times, 1 visits today)
views