【AI嘉年華】AI於各種社群網路中的巧妙應用

講師|成功大學數據科學研究所助理教授 李政德
彙整撰文|楊于葳

全球資訊網(WWW)的誕生,讓我們與世界更緊密的連結在一起。無論是平時生活中的臉書社群,電影界演員之間的合作關係、或者是專家學者們在學術論文的引用,如果我們把每一個人都設定成點(Node),人與人之間的各種關係視為邊(Edge),那麼真實世界的網路經過視覺化呈現後,就會宛如人類大腦裡神經元,神經元彼此之間連結時所構成的圖像,看似一團混亂的網絡,實際上存在著某種規律與秩序。

●六度分離的世界

1967年,社會心理學家 Stanley Milgram,利用實體信件遞交的方式,從Omaha到Boston,進行一場「小世界實驗」。實驗結果發現,在296實驗對象中,有64人成功間接遞交至目標,也就是說,人們平均只要透過6個人,就可以和另外一個人成功連結關係。除實體信件以外,網路網路中的各種社群網路的數據分析結果同樣顯示著小世界的存在,如E-mail、MSN、Facebook等。這些實驗結果意味著小世界真的存在,平均只需4~6步就能夠連結網路中的任意二人,且無關乎網路大小,他們存在於各種社群網路中,這隱含了資訊得以快速於社群網路中散播,也部分解釋了當資訊是一種傳染病,將很有機會快速且廣泛地在全球擴散,其背後意義值得我們反思。

 ●偏好依附法則

然而,如何解釋社群網路從何而來?為什麼會具備小世界等性質?其實在AI快速發展之前,《新約聖經・馬太福音》與老子的《道德經》,兩本著作中就有揭露社群網路形成背後可能存在的法則。

《新約聖經・馬太福音》第13章第12節:「凡有的,還要加給他,叫他有餘;凡沒有的,連他所有的也要奪去。」

老子《道德經》第77章:「天之道,損有餘而補不足。人之道則不然,損不足以奉有餘。孰能有餘以奉天下,唯有道者。」

舉例來說,新進一個社群網路的使用者傾向和朋友數多的人交朋友,像是網紅效應與名人效應,在寫論文時,我們引用的參考文獻容易偏向是引用次數較高的論文,就如同經濟學家 Herbert Simon 所說的「富者愈富」,因為人們不知不覺中遵從了「偏好依附法則」。基於偏好依附法則,我們透過新的小點匯集加入,點與點之間融合而轉變成大的聚落,如此解釋了社群網路的另一個重要性質「朋友數冪次法則」,即極少數人擁有很多朋友,多數人認識的人相對很少。

●社群網路中的人工智慧

李政德老師展示他們在成大的資料工程與人工智慧實驗室(DEAR Lab)應用人工智慧於社群網路的具體實例,可分為兩大類,第一類是以人為主的社群網路 (Homogeneous Networks),典型AI於社群網路之應用,例如使用者標籤預測與分類、推薦系統、假新聞偵測、病毒式行銷。第二大類萬物皆可表示成網路 (Heterogeneous Networks) ,AI於其中之應用例如恐怖分子偵測、共享帳號偵測、個體行為側寫、感測環境保護。

●以人為主的社群網路(Homogeneous Networks)

一、使用者標籤預測與分類

李老師團隊所開發的此項應用,即是用已知社群網路中某些人的標籤,預測其他未知標籤者的標籤。例如下圖,社群網路中有些使用者已確定罹患某疾病(藍色),有些則確定未罹患該疾病(綠色),透過AI我們能夠預測使用者6號到10號的黑點是否為罹病患者,基本概念是透過擷取社群網路各種使用者特徵(例如朋友擁有各種標籤之分布),佐以機器學習中的非監督式學習方法後,即可以精準的判斷出哪些人確定罹患某種疾病,如圖右所示使用者6、7、9被預測為沒有罹患該疾病,使用者8與10則為罹病患者。

二、推薦系統

推薦系統主要是預測哪些「互動關係」在未來會發生,例如Facebook朋友推薦,AI系統可準確預測出,哪些人真的是你的朋友,但你還沒有加他為好友,或者是你未來有機會能和這位朋友互動,其背後的基本想法是讓機器去學習兩位使用者為何會形成朋友關係,機器可能學到他們有許多共同朋友、經常出沒在類似的地點等特徵。另一項與生活息息相關的例子,正是Netflix電影推薦,依據使用者平時觀看哪些影片的歷史紀錄,佐以資料探勘中的協同式過濾方法,進而預測出使用者未來可能感興趣的影片。

三、假新聞偵測

社群媒體中,假新聞流竄的頻率越趨頻繁,然而憑藉著人腦判斷假新聞與否,是件相當困難的事。例如曾有一則新聞寫著:「美國科羅拉多州的麥當勞餐廳,設置一個大麻吸食區」,透過常識判斷,美國部分區域大麻合法化,因此這件事情看似很合理,會讓很多人會相信這件事情是真的。根據研究顯示,75%使用者會對假新聞信以為真。李老師團隊所開發的AI系統,可以根據新聞擴散結構、新聞內容與用戶回覆內容來偵測假新聞與否。AI學習到假新聞的線索可能包含較為淺短的社群網路擴散結構、試圖讓人信以為真的用字遣詞、以及使用者對該新聞的情感隨時間的變化。

四、病毒式行銷

病毒式行銷指的是公司透過免費試用品或折價券的行銷手法,搭配招募具意見領袖效果的種子用戶,在人際網路中進行向朋友推薦商品,也就是所謂的口碑行銷,使得商品資訊於社群網路中擴散,最大化讓對該商品感興趣且有意願購買的人,來達到促銷商品的目的。李老師團隊讓AI介入病毒式行銷的方式是從使用者過去貼文內容與分享歷程中,學習出每位使用者感興趣的商品主題,進而預測每位用戶的社群影響力,即能吸引多少人前來購買該商品,讓公司能在有限預算下,招募最有影響力的用戶作為意見領袖,來最大化病毒式行銷的效益。

●萬物皆可表示成網路(Heterogeneous Networks)

一、恐怖分子偵測——異常行為偵測

想找出恐怖分子,必須先思考恐怖分子跟一般罪犯在行為上有何不同之處,換成另一種資料,在 IMDB電影網路中,知名女演員梅格萊恩(Meg Ryan)和其他女演員比起來有何特別之處?首先,我們要視覺化梅格萊恩社群網路,李老師團隊透過AI去分析,區分出梅格萊恩的正常行為與異常行為,結果發現梅格萊恩這位女演員很喜歡演翻拍的電影,如果只憑藉肉眼觀察,我們很難發現其中的差異。同理,在一個犯罪網路中,裡面很可能夾帶巨量且複雜的個體行為資訊,我們可以透過AI自動辨識出個體在網路中的異常行為,若一罪犯之行為與其他人比起來很不同,那麼他是恐怖份子的可能性應該不低。

二、共享帳號偵測

須付費線上多媒體服務如KKBOX與Spotify都有多人共享帳號的問題,以往我們只能以帳號的角度去分析使用者的喜好,進而推薦該帳號音樂,但一個帳號下若存在多位不同音樂偏好的使用者,將使得音樂推薦的使用者經驗大幅下降。李老師團隊透過AI從每一帳號之音樂聆聽歷程中,自動偵測哪些帳號有多人共享,預測一個共享帳號有幾個人共享, 還可以即時偵測當前帳號是哪一位使用者,讓AI在進行音樂推薦時,能精準地從使用者的角度做出推薦,甚至連該帳號其中一位使用者在不同情境下聽音樂習慣都能學習到,做到兼具個人化與情境化的音樂推薦。

三、個體行為側寫

目的在於了解個體行為與個體間的互動,社群網路中的個體經常會有群聚現象,就如同每位使用者在家庭、大學同學、工作夥伴等不同社交圈,每個小圈圈群體內部通常會有較為緊密的社群互動,而群和群之間的互動關係則相對很稀疏且不頻繁,透過AI找出哪些個體屬於同一群體,可應用在各種類型的網路,帶來不同的應用。譬如在人際網路中,我們可從群體中推估使用者喜好;在犯罪網路中,可從群體找出犯罪同夥;在股票共漲跌網路中,可推薦能帶來獲利的投資標的;在企業合作網路中,可了解公司間的競合關係;甚至在大腦組織細胞網路中,AI可偵測大腦各功能部位。

四、感測環境保護

AI搭配網路結構,還可應用於環境保護。譬如給定某一城市的下水道網路(每個住家或工廠是點,地點間若存在下水道管線則彼此建立連結),以及歷史汙水擴散資料,我們可透過AI找出汙水感測器該設置在哪些地點,才能使得汙水能夠在污染擴散到最大以前,能儘早被偵測到,讓污水感測器能發揮最佳的效果。其基本想法是讓AI根據地面上地點鄰近區域的地點類型分布、地形地貌、人口分布狀況等資訊作為特徵,來評估每一地點產生污染之機率,並同時從下水道網路中預測每一地點一旦被汙水流過所帶來的擴散風險,兩相結合預測地點搭建汙水感測器的效益。如此將可協助相關政府部門佈設汙水感測網路,達到環境保護的目的。

 

--
本文整理自:107/12/16由李政德老師在臺大思亮館國際會議廳所主講之「大數據中的小世界:連結你我的社群網路」演講內容。

加入好友

1,282 人瀏覽過