AI讓你更聰明，但真的更有智慧嗎？

2026 年 04 月 24 日2026 年 04 月 23 日 CASE PRESS 井蛙效應, 人智互動, 後設認知

分享至

你的生活是否也離不開AI了呢？是否有種感覺，有了AI之後人人都是各領域的大師了？然而，透過AI的協助獲得各種知識技術與技能的同時，自己本身的能力是否也有所提升呢？研究者透過實驗與問卷的方式進行調查，發現使用AI以後，人們往往都會高估自己的能力，也就是說，透過AI協助人們只是獲得短暫解題的方法，但並沒有真正提升根本的智慧，這或許也是將AI投入學習現場必須小心謹慎的原因之一。

撰文｜王冠云

在科技發達的今日，我們乘著AI之力得以擴展我們的認知能力，提升我們日常生活或是工作上的生產力。不過，當人類使用AI時，究竟AI如何影響了個體的能力，並且是否能讓個體可以勝任資訊決策的工作，就目前為止，我們恐怕對於AI在真實世界的應用，抱持著太過於樂觀的信心。

人類的「後設認知 (metacognition)」能力

「後設認知」指的是人們可以監控、評估、調節我們自己的認知歷程的能力。在人智互動 (human-AI interaction) 的情境中，後設認知關注於兩個方向，一個是內在線索 (internal cue)，一個是外在回饋 (feedback)，當外在回饋變得及時而且不費心力就能取得時，人們就很容易產生「知識幻覺」，也就是以為自己「真得很懂」。所以在AI互動的情境之下，我們很有可能在與AI溝通的過程當中，因為得到了及時的回饋，而讓自己覺得自己真的很有能力。

也就是說，一般人的後設認知所認定的自己的能力，可能會產生「鄧寧–克魯格效應 (Dunning-Kruger Effect)」，低能力的人可能會高估自己，但高能力的人卻會低估自己，中文也可以稱之為「井蛙效應」，也就是並不知道自己在真實世界當中客觀而言的能力應該在什麼樣的位子上。而Fernandes等人 (2026) 正是想了解人類與AI在進行互動的時候，是否會影響到井蛙效應所帶來的偏誤。

不論是低能力者還是高能力者，都以為自己很有實力？

Fernandes等人 (2026) 總共收集了246位實驗參與者來參與研究，他們都是在美國的英語母語使用者，被指定和AI（使用ChatGPT）一起完成20題法律學院入學考試中的邏輯推論題目。在研究者提供的實驗測試畫面中，他們可以一邊使用ChatGPT一邊進行答題，沒有限制與ChatGPT要進行多少對話，並且在20題作答完成交卷之後，需要完成研究者所提供的關於自我能力、科技應用能力的相關評估與測驗問卷。

取得這246位的互動結果之後，Fernandes等人 (2026) 將結果與過往有3543位樣本的非AI互動的真人結果進行比對。總體而言，使用AI互動的學習者，以學習表現而言，確實拿到了沒有使用的群體還更好的成果。不過，不論是AI互動的學習者，還是沒有使用AI的學習者，都會有「過度高估」自己實力的狀況。然而，有趣的是，使用AI的群體，不論實際的程度高低，都會高估自己的實力；但是，沒有使用AI的群體，卻會出現「鄧寧–克魯格效應」——成績較差的學生群，高估自己實力的現象較嚴重，而成績較高的學生群，反而有點低估自己。

與AI對話很淺層，也確實影響了學習者對自我學習效果的評估

另一方面，Fernandes等人 (2026) 也統計了一個數字，也就是大部分的使用者與AI對話的輪數。在同一個問題上，大約46%的使用者只會向ChatGPT詢問1次問題；若是加上詢問2次問題的使用者，總共占了超過8成。於是，研究者也懷疑，大多數的人僅僅使用AI進行非常淺層的問答，而且在進行詢問之後並沒有進行反思，而是直接未經反思就複製貼上答案。

因此，Fernandes等人 (2026) 又進行了第二系列的研究，為了提升參與者的動機，所以加入了獎勵機制，同樣進行法律學院的邏輯推論題目，但是事先告知參與者，將會依照問題回答的正確率提供相應的少額報酬。在這一輪的研究中，總共收集了245位與AI互動的參與者，以及207位沒有和AI互動的參與者。

結果發現，整體而言，使用AI的參與者平均得分高於沒有使用AI的參與者。但是，若考慮到「後設認知」，使用AI的參與者確實會產生若干偏誤，儘管不論低能力者還是高能力者都會高估自己的實力，但是高能力者高估自己實力的幅度，又比沒有使用AI的參與者還高。

總結而言，Fernandes等人 (2026) 指出，研究說明了為何AI使用與不良的學習結果有關，使用者往往過於樂觀，並沒有辦法確實地覺察自己的表現與實際的差距。而使用AI的過度依賴或過度信任，也會阻礙了使用者反思自己實力的能力。不過，由於研究使用的是邏輯推論能力，很有可能使用者本身對於這類型的題目就較為傾向於採取AI所提供的見解。因此，也可能這項研究結果並不適用於其他類型的學習任務。此外，由於研究中發現大部分的使用者只會詢問ChatGPT一次問題，但現實應用時，應該會涉及多輪的對話，理論上而言，應該也會隨著互動程度的不同而影響到學習效果。

參考文獻

Fernandes, D., Villa, S., Nicholls, S., Haavisto, O., Buschek, D., Schmidt, A., Kosch, T., Shen, C., & Welsch, R. (2026). AI makes you smarter but none the wiser: The disconnect between performance and metacognition. Computers in Human Behavior, 175, 108779.

(Visited 419 times, 2 visits today)

分享至

views