本刊官方網站:
http://cjjc.ruc.edu.cn/
摘要
驗證碼(又稱逆向圖靈測試)似乎成為當前網際網路使用者註冊、登入和執行某些操作的必要程式。儘管已有批評者指出驗證碼設計給特殊人群帶來的識別和輸入等障礙,當前卻鮮有研究從技術哲學的角度解構這種驗證機制的技術本體論。驗證碼技術展示了一類人機互動的關係倒轉情境:計算機從作為“他者”的技術,搖身變為對人提問的考官,甚至開始界定和拷問人的本質,人則從“主體”蛻變為技術的“他者”。本文引入技術哲學和技術現象學相關理論,討論逆向圖靈測試如何介入並影響了人對於“人是什麼”這一問題的回答與實踐。文章分析了“我驗故我在”人機互動隱含的身體觀和能力主義(ableism)預設,以現實案例揭示逆向圖靈測試的發展如何進一步將人制造為技術的“他者”,擴大了能力主義隱含的否定辯證法(negative dialectics),最後透過展示“缺陷”和“連線”的技術方案,討論去能力主義(dis-ableism)的可能性。
作者簡介
謝卓瀟,南京大學新聞傳播學院助理教授。
蔡聰(通訊作者),中國社會科學院大學傳播系博士生。
基金專案
本文系國家社科基金青年專案“移動性視角下視障者的無障礙傳播現狀及其對策研究”(專案編號:22CXW010)和“2024年中國社會科學院大學研創基金:脆弱群體數字生計的協同演進與環境協商(專案編號:2024-KY-142)”專案的階段性成果。
“完成驗證碼來證明你是人而非機器”是大多數上網者需要應對的日常。具有視力、聽力或智力障礙的網民時常因無法辨識及完成驗證而被機器告知:“我的演算法認為你不是人類”,使得被剝奪尊嚴和被歧視的感受如影隨形(Nakamura, 2019),面對機器越來越有難度的詢問,普通人對驗證碼的抱怨也越來越多,網路中“奇葩驗證碼”的戲謔討論不絕於耳。相反,ChatGPT等人工智慧不僅作為考官隨時可能質疑網路使用者的主體性,還可以動用其他的人工助手來破解機器自身暫時難以解答的題目,譬如冒充視障者向他人求助(方曉,2023),在驗證與被驗證的兩端考驗著人類的存在。
本文認為,驗證碼技術的產生、發展與使用體驗過程中,人機互動經歷了多番博弈,這種較量背後暗含著技術等級劃分和能力歧視。視障者等存在身體“缺陷”的群體在其中的遭遇,則揭示出驗證碼技術背後人類共同面臨的“能力”悖論。本文從驗證碼這種最為日常的人機互動實踐出發,討論“我驗故我在”的驗證機制所隱含的身體觀和設計者對人類獨特能力的想象,進而省思人機關係設定背後的技術哲學問題。
一
我驗故我在?從質詢“人性”到
生產“新人類”話語
驗證碼(CAPTCHA)是Completely Automated Public Turing test to tell Computers and Humans Apart(全自動區分計算機和人類的圖靈測試)的縮寫,指一種區分使用者是計算機與人的公共全自動程式,目的是防止使用自動化指令碼、機器暴力破解密碼、刷票、論壇灌水等被視為惡意的行為。與人向機器提問來判斷其心智的圖靈測試過程相反,驗證碼透過機器向使用者提問,從而分辨出答題者是人還是機器,因此又稱逆向圖靈測試。
20世紀90年代,對於非法使用者註冊等行為,許多大型的基礎服務(meta-services)不堪其擾,雅虎郵箱為了阻止垃圾郵件,與密碼學專家路易斯·馮·安(Luis Von Ahn)合作,首次引入圖形化驗證碼。他指出,驗證碼的核心就是創造一種AI密碼學:“容易被人類解答,並且讓機器無法解答”的最佳程式(Von Ahn,Blum,Hopper & Langford,2003)。這也成為網路人機攻防戰的底層邏輯。
隨著智慧化趨勢加速,逆向圖靈測試的設計者和使用者陷入了實踐悖論:第一,CAPTCHA提出的問題要容易被人類解答,並且讓機器無法解答。第二,人希望機器在能力上發展到接近人類,甚至超越人類,但驗證碼填寫時卻相反。第三,人與機器的區分基於健全人身體“能力”為操作前提,不具備“健全人”的視覺、聽覺和智識的人,很容易被排除在人和機器二分的想象之外,而事實是越來越多“健全人”無法透過驗證碼的考驗。簡言之,驗證碼的設計顯示了設計者對機器不能做什麼與只有人類能做什麼(人的獨特能力)的想象。前兩者屬於技術導向的矛盾,科技領域一直在力圖調和。第三個悖論則更為隱性,卻是在崇尚技術進步的時代所有自許為人者面對的恐懼和危機:人無時無刻不處於被機器非人化判定的風險之中。
(一)智慧化的人機互動介入“人性”省思
驗證碼在呈現方式上雖與一般意義上的人機互動形式不同(例如生成式的人工智慧、聊天機器人),然而程式設定計算機“向人提問—獲得反饋—作出判斷”的模式實際上具有人機互動的基本特徵。隨著計算機智慧化發展關於人機互動中“人與非人”的區分、人與“非人”的人工生命(artificial life)之間交往協作的討論日益普遍。學者們意識到,當前人機互動中人工智慧透過大語言模型的海量資料學習,愈加接近普通人的言行和思考模式,塑造了新的“常人”(劉海龍,連曉東,2023),機器模擬的人類心智慧力帶來了非人化的恐懼,和對人性價值的省思(杜駿飛,2023;彭蘭,2023)。語言系統的混合使得機器像人一樣說話,人像機器一樣說話,則更進一步使人類深陷自我認識的危機(王沐之,胡翼青,2023)。
人與機器的能力差異問題隨著智慧技術的發展愈加受到關注,人機互動則提供了更多理解機器“智慧”的方式和省思“人性”的情境(胡泳,2024;彭蘭, 2024),本文關注的驗證碼也是其中之一。在人工智慧的研究派系中,圖靈測試基於符號主義理念,認為如果機器模擬的人類語言不能被人類所察覺,那麼就可以認為這個機器表現出了等同於人類心智的能力(Turing,1950)。當前人工智慧主流學界基本沿襲了近代西方的理性主義哲學(如霍布斯、笛卡爾、萊布尼茨等)對人類心智活動的基本假設,認為人類或機器的智慧從原子化、形式化、邏輯化的抽象層次上看可以類比(王穎吉,2018)。然而,在《計算機不能做什麼》(What Computers Still Cant Do)一書中,休伯特·德雷福斯(Hubert Dreyfus)(1979/1986:214-233)批判了圖靈追尋者的人工智慧構想,以及背後對人性的預設。他認為,早期的符號主義人工智慧一派是西方理性形而上學遺產在當代科技領域的運用(王穎吉,2018)。此類哲學觀隱含了身心二元的預設,因為根據確定的規則和形式邏輯加以符號化操作和模仿人類心智的人工智慧模型忽略了軀體在智慧行為中的作用。
本文結合更廣泛的技術社會語境來認識驗證碼這一日常化的計算機程式背後的 技術思想。儘管已有批評者討論了驗證碼給特殊人群帶來的識別和輸入等障礙,當前卻鮮有研究解構這種以機器向人類提問來確認使用者是真人還是計算機的驗證機制的技術本體論。因此,本文從驗證碼的案例出發,思考人機互動過程如何影響或者介入了人對於“人是什麼”這個問題的回答與實踐。
(二)人機互動中的技術“他者”與“自我”對照
人機互動情境中設問與回答“人是什麼”,經常需要透過不斷製造技術“他者”,從而框定“人性”。整體而言,人工智慧技術發展引發的當前人類社會對“他者”和“自我”審視都日益顯著(彭蘭,2024)。不同的是,人機關係的權力天平出現了大幅度的搖擺。智慧機器從早期的“低人一等”的“他者”儼然變成接近乃至僭越人類的存在。
彭蘭(2024)認為,人機交流過程中,智慧機器是人類自我認知的“鏡子”,映照自我的同時,人工智慧差異的、建構的和從屬的“他者”性也深刻影響了當前的社會運轉。整體而言,當前思考人機互動的社會影響更多集中在人類對機器的審視,以及人類面對機器時的自我反觀。對於人類來說,技術的“他者”性顯而易見——無論它們對人類來說是俯首稱臣還是居高臨下,但人類作為技術他者的情境和體驗卻隱而不張。在網路環境中,儘管有些群體處於被絕對他者化的位置——例如面對驗證碼的視障者,但更多人面對“請問你是人嗎?”這樣的質問時似乎並無此感受。
在殘障批判研究中,殘障者作為社會和科技領域的“他者”,在技術應用過程中殘障身體時常遭遇“他者化”與非人化對待的案例比比皆是(Mills,2011;Guberman & Haimson,2023)。例如,在診療和技術修復自閉症的方案裡,自閉症譜系者與外界的交流方式被簡單粗暴地類比為人機介面互動,因而被視為“機器人”(Guberman & Haimson,2023)。縱觀計算機技術領域的發展歷程,殘障常常以三種物件化的觀念出現:被視為需要干預的問題(a problem to fix)、思想(或實際)實驗的資源(a resource to extract)、技術排斥或傷害的事後思考(an afterthought to excuse)(Wu,2021)。可以發現,這三種情境或多或少都指向著某種將殘障人他者化的關係型別,背後設定了有關殘障人(缺乏能力的身體)與健全人(有能力的身體)、技術(技術功能正常運轉)之間“我們”與“他們”的實質的分野。正是因為殘障者在健全社會中的“他者性”過於常見(葛忠明,2015),當殘障者被排斥為他者時,非殘障者很難將這些“他者”的情況帶入到自身,更容易視之為另類情況的疊加。在思考驗證碼人機關係時,這種觀念就有可能阻礙了作為整體的人類理解自身和機器的“它異”關係(伊德,1990/2012:102-105),對於人機互動時自己也成為一般化“他者”的狀態視若無睹。
針對圖靈等符號主義人工智慧以及背後身心觀,批判觀點表明,心智的形式化和符號化操作智慧模型忽略了身體存在和感知所構成的“人性”和“智慧”。彼得斯認為,身體始終存在於交流之中(Peters,1999)。德雷福斯的現象學批判強調了軀體在智慧行為中的作用,例如,軀體化的資訊加工、軀體技能的習得性。援引海德格爾和梅洛龐蒂思想,他指出:“關於人及其智慧行為能力的新概念,實際上是一種對人為滿足他的需要所做的技能性、軀體性的活動如何生成人類世界的分析”(德雷福斯,1979/1986:289)。在這個意義上可以說,計算機技術的智慧化發展中——無論它有可能是彰顯還是隱匿身體,最終其技術本體論仍需關涉某種對身體存在和軀體能力的想象性維度。
本文藉由驗證碼一般化場景的體驗和殘障者的實踐,反思逆向圖靈測試人機互動背後的理性主義身心觀念,以及伴隨而來的對“技術他者”的身體和心靈的否定,審視特定人機互動過程對身體和心靈能力的安排和預設。研究具體圍繞三個問題展開分析:
RQ1:在各類人機互動場景中,驗證碼體現出何種身體/能力的技術設定?
RQ2:人機互動體驗中的驗證碼如何折射人與機器的關係變化,人類經由驗證碼製造了什麼樣的“自我”與“他者”認識?
RQ3:針對驗證碼人機互動的技術關係反思能為我們帶來什麼樣的新技術想象與路徑變革?
二
研究方法
本研究從技術現象學視角出發,關注人類經驗技術的範圍和各種形式,以及以技術為中介帶來的“人—技術”關係變化(伊德,1990/2012;伊德,2008)。更具體來說,研究受到“後現象學”視角的啟發,強調結合經驗主義和實用主義採用具體的(經驗的)方法來研究多樣化的技術(伊德,2008:30)。基於這一視角,本文分析驗證碼這一技術物具體的構成、與人類的身體知覺互動和它們在生活世界中衍生的人—技術關係,並進一步討論驗證碼可能帶來的人機互動感受和技術關係的變化。在這個意義上,本文以現象學闡釋為主,同時結合批判殘障研究的觀點來討論所闡釋的研究材料。
本文使用的分析材料包括網路公佈的驗證碼技術專利、論壇中的驗證碼討論和設計分享、驗證碼研究文獻,以及驗證碼的各類使用者體驗報告。筆者瀏覽騰訊雲和阿里雲服務主頁,以及阿里安全、頂象論壇和36氪等網站,結合計算機最新的驗證碼研究綜述,梳理了有關驗證碼型別學和主流網站的驗證碼服務的發展歷程。兩位研究者結合自身的網路使用體驗(一位是殘障者,另一位是非殘障者),透過訪談和網路資料整理,歸納驗證碼變革過程中的殘障使用者和非殘障使用者的體驗變化。研究蒐集了視障社群內部不同時期有關驗證碼障礙的多次討論,對殘障技術論壇(爭渡識圖和天坦讀屏)兩名視障開發人員進行了訪談,還向不同的網友徵集驗證碼的使用反饋,獲得大量的驗證碼失敗的截圖。隨後為了交叉檢驗,筆者在社交媒體小紅書上檢索和篩選了19篇發帖,內容涵蓋國內外知名網站的驗證碼。研究者對所獲得的材料進行歸類與核心內容摘編,選擇其中的典型案例作為分析材料。
三
人機互動體驗中的驗證碼:
技術“他者”的產生與擴大化
驗證碼的設計初衷是為了排除機器干擾,用簡單易操作的方式維持普通使用者環境秩序。然而,驗證碼在文字、圖片、遊戲、數學驗證等內容設定與發展過程中,認知能力的要求越來越高,成為逆向圖靈測試人類存在的隱含必要條件。驗證碼中“我思故我在”是如何日益變得複雜的呢?本節將還原驗證碼的技術演進過程中的人機互動體驗,及其演變的邏輯,進而討論“他者化”體驗是如何變得日益普遍的。
(一)白名單上的“他者”
圖片類的測試是出現最早、應用最廣泛的一類驗證碼。2000年初國內多家網站引入驗證碼時,首先陷入困境的是視障人士。中重度視障者使用電腦需要透過螢幕朗讀軟體作為中介,而早期的螢幕朗讀軟體只能朗讀出系統中添加了無障礙標籤的文字資訊,因此以圖片形式或者圖形化介面為基礎的驗證碼成為其接入網際網路的屏障。
國內視障人群集體反映驗證碼問題始於與騰訊的互動。2004年騰訊推出QQ“線上時長等級服務”,引發了“掛太陽”熱潮。QQ賬號此後頻繁遭到自動化程式的暴力破解,騰訊驗證碼因此產生(騰訊技術工程官方號,2011)。當時以電話撥號上網為主,電腦每重啟一次裝置就會更換一個IP,機器便判定為異地登入,要求輸入驗證碼。隨著電腦、螢幕朗讀軟體在視障群體中的普及,QQ驗證碼的問題越發突顯。2006年,中國盲人創業網倡議解決視障使用者的驗證碼問題,隨後國內幾大盲人網站也跟進發出《倡議書》,號召視障人共同簽名反對驗證碼。經多次溝通協商,2007年7月騰訊推出“白名單計劃”,盲人網友可以向騰訊申請加入“白名單”。騰訊通過後臺人工處理讓“白名單”內的使用者不再有填寫驗證碼的要求(中國盲人協會,2007)。這一舉措暫時解決了部分視障QQ使用者的需求,但實際上白名單的做法將視障者面對圖片驗證時的問題歸結於個人“無能”,用保護的名義將視障者等非“健全能力”的使用者加以區隔,而不是修改視覺驗證策略讓“技術他者”自主融入。
QQ的問題用白名單暫時解決,但驗證問題在更廣闊的網際網路世界中依然層出不窮。隨著網際網路深度嵌入視障群體生活,視障人將其在物理空間中的人工輔助策略遷移至網際網路空間。在日常生活中,視障者會尋求身邊的人幫看驗證碼,或組合全屏截圖技術與即時通訊功能將驗證碼截圖發給線上的好友。然而,驗證碼的輸入時效隱含著效率能力想象,超時便會要求重新填寫。如若無法及時得到好友回覆,當次截圖便宣告失敗,這限制了視障者的熟人關係求助策略的有效性。利用QQ的即時通訊屬性,有視障者將人工求助的關係範疇拓展至半熟人關係,建立起視障者和非視障者共同的QQ群,通常被稱為“某某驗證館”,筆者之一曾加入過類似的QQ群。視障者在遭遇圖形驗證碼時螢幕截圖發到QQ群,因為群中人數眾多,還兼有聊天功能,幾乎可以馬上得到響應。然而,聊天群求助也存在弊端,在群聊資訊密集的時候,截圖求助的圖片也會被遺漏。
此外,擁有技術資本的視障者開闢了另一種把陌生關係的視障者和非視障者聚集起來的路徑,即隔離的客戶端。幫幫聽圖與爭渡識圖是曾經佔據市場的兩款主要軟體。它們由視障使用者和志願者兩個客戶端共同構成。在視障者使用者端,透過快捷鍵完成截圖,傳送圖片,收到回覆,將收到的文字貼上到對應的文字框中即可。志願者端則是等待圖片任務的介面,收到驗證碼截圖之後,將肉眼識別的資訊填入併發送回去。同為視障的爭渡識圖開發者稱:“我們還做了一些技術最佳化,讓它截圖可以儘量圍繞游標所在的焦點,這樣可以擷取到驗證碼的圖片,又不會像截全屏一樣洩露使用者的隱私”。在客戶端的介面中,爭渡識圖還專門加入了當前志願者線上人數和累積驗證碼識別數。這一方面幫助視障者判斷當下能否及時得到回應,另一方面也是對志願者的情感激勵。同樣由視障者開發的幫幫聽圖則由中國殘疾人聯合會和中國盲人協會共同購買版權,在盲人群體中推廣,為其提供驗證碼服務。
在這一階段,儘管也有非視障者因為扭曲的字元需要反覆填寫驗證碼這類的負面體驗,但更多時候人們是以視障人幫助者的角色,強化視障者作為技術他者的想象。
(二)從技術“例外”到普遍“他者”
隨著駭客與網站驗證的攻防戰加劇,驗證碼填寫給越來越多人帶來上網障礙。在提升難度的驗證碼面前,更多人有了技術“他者”的體驗,鐵路12306網站一段時期的“奇葩驗證碼”便是典型一例。它最早引起網友討論和媒體報道,甚至被網友惡搞出“在白百何、王珞丹中選出誰是白百何”等迷因。討論文章指出,12306等網站加大驗證碼難度的出發點在於“讓人類都難以識別,這樣機器學習就會非常困難”。這一做法在打擊黃牛刷票方面取得了一定的效果,同時也“極大地傷害了使用者體驗”。
上述驗證碼的爭議實情如今難以查證,但它觸及現實體驗卻相當真實:當人們 置身於“春運搶票”這一場景中,無法透過機器判定的人就成為了情境化的技術他者。在這一刻,白名單之外也出現了“他者”,殘障與非殘障者填寫驗證碼受挫後被網路平臺排斥的憤怒產生了共鳴。然而,這種共情時刻並不常見,直至近幾年網路平臺賬號安全問題升級,驗證碼帶來的障礙體驗才愈加突顯。
根據論壇討論和使用者社交媒體發帖,我們將各類驗證碼反饋的問題總結為以下情況:第一,感官(以視覺和聽覺為主)能力差異導致驗證碼資訊讀取障礙;第二,驗證碼題項或內容暗含的社會文化差異(語言、社會生活、流行觀念、理論知識等)導致理解障礙、無法選出答案;第三,對人機互動設定(時效、視窗操作、旋轉)理解或操作障礙;第四,驗證碼設計與人機互動介面的設定衝突導致資訊讀取障礙,這在視障者中尤為突出。
一方面,為了呼應國家環境和資訊無障礙的法律政策要求,許多網站的確努力嘗試在出題或互動設計層面來改良驗證碼。另一方面,網站為了限制指令碼機器人和黃牛等非法使用者,仍在刻意提高驗證碼內容答題難度。
如今,各類網民與各大平臺不斷升級的驗證碼鬥智鬥勇的故事仍在書寫。隨著(AIGC)參與到驗證碼的生成過程,AI一秒鐘內生成數萬張不重複圖片的“能力”,使機器造驗證碼來識別人的“敵託邦”成為現實。這些人類讀不懂,機器卻能理解甚至能破解的驗證碼帶來的人機互動體驗,讓使用者頻頻使用“拼命”“離譜”“極度痛苦”等詞語來形容,卻又無法在日常登入時繞過。
圖1:騰訊的AIGC驗證碼
圖2:某網站驗證碼
至此,本文認為,驗證碼技術發展帶來的人機互動體驗始終持續製造著個體化、情境化的技術“他者”。面對驗證碼,殘障人(尤其是視障者)最早成為技術“他者”,這些人對於機器和技術設計者是絕對的“他者”,或被排除,或被保護。隨著驗證技術迭代,許多非殘障人不愉快的人機互動體驗也說明,技術“他者”正在不斷產生與擴大。“我驗故我在”的困境從技術“例外”到普遍技術“他者”的憂慮意味著,人們開始被迫從人類整體性這個意義上思考人面對人工智慧時差異的、建構的和從屬的“他者”性。進而,驗證碼也可能轉變殘障人與非殘障人之間相互審視的角度和技術關係。
四
網路生態中的驗證碼:
技術迭代促使人機關係倒轉
隨著驗證碼機制在全球各地的網路服務中全面推廣,這也帶來了與之伴生的驗證碼破解技術的發展,以及二者的糾纏。
(一)驗證碼技術的產業化、黑產化與剝削
驗證碼以內建程式碼或者第三方雲端服務的形式嵌入到網頁和應用程式中。目前計算機領域的研究將大量精力投入到驗證碼的升級和攻防戰中。中國以騰訊雲、阿里云為代表的網際網路科技公司也自主開發了相關的文字、圖片和滑塊驗證碼。總體上看,驗證碼僅存在表徵層面的地域差異,例如語言文字、圖片、影片和遊戲內容設計上的文化差異。驗證碼的技術邏輯,即驗證碼的生成和對抗很大程度仍潛在地導向一種技術普同主義。原因在於基礎程式碼的複製和流通由微軟、雅虎、谷歌、阿里、騰訊等多家大型網際網路科技公司主導。
驗證碼技術迭代的基礎在於理解驗證碼的安全性和破解的技術路線,例如物件分割攻擊、目標識別攻擊、隨機猜測、人機協同攻擊(Guerar,Verderame,Migliardi,Palmieri & Merlo,2021;Xu,Liu & Li,2020)。在驗證碼攻防戰中,最先進的計算機視覺、光學字元識別、聲紋識別都變成了機器假裝人的手段。機器暫時無法透過測試的複雜語義理解等,由打碼平臺或駭客僱傭的其他人力來協助完成。
驗證碼與破解驗證的技術迭代在此消彼長中,對越來越多使用者樹立了高牆。然而至2021年,文字、影象和聲音這三大驗證碼模式被機器攻破殆盡(Guerar,Verderame,Migliardi,Palmieri & Merlo,2021)。雖然不同公司的驗證碼專案破解率有顯著差異,我們依然可以看到機器的迭代遠超人類。據一份2023年的計算機研究報告指出,總體上機器人在解決驗證碼方面的表現優於人類,而人類社會內部透過驗證碼的時間也受到年齡、裝置型別、教育水平和網際網路使用模式等人口統計因素影響(Searles,Nakatsuka,Ozturk,Paverd,Tsudik & Enkoji,2023)。
不少科學家斷言傳統驗證碼已經失效,紛紛提出了新的驗證碼技術發展方向。例如,復旦大學計算機學院肖仰華認為,考驗機器語言認知能力的智慧驗證碼是未來技術發展的趨勢,逆向圖靈測試需要進一步加大難度,基於“語言認知”能力來進行人機區分(雷鋒網,2017)。與圖靈測試一脈相承,上述發展理念基本上可以概括為“道高一尺,魔高一丈”,它追求和確信人面向的特定智識所具有的獨特性和優越性,體現了康德、笛卡爾以降的主體論的信念。這樣的主導思路推動了驗證碼20餘年來的更新迭代,同時這一攻防戰的技術進步路線也不自覺地拼湊並不斷強化了某種視覺、聽覺乃至認知和智識上的完人想象。
(二)人機關係倒轉:人作為整體的技術“他者”
隨著驗證碼技術的複雜化,破解驗證碼的需求也不斷增多,他們不僅來自網路駭客、非法營銷和批次註冊的運營者,亦有普通網路使用者。驗證碼人工打碼平臺一方面從網路駭客和普通弱勢群體處獲益,另一方面依賴零工經濟招徠低廉的資料工人,剝削他們的認知勞動。打碼平臺會建立一個任務平臺,任務釋出者是灰色產業鏈經營者,他們將獲取到的驗證碼資訊封裝成任務提交到打碼平臺,打碼平臺則作為中間的任務排程者,將任務分配給標註者(專門從事驗證碼打碼的勞動者),完成後將標註結果返回平臺,由其使用標註結果去請求資料頁面。標註結果打碼平臺也會儲存一份,下次遇到相同的驗證碼則直接從資料庫中提取答案。如果驗證碼平臺的驗證圖片長久不更新,就會有被拖庫的風險,也就是所有驗證圖片都會被標註,此時就無需人工標註,直接轉變成機器打碼(小象,2022)。
在驗證碼攻防過程中,人類和機器勞動力等級劃分逐漸產生。一些沒有正式工作的人、邊緣的勞動者被僱傭作驗證碼破解平臺數據標註員,承擔了其中的廉價認知勞動,變成了機器的“低端”助手。
平臺中的人工打碼作為機器的補充勞力價格低廉,面對提升的技術門檻,勞動者也隨時可能被取代。如今圖片驗證碼幾乎都可以透過OCR技術來識別,這部分的人力工作數量大大減少。為了對抗驗證碼平臺,一些打碼平臺引入了機器學習和神經網路等人工智慧技術,以此來智慧識別圖片中的驗證碼要素,提高自動識別的準確率乃至完成互動操作。普遍來說,人工智慧的升級迭代存在一條線性的路徑,即從感知智慧到認知智慧再到決策智慧(高文,2019)。驗證碼技術攻防升級也遵循了這一路徑,從簡單圖形的視覺感知、OCR字元識別,到考察圖片中更為複雜的資訊的認知,再到互動式驗證碼的操作,一方面完成驗證碼均暗含了健全完整的身體在場,另一方面對身體的能力的要求也在不斷增加。隨著驗證碼的技術難度增加,這使得面對驗證碼產生挫敗感與排斥感受的人群不斷擴大。反過來,這種線性的升級路徑恰在生產從決策到認知到感知能力歧視的等級鏈條,不斷打擊和定義著網路時代的“技術無能者”。同時伴隨驗證碼生產和破解的產業化而來的還有一些無意義的勞動(bullshit work)(格雷伯,2018/2022:1)和無意義的技術(bullshit technics),驗證碼消耗了許多普通人不必要的網路時間、注意力勞動,以及黑色和灰色產業鏈中的底層資料勞動。
五
重思人機互動的身體觀:
從技術能力主義到
去能力主義(Dis-ableism)
當前的驗證碼發展出的“我驗故我在”實質上是“我思故我在”思想的複雜版本和具體實踐,即對於機器來說,它就是個破解和對應運算子(形式符號)的過程,但對人類來說不斷迭代的驗證碼就是要讓人類要利用人類會思考、會比較、會遊戲的思維,即理解和思考的能力。然而,這一所謂的人類能力的基礎也在人工智慧的飛速發展中搖搖欲墜。驗證碼迭代不自覺地成為技術能力主義(Whittaker et al.,2019)的觀念代理。
(一)技術能力主義的否定辯證法
殘障研究領域很早就開始反思社會中存在的能力主義(ableism)隱含的身體觀和衍生的主體觀念。能力主義將擁有某些能力等同於正常,缺乏某種能力的身體和主體則視作非正常,進而區分並貶低了“失能/殘疾”(disability)主體(Ho,2008)。當今社會普遍追求諸如健康、美麗和生產力等特質的信念實際上折射了能力主義的思維(Griffin,Peters & Smith,2007)。本文中能力主義的排斥性表現為驗證碼讀寫能力變相成為上網者的准入資格證,無法透過驗證碼的人被視為非正常,失去享有某些網路服務的資格。
現代社會中,能力的內涵愈加複雜,社會生活的各方面都成為理解個體能力、展現能力的舞臺,反之,某一方面的能力缺乏都有可能帶來對一個人的主體性的否定。Reynolds認為,能力主義是一種否定辯證法(negative dialectics),這種哲學存在的基礎包括對身體的評判、身體相關的價值繫結,以及形成一系列有關個體能力的信條和規範。社會中一切有關人類能力的意義建構,同時也彰顯了對非人和無能的認定(Reynolds,2019)。在驗證碼的沿革歷程中,技術要求又進一步劃定了理想的計算機、網路技術參與者的範圍,似乎缺乏圖文識別或認知能力的人是不具備使用某一技術資格的。
能力主義一旦被放大,否定辯證法帶來的問題便更為凸顯。當一個盲人被告知無法透過圖片驗證碼就不能成為網站使用者時;一個肢殘人無法使用滑鼠完成滑塊或點選驗證碼;一個兒童由於身高問題無法透過刷臉機器;一個老年人由於視覺、聽覺或者肢體方面的障礙無法完成驗證碼互動,身體能力的缺陷或者非標準化就意味著這個時刻他/她是處於被機器非人化的判定中。技術使得能力的要求越來越高,能力的範圍越來越廣,能力的表現越來越多,在任何一個時刻的“失能”很有可能就會造成主體性的喪失,技術能力主義變相地變成了完美主義和正常化的絕佳說辭(Whittaker et al.,2019)。
誠然,在本文寫作過程中,我們所呈現出來的案例大多源自殘障者的日常體驗,但它並非是一種特殊化的經驗。換言之,所謂“殘疾”與“健全”,彼此之間並無一個不可動搖的界限,之所以出現前文述及在驗證碼發展初期彷彿視障者被技術與健全人雙重他者化的感受,或者說這似乎只是一個殘障人面臨的特殊議題,源自於能力主義的根深蒂固及其等級化的運作機制。Harpur(2019:14)結合殘障社群內部不同類別的殘障者之間的歧視現象(Deal,2003),尤其是精神障礙者在勞動力市場上相較於肢體、感官障礙者遭受的更深的排斥,提出能力主義的等級(hierarchy of ableism)的概念。文章指出,能力歧視並非是健全與殘疾的簡單二分,而是人們將不同能力的想象置於一個等級階梯之上,當人們反對所謂能力歧視時,可能並未觸及這種用能力來否定人性的底層邏輯,只是在挪動區分有無能力的界限。由此,我們要提醒的是,技術能力主義的命題根本在於,技術失能被視為非正常狀態,當其“能力”不斷超過人類之時,越來越多的人也就成為了等級階梯下位的失能之人和技術他者。
(二)去技術能力主義的可能性
本文認為,驗證碼體現出的技術能力主義的人機互動偏見背後的問題可以從兩個層面來思考:第一,當業界努力開發各種形式的驗證碼來驗證使用者是否為真人之時,或許犯了一個本體論的錯誤,認為驗證碼某種程度上一定能體現關於人的本質特徵的某個方面,而人也確實存在某種可表徵的本質特徵。這種先驗主義的預設使得設計者一直在開發和尋找某個無可超越的本質,卻發現沒有一個技術面向是計算機完全無法企及的,人所謂的固有特徵和尊嚴反而受到威脅與動搖。第二,驗證碼設計者以技術能力主義的視角來認知人類自我,其所定義的驗證碼中體現的人的本質和某些特質天然也帶有“缺陷”,因為設計者對人與世界本身的想象存在侷限,折射出其認為的非人存在的設計,機器會將之複製並再生產,終有一部分使用者會被其設計的驗證碼排斥。
驗證碼探測背後主要的目的是考察是否是人在“交流”,這一問題的製造者還是人類本身,本文無意從根源上對驗證碼進行批判,而是透過對這一人機互動關係的省思超越固有的“我驗故我在”的侷限,尋求更為多元的方向。因此,驗證碼和驗證碼相關的人機互動不應該用於定義人、限制人,陷入在固有驗證碼技術發展趨勢之中,而要回歸到人的現實情境和行為特徵。本節將引入兩個不同的驗證碼路徑,思考驗證碼去技術能力主義的可能性,還原人之尊嚴的技術想象。
1.“缺陷”作為思路
斯蒂格勒(1994/2012:82-134)認為,技術是由於人的缺陷而產生,作為人的“義肢”而得到發展的,那回歸“缺陷”何妨成為一種新的驗證路徑。事實上這種思路已在滑塊驗證碼中有所應用。滑塊驗證碼屬於基於行為的互動式驗證碼,完成滑塊的重點不在於時間長短,而是主要對比滑動軌跡與原先設定路徑的關係。滑塊驗證不僅需要使用者完成指定的滑動任務,如完成拼圖,拉滿滑塊條,同時利用人類行為軌跡的不穩定性來識別真人:人類在拖動游標滑動時軌跡相對指令碼機器人來說是非勻速的,接近目標方框時速度會放慢。
當然,此種設計並非完美。首先,滑塊驗證在應用不久之後也遭到破解,機器同樣模仿了人體解鎖的抖動軌跡,精巧地騙過了驗證程式。其次,滑動驗證模式從使用體驗來說,對視障者和肢體障礙的人並不友好。然而,這個例子值得討論之處在於,它利用了人類相對於能力主義所崇尚之“標準”效率與“審美”等而言的“缺點”,而非強調人類相較機器來說的能力優勢。發現差異和將人類的缺陷視為差異,可能也是驗證碼的另一種邏輯。
早期計算機在情境理解和記憶方面尚未得到發展,如今基於神經網路和大語言模型之下的智慧計算機似乎已經克服了這一點。相較普通人,ChatGPT的知識面和基本語言能力毫不遜色。然而人的缺陷卻可以很容易把人和智慧計算機區別開來:人會偷懶,會拒絕回答“愚蠢”的問題,而ChatGPT總是嘗試給出完整、全面和較少疏漏的答案。也就是說,人與技術(本文主要指智慧計算機)本來就不是競爭關係,而是為了解放和補充。基於技術能力主義來開發逆向圖靈測試,設計者對人與機器的核心差異的挖掘只會越來越難,這與人類開發計算機的原初願景是相悖的。如果人對機器的設計是要求它們趨向某種完美,那麼對人的驗證碼就可以從反面表現,即在人機互動過程中展現不完美。
因此,以缺陷、差異和多樣作為一種方法去拓展更多的人機互動想象,呈現出包容性,是本文認為可以突破的第一層面。然而,差異和多樣性的範疇最終也是有限度的,且隨著多樣性的增加,人們可能落入相對主義的極端,一方面使技術難以施行,另一方面機器只需任意反自我標準便可將之攻破。這一思路尚未超越“能或不能”的二元對立想象,下文將引向第二層討論:作為聯結的人。
2.聯結作為方法
除了能與不能的維度,人的身體和存在也意味著多節點的網路聯結,而機器往往是單點的存在。從聯結出發可以開啟“去能力主義”的更深層想象。在驗證碼尚未全面普及之時,密碼狗(pass dog)等物理外掛曾是重要的註冊身份識別驗證方式。當前密碼狗的識別思路進一步地從物質世界的聯結轉向虛擬世界的聯結。它不再使用外接硬體,而是將其他應用視為外掛。基於行為和感測器的驗證碼背後的設計原理(也稱無感驗證),也應和了類似的理念。在網際網路的世界,每個人都扮演著節點,與形形色色的人、物和服務產生連線。一個人用了哪些裝置接入網路,跨過哪些平臺,與誰互動,都構成了這個人網路化的自我。無感驗證碼透過收集使用者環境資訊(視窗瀏覽時間、滑鼠軌跡和網頁快取)區別真人和指令碼機器人。區塊鏈技術也是分散式身體的代表,參與者作為節點加入系統,網路中每個節點既是資料的提供者也是資料的使用者,互為彼此身份和存在的確認者。
分散式的身體觀和主體構成與圖靈測試暗含的先驗本體論不同。實踐存在認為,身體是在展演/促成中,被中介的存在。人類並非存在於且於其自身(exist in and of themselves)。所謂存在,並沒有終極、赤裸裸的原真存在,或是任何終極真理與密碼,有的只是浮現於異質實踐形構中的某種人。一方面,人隨著不同脈絡的實踐促成,而展開成形,另一方面,非人或者其他人類,也是形構人存在中介的一部分(林文源,2014:32-50)。在行動者網路理論看來,人之所以為人,並非我思故我在,而是我聯結故我在(I am what I am attached to)(Latour,2006;Muecke,2012)。
我們是否有可能提出新的方法,從圖靈測試的“我思故我在”,邁向“我聯結故我在”的人機互動和真人驗證?或許可以拭目以待。
六
結論
當今社會普遍相信,AI可以幫助我們認識心靈——它是什麼、它怎麼工作。因而無論是否贊同AI能真正產生類人的心智,科學家都在努力推進AI的演進。然而,在驗證碼的產生和演變的過程中,人們並不一定都意識到,機器主導的一系列逆圖靈測試對於人是什麼、人的身心運作觀念會產生強烈動搖。
本文立足於德雷福斯(1979/1986)、伊德(1990/2012)和彼得-保羅·維貝克(Peter-Paul Verbeek)(2011/2016)等人的技術現象學批判,同時結合批判殘障研究(Campbell,2009;Goodley,2010;Whittaker et al.,2019)探討日常生活中機器智慧的一個側面及其相關的“我驗故我在”問題。研究回到驗證碼人機互動的過程、形式設定和技術關係本身,分析驗證碼人機互動中的能力主義陷阱,揭示人作為計算機的“他者”這一背景性的問題。筆者呈現了人機互動體驗中驗證碼的主導模式是如何形成的,這一過程如何從製造白名單上的“他者”,到使人作為整體的技術“他者”,進而帶來人機關係倒轉的負面影響。顯然,20世紀70年代以來德雷福斯(1979/1986)對人工智慧的現象學批判和伊德(1990/2012)指出的人—技術“它異”關係的基本問題依舊迴響。維貝克認為,技術物的形成過程中有很大的潛力參與到倫理道德的改良,人們的社會實踐與非人實體融合可以產生新的混合實體,催生超越人類的意向性形式。其中包括兩個方向:道德化地設計調節技術(將人融入非人)和以有計劃的方式道德地使用調節技術(共同形塑非人在人中的作用)(維貝克,2011/2016:65)。
由此,驗證碼現象的技術倫理問題呼之欲出。本文認為,許多研究結果都暗示目前的驗證碼思路很難堵截指令碼機器人,複雜化的驗證碼反而成為許多普通的殘障和非殘障人使用網路的攔路虎,不斷製造出各類技術“他者”,帶來新的不公平問題。我們完全同意,驗證碼對於保障網路安全所具有的價值,目前取消驗證碼程式目前是不現實的。然而需要強調的是,我們必須更加審慎地考量驗證碼人機互動中的能力主義陷阱,對此加以避免。文中論及的身體/能力偏見不是特定針對誰之偏見,而是產生自技術能力主義對人的獨特能力的追求和無條件信奉,反過來使得有缺陷的、不完美的人被認為是有錯的,被這一信念下的技術趨勢的誤傷的結果。驗證碼能力主義追逐的是正常化乃至全能化的身體能力,最後導致機器碾壓所有人,人又求助機器和其他人,無意義的認知勞動、衍生的黑色產業越來越多。因此,應該改變驗證碼思路,重新理解人的網路化存在以及人機互動的導向。無論圖靈測試還是逆向圖靈測試,人類與機器的智慧競爭或許並不是必須的。在驗證碼的案例中,本文提倡去能力主義(Dis-Ableism)路徑,人機互動過程中引入缺陷、差異與分散式的身體觀或許就是新的驗證思路,推動新的關係形態和技術倫理。
最後需要指出,本文存在的侷限是,將人機互動作為焦點分析驗證碼的問題,不免又落入人與機器二元對立關係的敘述邏輯。在殘疾(crip)的體驗中,技術世界中殘障人與非人行動者的關係早已是半機械化和混合化的(例如,使用通訊和適應性裝置、植入物和移植物)。人類和非人類(有感知的生物和機器)之間的關聯網路一直改變著實踐的界限,並越來越突破界限(Campbell,2009)。本文雖觸及殘障群體的日常生活實踐,但殘障批判的理論延伸仍有遺憾,希望未來研究從對“我驗”的思考轉向“我在”的更多元探尋,將殘疾(crip)作為一種方法,使之成為重塑人機互動關係的先鋒,帶來超越二者對立的想象,為人機互動關係研究與實踐開啟新的維度與可能。
本文系簡寫版,參考文獻從略,原文刊載於《國際新聞界》2024年第8期。
本期執編/程羽
訂閱資訊
全國各地郵局均可訂閱《國際新聞界》,國內郵發代號:82-849,歡迎您訂閱!
您也可透過下方二維碼或網址https://weidian.com/?userid=1185747182,進入國際新聞界微店,購買當期雜誌和過刊。
您還可訪問《國際新聞界》官方網站 http://cjjc.ruc.edu.cn/ ,免費獲取往期pdf版本。
進入官網下載原文