本報(chinatimes.net.cn)記者周南 北京報道
11月27日下午,《華夏時報》記者透過聯絡到王瑋時,她剛從合肥落地深圳不久,正忙於出差。臨近年底,活動繁多,王瑋是科大訊飛副總裁、安徽聽見科技有限公司總經理,難逃忙碌。
28日下午,工作結束後的王瑋將朋友圈定位在深圳寶安機場,準備飛離。人在深圳,朋友圈的內容卻與當天遠在北京舉行的“WISE2024 商業大會”相關:圖片中,參會嘉賓正就大會主題“Hard But Right Thing(正確的事)”發表講話,後方的LED大屏底部是一排中英雙語字幕——那是訊飛同傳正在助力大會無障礙交流的印證。“#正確的事 讓有價值的思想,無障礙地傳播!”王瑋如此配文。
幾個小時後,晚間23:40,落地合肥後的王瑋又給記者發來大段資訊,回覆採訪事宜。
“我認為科技發展的意義是為不能作戰的人而戰”“技術的發展,始終需要落腳到我們每個人身上”“科大訊飛的核心技術是和語音合成”……夜色並未消磨王瑋的激情和理性。
在人工智慧領域工作23年,從技術走向產品,再從市場的第一次嘗試到涉足公益,如何找到技術創新、社會效益與商業可持續發展的平衡點,如何看待AI在無障礙技術領域的未解難題……在這場“隔空對話”中,她向《華夏時報》記者講述了科大訊飛的公益戰略和自己的公益體悟——做正確的事,為不能作戰的人而戰,這是科技應有的溫度。
科技發展的落腳點是“人”
“科技發展的意義是為不能作戰的人而戰”——這是科大訊飛在公益領域整體戰略的起點,也是王瑋在公益中的體悟和堅持。
2015年訊飛聽見錄音轉文字網站正式上線之前,王瑋一直專注於技術工作。同年,科大訊飛正式釋出了一款語音轉寫的產品叫作“訊飛聽見智慧會議系統”,這是王瑋從技術走向產品再到市場的第一次嘗試。在與使用者長期打交道的過程中,她注意到了其中的聽障群體。
“聽障群體對語音識別和轉寫技術的需求度很高。在中國註冊的聽障人士有2000多萬,還有1億—2億的弱聽人群,這是一個非常大的數字。”王瑋和團隊開始思考,怎樣能為聽障群體做更多事。
2019年5月19日第29個全國助殘日,科大訊飛聯合中國聾協、中國殘疾人藝術團,發起“聽見AI的聲音”公益專案。由訊飛聽見作為承辦方,透過科大訊飛核心的人工智慧語音識別技術把語音轉化成文字,變聽為看、看聽結合,讓聽障人士透過文字感受世界、與人交流、順利完成工作,建立起與聽障人士溝通的橋樑。
王瑋(前排左一)作為公益活動聯合發起人之一,與中國殘疾人藝術團團長邰麗華(前排中)等人用實際行動助力公益
王瑋作為公益活動聯合發起人之一,經由專案與更多聽障人士有了交流。她向記者回憶稱,2022年,團隊組織拍攝過一部使用者故事短片《除了聽,我們什麼都可以!》,自己對其中的聾人律師譚婷印象尤為深刻。
譚婷來自四川大涼山,前後參加過三次法律資格考試:2018年首次踏入律考;2019年接觸訊飛聽見APP後,自己上網課,學習效率大幅提升;2020年正式考取律師資格證,成為中國首位聾人律師。“別人可能會質疑她是聾人還要做律師嗎,但她一直沒有放棄,她心裡想的是如何為殘障人群提供法律諮詢服務,所以在不斷精進、不斷熱愛、不斷學習中,她達成了夢想,她每天都在做有意義的事,她很快樂。而我們的技術在這過程中幫助到了她。”
王瑋為譚婷的生命力量感動,也為科大訊飛的技術能對一個生命有所助力而倍感觸動。這也更加堅定了她的信念——科技發展的落腳點是“人”。
“技術的發展,始終需要落腳到我們每個人身上。科技應該更有溫度,不僅要追求技術進步和效率提升,還要關注對社會、對人的影響,體現人文關懷。科技應該最大限度地幫助人們解決問題,提升生活質量,收穫實實在在的體驗認可。”王瑋說道。
科大訊飛深入場景的公益實踐
為了這份“實實在在的體驗認可”,科大訊飛秉承著將核心技術和業務價值深入場景中來做公益,回饋社會。
2020全國兩會期間,《人民政協報》兩會特別報道“委員會客廳”採訪現場,使用了訊飛聽見會議與多位全國政協委員進行連線互動,採訪解讀委員們各項提案;同年10月,推動深圳衛視知識春晚節目與科大訊飛合作,用人工智慧技術將現場演講實時轉化為文字,並且直接呈現在電視直播畫面中,這是AI直播字幕技術首次應用於省級衛影片道,助力聽障人士收看節目;基於教學、會議、辦公、視窗等場景,聽障領域採用語音識別、多媒體和電子白板等採用無障礙軟體+智慧硬體技術、文字——聲音轉換技術,可以為聽障學生營造多功能智慧學習空間。目前系列軟硬體產品已在北京聯合大學特教學院、南京特殊教育學院進行常態化應用,並在西安市第二聾啞學校、長春大學特殊教育學院、襄陽市特殊教育學校進行試點應用……
“這些技術應用平均每天為聽障人群提供超過5000萬次的AI服務,累計服務障礙人群超過1087萬。”能參與其中,王瑋只覺與有榮焉。
至於“聽見AI的聲音”專案,因與訊飛語音識別技術高度契合,該專案成為科大訊飛公益版圖中的重要一塊。截至2023年末,專案累計為聽障群體定向捐贈時長超1億分鐘。
此外,科大訊飛還啟動了“三聲有幸”專案,透過語音識別和合成技術,開發盲人遊戲《榮耀戰場》,讓視障人群能夠參與電子競技;今年5月,科大訊飛與中國殘疾人聯合會簽署合作協議,雙方將共建通用人工智慧助殘聯合實驗室,積極研發用於殘疾人服務的人機互動元件、智慧康復輔具,開展多類別的智慧助殘研究,並搭建面向殘疾人需求的應用場景,協同推進人工智慧等技術創新成果在助殘領域的示範應用等。
“在方言保護、促進教育資源平等方面,我們也有投入,如智慧教育產品捐贈:向新疆喀什疏附縣托克扎克鎮中心小學捐贈智慧課堂教學系統、智慧窗一體機等裝置,幫助學校構建智慧化教學環境,提升數字化教學能力,共享人工智慧發展成果。”王瑋說道。
AI技術賦能公益、無障礙的未來
在科大訊飛的系列公益實踐中,王瑋愈發看見了AI技術的普惠性。
“這種普惠性是指確保每個人都能享受到人工智慧技術帶來的便利與益處,這不僅是技術層面的普及,更是社會層面的公平與包容。這是一個非常宏大的命題,涉及到技術普及、社會公平、教育就業多方很多面的討論。”
而作為一名科技企業工作者,這種普惠性時刻提醒王瑋先做好自己和一些行業引領。“比如作為一名AI工具的生產者,我們要在設計和開發過程中就考慮到多樣性和包容性。2022年我們招聘過一名聽障員工加入產品研發隊伍,她為我們提供了很好的互動改進思路,非常細小的修改卻能為特殊群體提供質的體驗提升——以聽障群體實際需求者和使用者的視角出發,去考慮普惠性問題,這一點非常重要——還是以人為本。”
那麼,作為一家人工智慧企業,在推動公益專案時,如何找到技術創新、社會效益與商業可持續發展的平衡點?
王瑋回答記者:“只要足夠深入使用者需求、能夠解決大眾痛點,這三者本質上並不衝突。”
她舉例稱,2022年,自己帶領訊飛聽見與B站攜手在英雄聯盟直播時使用無障礙實時字幕。在中國電競戰隊EDG奪冠的英雄聯盟s11賽事中,B站無障礙直播間使用訊飛聽見AI字幕的人數突破600萬,總決賽單場比賽峰值人氣為400萬。“我們當時開設無障礙直播間本意是為聽障群體提供便利,但過程中發現很多普通觀眾也有字幕需求:在聲音不方便公放的場合,他們也需要實時字幕。類似這種延展出來的需求其實很多,所以我們很感謝聾人朋友,正因為他們對聲音的需求和使用更加敏感,幫助我們拓展了更多技術使用場景。”
面對推動AI技術服務公益和無障礙事業的未來,王瑋表示,伴隨著大模型的不斷發展成熟,AI技術將進一步提升無障礙裝置的智慧化和自主性。例如,智慧語音助手可以更好地理解使用者的指令,提供個性化的服務;系統可以在沒有人類干預的情況下自主學習、決策和適應環境,這將極大地提升無障礙裝置的實用性和使用者體驗。
但是,伴隨而來的倫理和法規問題也不可忽視。“確保AI技術的健康發展,需要制定符合倫理標準和法規要求的準則和規範,我想這對大眾來說都是很大的難點和挑戰,對特殊群體未來的應用更是。”王瑋說道。
眾人拾柴火焰高,她希望國家能將資訊無障礙列入規劃和重要工程,努力構築和完善資訊基礎設施,不斷提升資訊基礎設施提供資訊無障礙服務的能力和水平,也給予無障礙行業工作者更多的政策和資源支援,同時,結合人文關懷,確保技術進步服務於每一個人的福祉,尤其是邊緣群體的需求。
責任編輯:方鳳嬌 主編:文梅