人工智能虛擬人(人機交互進化論:從語音助手到“虛擬人”,誰才是引領者?)
作者 | 肖漫
編輯 | 李帥飛
2007 年 1 月 9 日,當初代 iPhone 橫空出世的時候,躊躇滿志的喬布斯在演講臺上非常明確地指出:無論是Mac、iPod 還是 iPhone,它們的革命性創新都體現在人機交互方式的進化。
此后,以智能手機為載體,人機交互隨著技術的發展突破不斷進化。
比如說,在移動互聯網和人工智能的融合發展浪潮中,以蘋果 Siri、Google Assistant 為代表的智能語音助手成為一時之風尚,它們在觸控之外,開啟了一種新的交互方式——也就是更加符合人類交流方式的語音對話。這種交互方式在誕生后數年,就快速覆蓋了整個行業。
然而,語音助手并不是終點,人們依舊在人機交互層面尋求面向未來的進一步突破。尤其是當下,iPhone 已誕生將近 15 年,AI/AR/VR/數字媒體等技術得到飛速發展,元宇宙概念也勃然興起。值此技術飛速變革之際,一個值得深思的問題已經擺在整個行業面前:
語音助手逐漸走向普及之后,人機交互方式又該朝向什么樣的方式進化?
當然,這是一個需要整個行業通過實踐來給出答案的問題——而在諸多答題者中,讓雷鋒網眼前一亮的,是憑借自身 AI 實力來踐行自身對未來人機交互大方向思考的 OPPO。
截至今年 8 月,ColorOS 全球月活躍用戶達到了 4.6 億,龐大的用戶服務需要強大的技術能力,尤其是 AI 能力的支持。那么,OPPO 支撐全球超過 4.6 億用戶的 AI 服務是如何構建的呢?
多模態交互的 "虛擬人",為什么是未來?
對于人機交互的未來,真正能夠代表 OPPO 自身思考和選擇的,是它旗下小布助手在近日 OPPO 開發者大會上的一次重要進化。
簡單來說,就是將 OPPO 小布助手從以往基于語音交互的智能輔助工具形態,進化為基于虛擬人多模態交互的智能助手形態,從而將人與智能助手之間的交互演化為人與虛擬人之間的交互。
這不難讓人理解——畢竟,基于多模態交互的 “虛擬人”,已經成為當前人機交互探索發展的新方向,也成為整個行業參與者的共同選擇。
比如說,在今年 6 月,中國首個原創虛擬學生 “華智冰” 的身份以本科生的身份進入到清華大學;而設計虛擬學生 “華智冰” 的初衷,是希望她最終能像人一樣思考,像人一樣不斷學習,理解人的想法,主動產生符合用戶需求的互動,直觀、全面地捕捉人類的需求——當然,“華智冰” 誕生的背后,體現的正是多模態交互的成果。
除了入學,“虛擬人” 也已經在互聯網上 C 位站臺。
比如說在 9 月份,小紅書同時入駐了 20+ 虛擬偶像,她們化身潮流情報官,首發試穿諸多潮流品牌的新品,演繹不一樣的潮流魅力……前不久,虛擬人 AYAYI 也成為了天貓超級品牌數字主理人,并且開了個天貓雙 11 元宇宙藝術展,有趣的是,華為在今年 HDC 開發者大會上首次采用數字人全程實時手語直播。
當然,放眼整個社會生活空間,“虛擬人” 的角色更是無縫融入其中。
比如說,新華社和騰訊聯合打造了專門面向航天主題和場景研發的數字航天員、數字記者“小諍”;日本原宿風少女數字人 imma,在 9 月初還登上了東京殘奧會的閉幕式;浦發銀行和百度共同發布了數字員工“小浦”;湖南衛視宣布推出了首個數字主持人小漾,而江蘇衛視則直接開播了一檔宣傳虛擬偶像的節目《2060》……
可以看到,伴隨著當前人工智能、虛擬現實等數字媒體技術的不斷發展,基于多模態交互的虛擬人已經從互聯網和數字世界走向人類的實際社會場景,并且這已經成為大趨勢——甚至有觀點認為,虛擬人將會成為未來人機交互的基礎模態。
正是在這樣一個大背景下,OPPO 也在洞察到人機交互發展大勢的基礎上,不失時機地實現了小布助手從語音助手到“虛擬人”的新一輪進化。
OPPO 小布助手變身,同時開放 “虛擬人” 定制
小布助手是國內首個月活用戶數破億的手機語音助手,當前月活已經達到 1.3 億,是 OPPO AI應用的集中體現。作為最早以智能手機為載體的人工智能助手,小布以語音交互為主體,覆蓋了 OPPO 系多個手機品牌,在后來發展過程中,它又被逐漸應用于智能手機、電視等多個品類智能終端設備。
自 2018 年誕生以來,小布助手經歷了多次升級,不斷在功能和體驗上推陳出新。 本次 OPPO 開發者大會上,OPPO 方面宣布,小布助手已經正式從純粹的語音助手升級為多模態的智能助手,包含語音、建議、指令、識屏和掃一掃五大能力模塊。
多模態的需求,是智能時代智能助手的關鍵特征,智能助手需要兼容不同的軟硬件智能場景,引入更多的AI能力,并且將它們緊密地與原有的 AI 能力結合在一起,形成綜合的AI能力。
今年 9 月上線的“小布虛擬人”, 也是智能助手多模態交互形態的重要呈現。
作為業界首個基于虛擬人多模態交互的手機智能助手,小布虛擬人打破了交互次元方式,將人與智能助手之間的交互,演化為人與虛擬人之間的交互。
據悉,在破次元人機交互的探索中,“小布虛擬人”可以實現與用戶在多個場景生態下的內容服務、實時交互以及情感化交互,其首期上線的擬人化播報新聞和天氣等功能便是直接體現;目前這一功能已覆蓋 OPPO Reno5/6、Find X3 系列機型。
同時,小布虛擬人融合了語音、語義和視覺多模態交互技術,能夠提供自然流暢的虛擬數字技術交互體驗。在多模態情感識別算法的加持下,小布虛擬人可以敏銳捕捉用戶情緒特征,打造與用戶之間的多維情感暢聯。
令人關注的是,OPPO 以小布助手為入口,開放了小布生態。
每一位開發者都能夠定制專屬的小布虛擬人。它們可以擁有不同的聲音、形象、性格、技能以及服務,化身為不同的角色,例如智能客服、虛擬助手、帶貨主播等,并搭載在多個智能終端設備上。
OPPO 此番動作,不僅是賦能開發者在人機交互層面實現 "虛擬人" 的進化,從而進一步融入到整個行業的 "虛擬人" 發展大勢中。究其本質,是為了面向用戶提供更加智能化、個性化和自然真實的交互體驗。
小布變身的 “魔法彈藥” ,不僅僅是 AI
如果說小布的進化是一次變身,那么 AI 技術可以說是這一變身背后的核心 "魔法彈藥"。
實際上,“萬丈高樓平地起”,無論是小布助手的蛻變升級,還是 OPPO 為開發者構建的開放平臺生態,都是以 OPPO 全棧式 AI 技術生態能力為底座——畢竟,而唯有底座穩健,高樓才能拔地而起。
從 OPPO 在 AI 上的投注來看,其在 AI 上的布局是具備規劃、結合點面的長線思維。其中,AI 框架是 OPPO 整體 AI 能力的重點,也是其 AI 實力的一大體現。
為了構建這一 AI 框架,OPPO 花了相當大的精力成本打造出 OPPO 全棧式 AI 技術生態,據了解,這一 AI 技術生態由 6 個部分組成,主要包括:
計算、網絡、中間件和數據庫的混合云基礎設施層;
面向海量跨系統數據進行存儲與處理的云原生數據湖層;
端側推理、模型壓縮、大規模訓練、AutoML 的端云一體機器學習系統;
語音、NLP、知識圖譜、CV、推薦搜索等基礎能力的 AI 能力層;
跨終端、多場景落地的業務應用層;
為企業提供安全可信的 AI 安全能力層;
眾所周知,機器學習需要大量的數據計算和驗證。OPPO當前已經進入全球50多個國家, ColorOS 月活躍用戶達到了4.6億,龐大的用戶基數也為其全棧式 AI 技術生態累積了海量數據和計算資源。
以季度為單位,視頻云調用超過 4.2 億次,新增照片超過 300 億;大數據每日新增超過 10PB,合云基礎設施覆蓋全球八大區域。
從機器學習系統來看,OPPO 全棧式 AI 技術生態提供了端側和云側兩大部分——其中,位于端側的端側算法引擎、加速框架和模型雅座提供低延時的高效相應;云側則是將上傳到云端的端側數據進行大規模訓練和推理,從而反過來優化端側算法。
在海量數據和出色的算法、算力加持下,OPPO AI 不斷在業內獲得認可,其基于知識的大規模預訓練,包括上下文理解、短文本相似度等語音語義的多項指標多次登頂行業權威評測。
不僅如此,在世界頂級的計算機視覺會議 CVPR 上,OPPO 在 2020 年和 2021 年分別取得了極端超分辨率感知第一、手持設備視覺定位第一和多目標行為分析少樣本分類第一的成績。
另外,從 AI 能力來看,OPPO AI 具備了語音、NLP、知識圖譜、CV、推薦搜索等基礎能力,其端到端生成式對話模型的人工評測滿意度已超過了 85%,屬于行業較高水平;而這一成果已應用在小布生成式閑聊的業務場景中。
在具備強大的 AI 能力之外,安全性也是不可忽視的重要一環。雷鋒網了解到,OPPO AI 安全技術從應用檢測、惡意防護到攻擊對抗等各個方面提供了全方位的安全保障。
官方數據顯示,在應用檢測上,累計檢測 APP 超過 53 萬,發現惡意 APP 超過 1 萬款,瀏覽器每天攔截惡意下載逾300 萬條,并擁有超過 15 萬條隱私政策;在惡意防護上,為用戶過濾惡意行為超過 1140 億次,封禁惡意賬號 280 萬個。
不難看出,OPPO 全棧式 AI 技術生態是 OPPO AI 關鍵能力和技術優勢的落地實踐,為 OPPO 海量的 AI 服務提供了夯實的架構基礎、更高的資源利用效率以及安全可信的隱私保障。
當然,僅僅有 AI 技術能力并不夠。OPPO 希望打造的 AI 生態在具備智慧之外,更重要的是有人性、有溫度。
因此,針對都市人群心理問題,OPPO 發布了 “AI 升溫計劃”,每天為超過200萬人提供暖心陪伴;同時,針對手機適老化,OPPO 打造了小布助手關懷版,已經改善了 700 萬老年用戶的手機使用體驗;針對傳統文化傳承,OPPO 還聯合音樂人阿朵共同推出了“我是民樂守藝人”活動,全網曝光量超過 28 億,以科技創新的形式帶動民樂的傳承推廣。
當然,在雷鋒網看來,OPPO 小布助手的進化,在根本層面反映的是 OPPO 對于 AI 等基礎技術的大力投入和持續積累,對于行業新概念、新趨勢的積極擁抱和不斷探索——但更重要的是,基于對未來人機交互形態的不斷探尋,反映了 OPPO 對于每一個普通用戶的實際產品體驗的極端重視。
從某種程度上來看,無論是語音助手,還是 “虛擬人”,真正優秀的設備使用體驗,必然是建立在對用戶本身的深入理解和感知之上,并且要同時用技術的力量和人文的視角將這種理解和感知體現在具體好用的軟硬件產品之上,才能夠直抵用戶的真正需求。
這也是每一個真正面向消費者的科技公司,都應該如同喬布斯一樣站在科技和人文的交叉口的原因。
畢竟,科技以人為本。