編者按:日前,啟明創(chuàng)投投資企業(yè)蜂巢科技發(fā)布自有品牌“界環(huán)”及首款自有品牌產(chǎn)品——界環(huán)AI音頻眼鏡。界環(huán)認(rèn)為做好智能眼鏡的前提是先做好一副眼鏡,因此,在保證聽覺體驗(yàn)的同時(shí),界環(huán)AI音頻眼鏡力圖在舒適、輕量、時(shí)尚等屬性上媲美普通眼鏡,可以像普通眼鏡一樣隨時(shí)隨地、長時(shí)間佩戴。
蜂巢科技創(chuàng)始人兼CEO夏勇峰日前與極客公園創(chuàng)始人兼總裁張鵬展開對話,他分享了創(chuàng)立蜂巢科技的歷程,選擇深耕頭戴式智能硬件的原因,以及產(chǎn)品研發(fā)的目標(biāo)。談及與大模型技術(shù)浪潮的結(jié)合點(diǎn),他指出,開發(fā)新的AI硬件要抓住手機(jī)和筆記本使用之外的時(shí)間,開發(fā)的硬件要能隨時(shí)在用戶旁邊,并且與用戶進(jìn)行交互。他表示,此次推出的品牌“界環(huán)”,倡導(dǎo)“融入世界而不喪失自我,取悅自己而不是自我封閉”,蜂巢科技希望能在用戶的日常生活、實(shí)現(xiàn)目標(biāo)的過程中提供幫助和附加價(jià)值。
啟明創(chuàng)投微信公眾號經(jīng)授權(quán)轉(zhuǎn)載。
蜂巢科技創(chuàng)始人兼CEO夏勇峰
除了手機(jī)之外,AI硬件最大的機(jī)會(huì)是什么?
Ray-Ban Meta銷量破百萬之后,AI眼鏡越來越成為共識。
超過1/4的用戶,每天佩戴10小時(shí)以上,每人每天媒體的平均使用時(shí)間超過7小時(shí)?!把坨R(作為產(chǎn)品形態(tài))不需要證明什么了?!狈涑部萍紕?chuàng)始人兼CEO夏勇峰說。
參與創(chuàng)辦小米生態(tài)鏈的夏勇峰,親眼見證了數(shù)百種硬件產(chǎn)品的誕生,他確信,“百鏡大戰(zhàn)”很快就會(huì)發(fā)生,然后迅速教育市場,接下來,“考驗(yàn)的一是資源能力,二是對于AI和硬件的理解力,三是一個(gè)組織的效率?!?/strong>
在“界環(huán)AI音頻眼鏡”發(fā)布會(huì)之后,夏勇峰與極客公園創(chuàng)始人兼總裁張鵬進(jìn)行了一場關(guān)于AI智能硬件的對話。
以下系經(jīng)精編整理的對話實(shí)錄。
01/
短時(shí)間內(nèi)
AR硬件很難變成大眾消費(fèi)品
極客公園:蜂巢科技是怎樣誕生的?包括你自己過去的一些經(jīng)歷。
夏勇峰:從我作為極客公園的一份子開始聊起吧。早些年,我是極客公園最早期的創(chuàng)始員工之一,后來為了圓自己做硬件的夢,在極客公園的同意下,我受邀加入了小米集團(tuán)(編者注:啟明創(chuàng)投投資企業(yè))。
在小米集團(tuán),我最開始是做小米路由器,后來加入了小米生態(tài)鏈的組建。那時(shí)候,小米生態(tài)鏈剛剛起步,包括老板在內(nèi)只有三位員工。小米生態(tài)鏈的成立時(shí)間是以我2014年1月8日到崗的時(shí)間為準(zhǔn)的。我參與了小米手環(huán)、掃地機(jī)器人等一系列產(chǎn)品的發(fā)布,還參與創(chuàng)辦了米家品牌。剛開始米家品牌的各種發(fā)布會(huì)其實(shí)都是我來做的。
到了2018年,小米生態(tài)鏈已經(jīng)投了70多家公司,每年做300多個(gè)產(chǎn)品。那個(gè)時(shí)候,我感覺離當(dāng)初做硬件產(chǎn)品經(jīng)理的想法越來越遠(yuǎn),我的日常工作變成了管理工作,和真正做產(chǎn)品已經(jīng)有點(diǎn)距離。
極客公園知道我是一個(gè)相對比較理想主義的人,比如早年間我只想當(dāng)記者,不想當(dāng)編輯,要堅(jiān)持在一線。所以,2018年我跟雷總(編者注:小米集團(tuán)創(chuàng)始人、董事長兼首席執(zhí)行官雷軍)溝通之后,就離開生態(tài)鏈加入了小米手機(jī)部,開始做手機(jī)。做到2020年,我就覺得我給小米集團(tuán)帶來的價(jià)值也差不多了,該去實(shí)現(xiàn)一些自己的夢想。
于是,2020年我創(chuàng)辦了蜂巢科技。我們有一個(gè)新的定義,就是頭戴式可穿戴智能硬件,我想做這個(gè)方向的產(chǎn)品??赡茉谥笫辍⒍?、三十年,我們所有的產(chǎn)品都會(huì)圍繞這個(gè)方向來做。后來我們先后推出了眼鏡、相機(jī)、米家音頻眼鏡等產(chǎn)品,包括“界環(huán)”AI音頻眼鏡,這是我們的一系列產(chǎn)品。
極客公園:2020年創(chuàng)立蜂巢科技時(shí),做的第一代產(chǎn)品是一款眼鏡相機(jī),第二代是一款藍(lán)牙音頻眼鏡,你現(xiàn)在在做“界環(huán)”這款產(chǎn)品,這之間的思路看起來也有一些變化。能不能復(fù)盤一下,這三四年你是怎么走過來的?
夏勇峰:3年時(shí)間很短,但對我來說,真的特別漫長。
我們一開始想做頭戴式智能硬件,是因?yàn)楫?dāng)時(shí)做完手機(jī)后,發(fā)現(xiàn)大趨勢是手機(jī)每年的全球銷量都在下滑。手機(jī)質(zhì)量越來越好,性能也完全足夠了,所以大家的手機(jī)更換頻率比以前降低了。當(dāng)時(shí)我們和很多手機(jī)的重要技術(shù)合作伙伴聊,包括做屏幕的、做芯片的、做相機(jī)的,很多人都呈現(xiàn)出一種長期焦慮感,產(chǎn)業(yè)大到一定的程度之后,其實(shí)找不到新的落點(diǎn)。
當(dāng)時(shí)我覺得,可能有手機(jī)技術(shù)溢出的機(jī)會(huì)。除了汽車,手機(jī)就應(yīng)該是人類硬件皇冠上的明珠,還帶來了一系列技術(shù)的持續(xù)提升,比如說低功耗、高性能、結(jié)構(gòu)堆疊等等。
我就開始思考,手機(jī)技術(shù)溢出之后,有什么新的硬件產(chǎn)品可以承載這個(gè)趨勢?
直觀上來講,如果技術(shù)持續(xù)發(fā)展,目前手持設(shè)備跟數(shù)字世界與真實(shí)世界交互的效果還不夠好。長期交互,應(yīng)該就是五感,這些五感通過某個(gè)硬件,比如戒指,直接去跟現(xiàn)實(shí)世界交互就好了。所以我覺得未來,必定有一款可能取代手機(jī)的頭部設(shè)備,成為最重要的隨身智能終端。頭戴式智能硬件領(lǐng)域會(huì)涌現(xiàn)非常多的機(jī)會(huì),我就把它設(shè)為了我們公司的一個(gè)超長期目標(biāo)。
當(dāng)時(shí)正好元宇宙處于起起落落的新一波,自然而然就想把AR作為第一階段的產(chǎn)品方向,現(xiàn)在聽起來有一點(diǎn)狂妄,因?yàn)锳R到現(xiàn)在其實(shí)還沒有非常好的產(chǎn)品。但當(dāng)時(shí)我比較樂觀,通過各種渠道和信息,知道好多大廠在研究AR硬件,有些大廠在立項(xiàng),一些代工廠也在做各種各樣的嘗試。所以當(dāng)時(shí)預(yù)計(jì)5-10年,AR有可能會(huì)成為主流硬件。
當(dāng)時(shí)的技術(shù)還不夠成熟,就先做了一款眼鏡相機(jī),它是我認(rèn)為頭戴的最小可運(yùn)行模型。有一個(gè)近眼顯示的最小屏幕,配置了足夠好的相機(jī)。我做了一個(gè)相對比較完善的一體機(jī)體系,可以聯(lián)網(wǎng),同時(shí)還能夠支持開發(fā)者在上面充分開發(fā)。系統(tǒng)基于安卓,但是還是有很多的調(diào)整。
這款眼鏡相機(jī)確實(shí)給一些人帶來了價(jià)值,但是這個(gè)產(chǎn)品有一個(gè)很大的問題,我覺得未來的AR眼鏡短期內(nèi)都無法解決,就是用戶所支付的代價(jià)遠(yuǎn)遠(yuǎn)大于他們能獲得的回報(bào)??赡苤挥杏绣X又向往科技,愿意為信仰充值的人,才會(huì)成為早期用戶。
基本上在2022年左右,我就意識到這一點(diǎn),AR很難在相對比較短的時(shí)間內(nèi),變成一個(gè)大眾的電子消費(fèi)品。
極客公園:今天我依然認(rèn)為長期來看,AR這件事肯定有價(jià)值,但這個(gè)“長期”究竟有多長?確實(shí)是個(gè)值得探討的問題。
你剛才提到了一個(gè)關(guān)鍵點(diǎn),認(rèn)為現(xiàn)在如果要做一款真正的AR設(shè)備,還是不太成熟。但隨著AI的興起,很多人認(rèn)為AR可能又重新熱起來了。但你今天的這款眼鏡,既沒有攝像頭,也沒有屏幕,是基于音頻接入AI的。為什么不在產(chǎn)品里加屏幕呢?為什么你不堅(jiān)持走AR的路線?在過去兩年里,有什么因素影響了你的決策?
夏勇峰:我在發(fā)布會(huì)上也提到了,有些非??岬闹悄苎坨R在傳統(tǒng)眼鏡的基礎(chǔ)上邁出了巨大的步伐。但我認(rèn)為,哪怕是一小步,也可能帶來眼鏡行業(yè)的革命性變化。如果這一步走得不夠穩(wěn)健,那么后面的大步可能在短期內(nèi)也不會(huì)出現(xiàn)。
比如說,我們提到了Ray-Ban Meta,這是一款相當(dāng)不錯(cuò)的墨鏡。我們也是希望努力做出一款優(yōu)秀的眼鏡。你可以看到,我們的產(chǎn)品與傳統(tǒng)眼鏡行業(yè)非常接近。正是這種接近,滿足了大家的基本需求,為我們提供了一個(gè)相對較大的市場基礎(chǔ)。
如果在這個(gè)時(shí)候,我們急于推出一款過于創(chuàng)新的產(chǎn)品,反而可能會(huì)破壞傳統(tǒng)眼鏡的基本需求。比如,佩戴可能不夠舒適,或者配近視鏡片不夠方便,這樣我們就需要去創(chuàng)造全新的需求,然后告訴大家,盡管眼鏡的基本需求沒有得到很好的滿足,但我們能滿足其他需求。事實(shí)上,至少在目前這個(gè)階段,我還沒有發(fā)現(xiàn)真正能夠成立的需求。
極客公園:我挺認(rèn)同你的觀點(diǎn),戴這副眼鏡,我沒有付出太大的代價(jià)。但你不加顯示屏這件事,是一個(gè)挺有意思的選擇。你的一代產(chǎn)品還是有屏幕的,這次不加屏幕背后的邏輯是什么?
夏勇峰:選擇不加屏幕的核心邏輯是,加了屏幕能帶來什么實(shí)際用途?首先單色Micro LED技術(shù)已經(jīng)非常成熟了,但關(guān)鍵是,它能用來做什么?打個(gè)比方,如果你前面加了一個(gè)顯示屏幕,價(jià)格貴了1500-2000元,你覺得你用它來做什么,能夠讓你心甘情愿地多掏這筆錢?
極客公園:現(xiàn)在市場上的驗(yàn)證是,大家拿它當(dāng)顯示屏,比如看視頻等等,其實(shí)就是個(gè)大屏。
夏勇峰:大屏單色顯示是不夠的,你提到的那個(gè)更貴,1500元搞不定?,F(xiàn)在大屏Micro LED技術(shù)還沒有完全成熟,我們現(xiàn)在所有的商務(wù)大屏,市面上大部分知名公司用的是Broadbus的方案,那個(gè)方案成本相對可控。
最終的AR設(shè)備需要的其實(shí)是一個(gè)非常好的Micro LED技術(shù)加上衍射光波導(dǎo)的鏡片,但這個(gè)技術(shù)還不成熟。去年有出640×480分辨率的,據(jù)說刷抖音很爽,相當(dāng)于一臺(tái)小電視。到明年,我估計(jì)它可以提升到1080P,但保守估計(jì),成本至少要提高兩倍以上。即便如此,我覺得它也不能很好地替代手機(jī)或筆記本。
極客公園:核心問題是,今天我付出了很高的成本在眼鏡前加了屏幕,但它依舊不能全面替代手機(jī)或筆記本,所以這個(gè)時(shí)候去搶占它們的屏幕使用場景并不明智。所以這個(gè)決策并不可行,對吧?
夏勇峰:是,它只能作為一個(gè)筆記本或手機(jī)的擴(kuò)展屏,就像個(gè)配件。
極客公園:如果強(qiáng)行讓這個(gè)人自此不再用筆記本和手機(jī),用戶要付出的代價(jià)就會(huì)比較大。所以你今天反而從之前AR的路線走向了音頻眼鏡。
02/
Ray-Ban Meta的核心
是做好了一款墨鏡
極客公園:我其實(shí)挺好奇你看到大模型領(lǐng)域出現(xiàn)后,是怎樣的心情?是怎么找到跟這個(gè)技術(shù)浪潮的結(jié)合點(diǎn)?
夏勇峰:首先我覺得產(chǎn)品越接近傳統(tǒng)眼鏡,它就越能替代它們。這會(huì)帶來明顯的好處,因?yàn)橛脩舻幕拘枨蟮玫綕M足,產(chǎn)品佩戴時(shí)間就會(huì)非常長。如果你做出一款能替代傳統(tǒng)墨鏡的眼鏡,基本上你就錨定了人們每一天戴墨鏡的時(shí)間。如果你的產(chǎn)品特別接近傳統(tǒng)眼鏡,比如近視鏡,那么產(chǎn)品的使用時(shí)間就會(huì)接近傳統(tǒng)眼鏡的使用時(shí)間。
我們的后臺(tái)數(shù)據(jù)顯示,用戶使用我們產(chǎn)品的時(shí)間很長,前25%的用戶每天佩戴超過10個(gè)小時(shí),每人每天媒體的平均使用時(shí)長超過7個(gè)小時(shí)。這是非常長的時(shí)間。
AI到來之后,如果用戶在手機(jī)或筆記本旁邊,他們肯定會(huì)使用手機(jī)和電腦上的AI,用來做PPT、寫稿子、加字幕、外文翻譯等等。因?yàn)橛脩魰?huì)直接在現(xiàn)有硬件上使用AI,所以我們開發(fā)新的AI硬件,要抓住手機(jī)和筆記本使用時(shí)間之外的時(shí)間。開發(fā)的硬件要能在用戶旁邊,并且與用戶進(jìn)行交互。
極客公園:你的意思是,今天不應(yīng)該去嘗試搶占手機(jī)和筆記本的使用時(shí)間,那是不可能的。相反,我們應(yīng)該在它們之外找到對用戶有價(jià)值的事情,并且這種價(jià)值足以讓用戶愿意長時(shí)間佩戴。比如VR眼鏡就不行,通常只在看電影時(shí)佩戴,之后我們就摘下來了。所以這個(gè)產(chǎn)品是推理出來的嗎?
夏勇峰:那也不是。最初我們是先開發(fā)了音頻眼鏡,后來AI技術(shù)興起,我們就發(fā)現(xiàn)AI非常適合這種產(chǎn)品,特別是在用戶不在使用手機(jī)和筆記本的時(shí)候,比如開車、騎行或跑步等場景,通過音頻眼鏡使用AI是一種更自然的方式。如果他們在這些時(shí)刻需要AI,可能可供選擇的硬件很少。除了眼鏡,我認(rèn)為還有兩個(gè)設(shè)備非常適合集成AI,那就是汽車,還有手表或高續(xù)航的手環(huán)。在特殊場景下,人們無法使用手機(jī)或筆記本,這些設(shè)備就能發(fā)揮作用。
極客公園:手環(huán)和手表傳遞價(jià)值的方式可能只能是振動(dòng),發(fā)出聲音感覺不太合理。眼鏡的位置我覺得比較好,因?yàn)樗梢远Z,這就很合理。
一個(gè)大家可能都很關(guān)心的問題是,現(xiàn)在很多人覺得Ray-Ban Meta眼鏡不錯(cuò),前面有兩個(gè)大大的攝像頭。之前討論了為什么不加屏幕,那你覺得未來你的眼鏡會(huì)加攝像頭嗎?這一代沒有攝像頭,未來會(huì)有嗎?你是怎么考慮的?
夏勇峰:我也知道現(xiàn)在市面上其實(shí)有很多人在做類似的,無意冒犯大家,我講講純個(gè)人觀點(diǎn)。我認(rèn)為Ray-Ban Meta的核心是做好了一款墨鏡。
它是一個(gè)與人的社交距離較遠(yuǎn)的設(shè)備。在一些地廣人稀的地方,你在墨鏡上加一個(gè)攝像頭,不管用來做什么,至少是合理的。在遠(yuǎn)處人們佩戴一個(gè)攝像頭不會(huì)對別人構(gòu)成冒犯,但如果在人口密集的地方,每天佩戴著搭載攝像頭的產(chǎn)品,從早到晚。我試過,感覺非常尷尬,給別人帶來的社交壓力,會(huì)回到我自己身上。
極客公園:從別人的眼神里你能觀察到,他們覺得這款產(chǎn)品有點(diǎn)可怕。
夏勇峰:對,所以我認(rèn)為加攝像頭的AI眼鏡,和我們現(xiàn)在做的AI音頻眼鏡本質(zhì)上是兩個(gè)完全不同的產(chǎn)品。
攝像頭AI眼鏡更適合在一些短時(shí)場景里給用戶提供更高的價(jià)值,但具體能提供多少,還得看后續(xù)的發(fā)展。它替代墨鏡還可以,但大部分中國人其實(shí)是不戴墨鏡的,外國人才戴。這不是武斷,是從百分比來看的,中國的近視人群相對較多,如果他們要戴墨鏡,要么就是戴隱形,要么就是配一副帶度數(shù)的墨鏡,或者戴一個(gè)套鏡,但總體來講,墨鏡的總量百分比遠(yuǎn)低于歐美。在美國很多地方墨鏡是剛需,是每個(gè)人必須要買的產(chǎn)品,在這個(gè)時(shí)候AI眼鏡替代墨鏡,群眾基礎(chǔ)會(huì)比較好一些。
墨鏡天然適合加攝像頭,AI又需要攝像頭,這個(gè)故事就閉環(huán)了。
極客公園:如果按照這個(gè)邏輯來看,你今天選擇的道路并不是從墨鏡的角度出發(fā),而是我們?nèi)粘E宕鞯难坨R,對吧?它本質(zhì)上就是我們?nèi)粘K宕鞯溺R框,只是換成了近視眼鏡,這樣確實(shí)能有效解決問題。
既然我們談到了AI,現(xiàn)在大家都很關(guān)注AI領(lǐng)域,從去年開始,AI已經(jīng)從純語言模型發(fā)展到了更加多模態(tài)的階段。AI的演進(jìn)意味著如果你有攝像頭,你就具備了多模態(tài)的能力。你可以通過視覺去理解很多事情,進(jìn)而幫助解決很多問題,比如看到某個(gè)內(nèi)容能翻譯成英文,或者識別出這是什么,這本質(zhì)上就像是攝像頭變成了傳感器。所以產(chǎn)品如果加上一個(gè)明顯的、用于拍攝視頻的攝像頭,這已經(jīng)變成了另一個(gè)品類。
你現(xiàn)在的產(chǎn)品是智能音頻眼鏡,如果未來要運(yùn)用AI實(shí)現(xiàn)多模態(tài),增加傳感器是否必要?在什么情況下會(huì)考慮增加?
夏勇峰:我確實(shí)考慮過這樣的問題,甚至和一些大公司探討過制作demo的可能性。我認(rèn)為可能有兩種方式。
第一種方式是,攝像頭前面的鏡片通常是玻璃的,你可以把它做成電子變色的,由AI控制何時(shí)需要開啟。平時(shí)它就像是“閉著眼睛”,需要時(shí)就“睜開眼睛”,這樣或許能緩解一些隱私問題。另一種情況是,你帶一個(gè)攝像頭,AI能分辨圖像,但不能拍照,也不強(qiáng)調(diào)畫質(zhì),并且要讓所有人都知道這不是用來拍照的,而是一個(gè)傳感器。因?yàn)锳I需要的分辨率并不高,600×400的分辨率基本上已經(jīng)夠用了,不需要像Ray-Ban Meta那樣高分辨率的攝像頭和高級芯片,以及加載那么多拍照算法。
極客公園:所以,如果從智能的角度來看,確實(shí)有必要加入有效的傳感器,但這一代產(chǎn)品還沒有加。我相信你肯定在這方面做了技術(shù)儲(chǔ)備,剛才提到的加“眼皮”,或者明確告訴大家這是傳感器,沒有拍攝功能,只是識別,才能解決隱私問題。我覺得很有道理。
夏勇峰:需要考慮在人群密度較高的場景下,能否正常無障礙地使用它,這可能和它本身實(shí)現(xiàn)的功能同等重要。
極客公園:那么,如果這種傳感器加入之后,這副眼鏡會(huì)實(shí)現(xiàn)一些超越我們想象的能力嗎?
夏勇峰:可以稍微透露一點(diǎn)。與其說它能實(shí)現(xiàn)什么具體功能,不如說它能讓AI更加了解人的意圖。我們之前討論過,未來可能是AI接管一切,你只需要做自己,因?yàn)锳I機(jī)器非常聰明,當(dāng)你做自己的時(shí)候,AI基本上就能知道你想要做什么,你的意圖是什么。它可能會(huì)取代一些現(xiàn)有的圖形用戶界面(GUI)的功能。我認(rèn)為它能夠幫助機(jī)器更好地識別人的意圖。
極客公園:所以,它實(shí)際上是一種用于識別意圖的傳感器,我們不應(yīng)該將其理解為傳統(tǒng)意義上的攝像頭拍攝功能。這一點(diǎn)可能是核心。
03/
先做好一款好用的音頻眼鏡
然后加入AI
極客公園:加入了AI之后,這一代產(chǎn)品有哪些特點(diǎn)?會(huì)帶來哪些與之前音頻眼鏡不同的體驗(yàn)?
夏勇峰:我們其實(shí)設(shè)定了目標(biāo)。第一是要做世界上最好看的眼鏡,顏值即正義。第二,我們要做世界上用起來最舒服的眼鏡。第三,我們要做這個(gè)世界上最聰明的眼鏡。
第一個(gè)目標(biāo):最好看。我們的眼鏡像傳統(tǒng)眼鏡一樣有很多框型,8框14色,能夠有效提升顏值。
第二個(gè)目標(biāo):最好用。我們已經(jīng)開發(fā)了三代音頻眼鏡,這一代在實(shí)際使用體驗(yàn)、人體工程學(xué)設(shè)計(jì)以及鏡框方面都有明顯的提升,最輕的只有30.7克,整體佩戴舒適度都有顯著提高。為了制作優(yōu)質(zhì)的眼鏡,我們還提供定制鏡片服務(wù)。如果你不確定要購買什么樣的鏡片,可以直接在我們這里購買眼鏡并配鏡片,確保性價(jià)比。
我們的變色鏡片在室內(nèi)可以防藍(lán)光,在室外則自動(dòng)變?yōu)槟R,能防紫外線,當(dāng)然也相對貴一些?,F(xiàn)在鏡片已經(jīng)正式納入了我們的眼鏡業(yè)務(wù),會(huì)統(tǒng)一給大家提供相關(guān)服務(wù)。
第三個(gè)聰明,其實(shí)就是說AI。
極客公園:講講AI吧,你的AI音頻眼鏡叫智能眼鏡,這個(gè)智能體現(xiàn)在哪里?
夏勇峰:我們的AI,你可以將其簡單理解為是語音助手的升級版。從ChatGPT開始,到現(xiàn)在我們的國產(chǎn)AI模型,在大眾端還沒有出現(xiàn)非常核心、為大眾帶來顯著價(jià)值的應(yīng)用,但它擁有無限的可能性,基本上能夠?qū)崿F(xiàn)從文本到文本,語音到語音的轉(zhuǎn)換,這是AI從1.0到現(xiàn)在能夠?yàn)榇蠹規(guī)淼墓δ堋?/span>
對我們來說,什么是語音助手的升級版呢?
當(dāng)你向它提出一個(gè)問題后,它能夠識別出你的意圖和不同需求,并將這些需求分配給不同的AI代理(agent)去執(zhí)行。執(zhí)行完畢后,再匯總回答給你。我們稱這些不同的AI代理為“AI小人”,它們在你的眼鏡后面不停地為你工作。比如你說:“明天我想聽聽法國媒體對奧運(yùn)會(huì)的評價(jià),請?jiān)诿魈焱砩?時(shí)前給我一個(gè)總結(jié)?!甭牭降腁I小人就會(huì)告訴工作小人:“你明天要產(chǎn)出這個(gè)內(nèi)容?!钡诙焱砩?時(shí),工作小人會(huì)把總結(jié)交給負(fù)責(zé)與你對話的小人,然后這個(gè)小人會(huì)念給你聽。
與你對話的小人,我們稱之為VUI,即基于語音的用戶界面。當(dāng)基于語音的交互因?yàn)锳I能產(chǎn)生越來越多的價(jià)值時(shí),它就會(huì)變成一個(gè)交互界面。這是利用AI核心目標(biāo)的一部分,我們希望在跨平臺(tái)上讓用戶擁有一個(gè)統(tǒng)一的VUI體驗(yàn)。
極客公園:我嘗試?yán)斫庖幌?,如果要說這副眼鏡帶來的根本性改變,那就是通過它,你能夠調(diào)用無所不能的AI,圍繞你的目標(biāo)去解決問題,通過這個(gè)眼鏡用語音的方式給你完成合適的任務(wù)。
背后的技術(shù)是大模型,也就是你用語音就可以調(diào)動(dòng)AI,這是交互的核心節(jié)點(diǎn)。我們不用像原來拿著手機(jī)一樣,跟手機(jī)發(fā)消息,我覺得這個(gè)是關(guān)鍵的改變。
夏勇峰:如果看背后的架構(gòu),我們是通過眼鏡以及與眼鏡長期連接的手機(jī)App進(jìn)行第一道處理,處理完后,再將用戶的日常生活習(xí)慣與服務(wù)器上的需求進(jìn)行匹配。
在我們的服務(wù)器上,有預(yù)設(shè)的prompt,還有AI Hub,它連接著許多服務(wù),當(dāng)然還有很多AI agent。我們會(huì)整體打包,指導(dǎo)它找到適合處理這個(gè)事情的大模型,大模型完成工作后結(jié)果返回服務(wù)器,再通過手機(jī)端返回到眼鏡上,基本上的工作邏輯是這樣的。
極客公園:有人說這類似第一代小愛,現(xiàn)在用上大模型,有什么優(yōu)點(diǎn)?
夏勇峰:關(guān)鍵是,第一代小愛發(fā)布的時(shí)候,根本沒有大模型。
極客公園:小愛其實(shí)并不具備今天我們說的這種無所不能的能力,對吧?
夏勇峰:舉個(gè)例子,我們有一個(gè)功能叫做AI通知播報(bào)。比如我在飛書上收到了同事發(fā)來的圖片,如果是傳統(tǒng)的通知播報(bào),它沒有任何能力告訴你具體內(nèi)容,你只能掏出手機(jī)來查看飛書。
現(xiàn)在有了AI通知播報(bào),我還沒掏出手機(jī),就聽到信息:“xxx剛才給你發(fā)了一張圖片,可能需要你確認(rèn)。”這就是AI通知播報(bào)的一個(gè)例子。當(dāng)然,我們同事也在考慮,是否加入圖像識別,但目前我們還沒打算做。
還有一個(gè)例子,這是我真實(shí)遇到的情況,有時(shí)候你會(huì)突然被拉進(jìn)一個(gè)微信群,在設(shè)置免打擾之前,這個(gè)群會(huì)一直發(fā)出通知聲。如果你戴了這副眼鏡,你不必立刻查看并回應(yīng),甚至不用掏出手機(jī),AI會(huì)先自動(dòng)給你一個(gè)小結(jié)。如果你發(fā)現(xiàn)確實(shí)與你相關(guān),再進(jìn)行回復(fù)。AI為你提供了一層篩選,確保你不會(huì)錯(cuò)過重要信息,同時(shí)也不會(huì)被信息過度打擾。大家現(xiàn)在不得不經(jīng)常查看手機(jī),一看到微信通知就得解鎖手機(jī)。使用AI后,這樣的動(dòng)作大大減少了。
有些人可能認(rèn)為這不是剛需,但根據(jù)我們之前的數(shù)據(jù)統(tǒng)計(jì),打開通知播報(bào)的用戶比例非常高。我們之前有近10萬用戶,超過36%的人開啟了通知播報(bào),即便通知播報(bào)有非常多垃圾信息,但他還是打開了。這個(gè)確實(shí)是一個(gè)挺高頻的需求。
極客公園:我在發(fā)布之前用了測試版,一上來就發(fā)現(xiàn)有通知播報(bào),就打開了微信和飛書這兩個(gè)App的通知播報(bào)。我發(fā)現(xiàn)它不是簡單地把那個(gè)通知給我念一遍,其實(shí)會(huì)做一下概括,我后來發(fā)現(xiàn)這一點(diǎn)很好。
這個(gè)功能,反而讓我更及時(shí)地收到信息,以前我是隔一個(gè)小時(shí)打開手機(jī)看看有什么事,通知功能對我沒用,因?yàn)槲沂謾C(jī)都不放在身邊,我也不看,但現(xiàn)在可能有一些比較緊急的事,我可以快速響應(yīng)。
經(jīng)常有人給我發(fā)對話的截圖,發(fā)圖是想給我一些背景信息,讓我看看他們是怎么聊的。未來要是能幫我把圖識別了,直接幫我總結(jié)一下,我就不用看截圖里的對話了,那我會(huì)非常期待。
夏勇峰:不過識別圖片會(huì)有新的問題,它屬于多模態(tài)識別,我們還在討論,還沒有確定要加這個(gè)功能。但是AI通知播報(bào)我們已經(jīng)優(yōu)化了兩個(gè)月,現(xiàn)在可用性其實(shí)蠻高的。
極客公園:如果讓我推薦一個(gè)功能,肯定也是通知播報(bào)。我用了大概一周,感覺在這種比較智能的總結(jié)播報(bào)中能明顯感覺到AI的作用。未來甚至可以讓它去生成簡報(bào),把我要看的內(nèi)容都先概括一下。
我現(xiàn)在用得比較多的是AI通知播報(bào)功能,可能未來還會(huì)有新的功能??梢越o我們透露一下可能的新功能嗎?
夏勇峰:年底我們會(huì)推出“界環(huán)愛聽”,AI cast這個(gè)功能。因?yàn)槲覀冇泻芏嗟挠脩舳际侵囟鹊亩鷻C(jī)用戶,或者說重度的音頻內(nèi)容消費(fèi)用戶。舉個(gè)例子,我們的用戶里聽小宇宙和喜馬拉雅的用戶占比是非常高的,遠(yuǎn)高于互聯(lián)網(wǎng)的平均占比,他們是重度播客用戶,經(jīng)常會(huì)一邊聽播客,一邊干其他的事。
我們做了一款短音頻的應(yīng)用。但是它和短視頻應(yīng)用最大的區(qū)別就是,它不需要那么多的UP主,不需要那么多的真人,每一個(gè)UP主都是一個(gè)AI小人。比如說,有一個(gè)AI小人專門給你講東周的歷史,有一個(gè)小人專門給你講三國,有個(gè)小人專門給你講笑話,也有小人專門去總結(jié)新聞,像這樣的AI小人會(huì)非常多,我們會(huì)關(guān)注到播客里有哪些內(nèi)容是比較受歡迎的。
極客公園:就是用agent替代了所謂的UP主,對吧?
夏勇峰:對,它跟短視頻的區(qū)別在于,我們的短音頻的時(shí)間會(huì)稍微長一些。生成內(nèi)容之后有一個(gè)AI小人當(dāng)內(nèi)容審核官,質(zhì)量差的打回去改,質(zhì)量好的就放出來。
剛開始的數(shù)量可能會(huì)少一點(diǎn),目前我試用的這個(gè)版本每天大概只有20個(gè)左右的短音頻,但是未來它會(huì)有很多。用戶使用它就像聽播客一樣,不感興趣,往后滑,它就跳到下一個(gè),覺得又不感興趣,再往下滑,當(dāng)你滑得足夠快,你就會(huì)發(fā)現(xiàn)你討厭的內(nèi)容漸漸不會(huì)出現(xiàn)在你的“界環(huán)愛聽”里面了,然后它逐漸就會(huì)知道應(yīng)該給你放什么。這是我們會(huì)在今年冬天上線的一個(gè)功能。
極客公園:有人問,是覺得UP主還不夠多,還是AI比人強(qiáng)?我說一下我的理解,這些agent本質(zhì)上是要更無限貼合用戶的需求,倒不是說UP主不夠,也可以理解為完全跟你貼合的UP主是不夠的,但不一定說是AI比人強(qiáng)。因?yàn)閁P主再多,也是你在尋找能夠匹配你需求的UP主,而且也不是真人UP主的每個(gè)作品你都覺得特別好,人家也不會(huì)只為你創(chuàng)造內(nèi)容,但這個(gè)AI agent是只為你創(chuàng)造內(nèi)容。
所以我覺得,理論上如果這些平臺(tái)有API,你其實(shí)也可以直接去聽那個(gè)UP主的內(nèi)容,UP主內(nèi)容也是可以接進(jìn)來。但是如果覺得不夠匹配,AI可以再圍繞你的需求去生成內(nèi)容,那這個(gè)其實(shí)就叫真正的大規(guī)模個(gè)性化。
夏勇峰:如果覺得這個(gè)功能不好,還可以聽小宇宙,我們就當(dāng)一副音頻眼鏡用。如果覺得這個(gè)功能好,你就會(huì)用。我們逐漸會(huì)把它越做越好,因?yàn)楫吘刮抑恍枰狝I小人,我不需要UGC。
極客公園:這個(gè)挺好,用戶只要先戴上,使用通知的功能,覺得挺好就長期戴上了。若告知用戶有短音頻功能,如果我本身就有短音頻的消費(fèi)習(xí)慣,那可能就用上了。一開始就是消費(fèi)一些原來認(rèn)識的UP主,逐漸發(fā)現(xiàn),如果不夠還能生成。這就是滴水穿石,緩慢滲透。
04/
不是接了API就叫AI智能硬件
極客公園:真的把大模型塞到硬件里去,還是要做一些基礎(chǔ)功能的,比如怎么搭架構(gòu)、怎么用。AI語音播報(bào)這個(gè)功能的背后,架構(gòu)怎么搭的?是端側(cè)有模型嗎?還是都是在云端?為什么不直接調(diào)小愛大模型?
夏勇峰:我們現(xiàn)在眼鏡沒有端側(cè)大模型,其實(shí)也沒有必要。一定程度上我們參考了Meta的一些做法,就是通過眼鏡加手機(jī)的App端,一起去做第一道處理。如果未來手機(jī)開放了一些大模型語音的能力,包括分享、通知的權(quán)限,甚至NPU,可以讓我們在上面跑一個(gè)小模型的話,肯定會(huì)部署端側(cè)的。為了加快本地的處理速度,實(shí)現(xiàn)更多的功能。
但現(xiàn)在還沒有,現(xiàn)在我們是通過App直連到服務(wù)器。首先在App端做了基于語音的一些分析,包括TTS、ASR、音色。在服務(wù)器端,與用戶對話的agent的性格、情緒都是用戶自己設(shè)定的。第二是RAG,第三是AI Hub,我們連了十幾個(gè)大模型。我們還有一個(gè)AI長期記憶的功能,也就是有更長時(shí)間的歷史信息的上下文,由此來更準(zhǔn)確地判斷你的意圖。
把這些實(shí)現(xiàn)了之后,我們還做了內(nèi)容質(zhì)量審核AI,提交給用戶的內(nèi)容質(zhì)量過關(guān)了才能發(fā)給用戶。同時(shí),我們在服務(wù)器端還做了關(guān)于大模型調(diào)度的prompt,把它交給大模型,然后再回來做一些類似的工作,最后推到手機(jī)端,推到眼鏡端。
極客公園:所謂的AI智能硬件,如果只是接個(gè)API,是不能交付足夠好的結(jié)果的。它確實(shí)要站在用戶價(jià)值上,要做一套比較完整、合理的架構(gòu),然后去合理地調(diào)用。
你們已經(jīng)涉及到不同模型的調(diào)用,甚至涉及到更長期的記憶如何存儲(chǔ)、如何調(diào)用、如何配合。在不同場景、交付不同的價(jià)值等情況下,可能都要考慮怎么去更合理地運(yùn)用AI,這個(gè)我覺得會(huì)成為未來AI智能硬件里很重要的一點(diǎn),它真的不是只接個(gè)API就能解決的問題。
因?yàn)槲易罱戳撕脦讉€(gè)產(chǎn)品,說“我是AI硬件”,“接了某某的API”。這個(gè)不能叫AI硬件,不能很好地解決問題。
為什么花了很長時(shí)間在探討怎么定義這個(gè)產(chǎn)品?很重要的一點(diǎn)是,夏勇峰不認(rèn)為這副眼鏡能替代手機(jī),他其實(shí)是在手機(jī)的邊緣,來交付一個(gè)更好的體驗(yàn)。我覺得這個(gè)是核心點(diǎn),因?yàn)閯偛盼覀冋f到很多功能,其實(shí)手機(jī)就能實(shí)現(xiàn)。
但有一點(diǎn)很重要,前端的指令和意圖是通過眼鏡來的,而不是收入到手機(jī)里,也不是直接跟手機(jī)對話。交互的時(shí)候,用戶不需要拿出手機(jī),音頻就能交互。這就是剛才你說的VUI。
我們理解GUI,剛才你也說到VUI,還說到NUI,這本質(zhì)上就是未來的交互。未來的交互和交付并不是要替代手機(jī)和電腦,但是它有可能會(huì)增加一種更接近用戶自然體驗(yàn)的交互和交付,交互和交付都因?yàn)樗鼤?huì)有所不同。你怎么去定義和理解所謂的GUI、VUI、NUI?
夏勇峰:GUI其實(shí)就是我們熟知的圖形用戶界面,當(dāng)時(shí)對計(jì)算機(jī)來講是一次非常重要的革命,因?yàn)橐寵C(jī)器知道人想干什么,其實(shí)是一件很困難的事。計(jì)算機(jī)早期的匯編語言都是非常標(biāo)準(zhǔn)化的,這個(gè)時(shí)候規(guī)定了一種范式,后來就到了智能手機(jī)時(shí)代,但是它其實(shí)仍然是一種范式,比如說屏幕,你需要告訴這個(gè)機(jī)器,你點(diǎn)到哪了。這就是為什么早期有一些老年人,使用智能手機(jī)其實(shí)有很高的門檻,因?yàn)檫€是需要學(xué)習(xí),雖然學(xué)習(xí)的成本比學(xué)文字輸入、學(xué)QWERTY的鍵盤要簡單一些,但它還是有門檻。
未來整體的交互,很多朋友都認(rèn)為,會(huì)進(jìn)入一個(gè)NUI自然用戶界面。你只需要做自己就好了,該說什么話說什么話,該做什么動(dòng)作做什么動(dòng)作,機(jī)器變得越來越聰明了。
你做自己,機(jī)器就知道你想干什么,然后就給你相應(yīng)的服務(wù),這個(gè)是我們認(rèn)為未來的交互,它可能形成了一種形態(tài),特別是在通用大模型出現(xiàn)之后,可能我們沒辦法很快出現(xiàn)通用人工智能,但是讓機(jī)器能夠識別到你的自然行為,這件事情會(huì)容易很多。
我認(rèn)為這個(gè)也是我們未來眼鏡要實(shí)現(xiàn)的一個(gè)目標(biāo),當(dāng)然同時(shí)也是因?yàn)?,如果想在眼鏡上用鍵盤打字,或者要用觸摸操作,這基本上也實(shí)現(xiàn)不了。
極客公園:舉個(gè)例子,假如說我旁邊有個(gè)助理,我用手指這里,跟助理說“把這個(gè)關(guān)掉”,這是我們正常的情況,但如果在今天我要去跟小愛同學(xué)交流,我恐怕還得說“小愛同學(xué),把我臥室里的空調(diào)往下調(diào)低多少度”。
但理論上,未來如果你有這樣的一個(gè)設(shè)備,假定它是能夠開眼看世界的,有一個(gè)傳感器,我說把這個(gè)關(guān)掉有點(diǎn)冷,它應(yīng)該就能識別我在哪個(gè)空間,同時(shí)知道我說的是空調(diào),我不需要去指出具體的要求,這是我具象化一下你說的那個(gè)場景。按照這個(gè)推理來講,我越來越覺得,真的不考慮加上攝像頭輸入交互嗎?
夏勇峰:攝像頭看了之后,如果還是需要自己去輸入指令給機(jī)器的話,其實(shí)還是VUI,但是機(jī)器有一個(gè)攝像頭,可以減少你的輸入成本。
極客公園:就像我說,“把這個(gè)關(guān)掉”,而不是說“把臥室的空調(diào)下調(diào)幾度”,這個(gè)其實(shí)就降低了我的輸入成本。這個(gè)攝像頭本質(zhì)是意圖傳感器,我猜未來肯定會(huì)加的。
夏勇峰:我先把VUI做好,其實(shí)對我來說VUI是NUI的一個(gè)前置階段,VUI做好的價(jià)值就非常大了。
05/
AI不會(huì)憑空創(chuàng)造需求
只能無限提升體驗(yàn)
極客公園:耳機(jī)看起來也是可以應(yīng)用VUI的。為什么你做的不是耳機(jī),而是眼鏡呢?
夏勇峰:我覺得耳機(jī)跟墨鏡基本上是一類產(chǎn)品。用戶不是每天無感的,或者從早到晚戴,它是一個(gè)有了需求才會(huì)戴上,需求結(jié)束馬上摘掉的產(chǎn)品。VUI需要有很多交互,當(dāng)你需要用這個(gè)交互的時(shí)候,它可能根本不在你的耳朵上。
極客公園:本質(zhì)上還是用戶使用時(shí)長不夠。
夏勇峰:你不可能戴一天的耳機(jī),否則走路很危險(xiǎn),開車也用不了。
有人問我們,為什么不做充電盒?因?yàn)槲覀儧]有“不用了就把它摘下來”這樣的一個(gè)場景。如果是耳機(jī)不用了,你會(huì)把它摘下來,放到充電盒里,它可以繼續(xù)充電,這是很自然的。但是眼鏡就得用一天,所以我們的續(xù)航一定要能用一天,不可能說,我是一個(gè)近視的用戶,下午2時(shí)就把它摘下來了。
對AI來說,有主動(dòng)發(fā)出指令,也有被動(dòng)收到AI通知的場景。比如說通知,主動(dòng)給你小結(jié)的這種,當(dāng)你耳機(jī)在充電盒里的時(shí)候,沒有任何作用,但是如果戴的是一副眼鏡,基本上每天是無縫無感地在使用,這是它最大的一個(gè)區(qū)別。
極客公園:這個(gè)視角也對,我覺得要從讓用戶能戴上且能長期戴上出發(fā),才能讓AI在需要發(fā)揮作用的時(shí)候真的能起到作用。不能把它變成一個(gè)“目的地”型的產(chǎn)品,什么時(shí)候要用AI了再戴上。所以第一要義就是大家戴上。
這個(gè)設(shè)備終于不用再提醒我,你戴了一個(gè)智能設(shè)備。它出現(xiàn)一些耳語的時(shí)候是給到我驚喜的,因?yàn)槲矣X得就是戴了個(gè)眼鏡而已。
這里也涉及到一個(gè)考慮,它叫智能音頻眼鏡,很重要的一個(gè)功能也確實(shí)就是耳機(jī)的功能,所以你到底是在革新眼鏡還是在革新耳機(jī)?
夏勇峰:我們有一句slogan叫“科技革新傳統(tǒng)眼鏡”,因?yàn)槲覀冎暗挠脩衾铮?9%都是矯正用戶,即近視或者老花用戶。他們用了這個(gè)眼鏡之后,如果是長期戴眼鏡的人,基本上是近乎100%替代了自己平常使用的傳統(tǒng)眼鏡,傳統(tǒng)眼鏡就變成了它的備用鏡,所以它的替代性是很明顯的。
但是我們其實(shí)沒有替代耳機(jī)。因?yàn)楝F(xiàn)在對耳機(jī)有很多需求,比如說想安靜的時(shí)候,有降噪的需求,我們做不到。打游戲的時(shí)候有低延時(shí)的需求,這個(gè)我們未來可能可以做到,但是現(xiàn)在肯定沒有游戲類的專業(yè)耳機(jī)好。比如說客服戴的耳機(jī),需要一個(gè)離嘴非常近的麥克風(fēng)??傊褪?,耳機(jī)的多樣性非常多,不可能用我們這樣一個(gè)音頻類的產(chǎn)品就能覆蓋所有的耳機(jī)需求,但是基本上覆蓋了他們眼鏡的需求,這個(gè)是數(shù)據(jù)統(tǒng)計(jì)的結(jié)果。
極客公園:有道理,而且如果真的要讓科技革新傳統(tǒng)眼鏡,我就能理解為什么需要考慮很多不同的款型,不能說一出門,發(fā)現(xiàn)大家怎么戴的都是一個(gè)款型的眼鏡。
夏勇峰:傳統(tǒng)眼鏡的歷史已經(jīng)證明了,單一款型不奏效。
極客公園:所以它其實(shí)是需要更多個(gè)性化的選擇,但同時(shí)又要做到讓大家先能戴上,而且長時(shí)間地戴上。
這一點(diǎn)我覺得還挺重要的,我們判斷互聯(lián)網(wǎng)的一款產(chǎn)品在未來有沒有進(jìn)一步發(fā)展的能力,核心就是用戶的使用時(shí)長。
如果這副眼鏡我一天能戴10個(gè)小時(shí),隨著未來傳感能力不斷升級,對我意圖的理解更徹底,那它能幫我干的事一定會(huì)更多。如果一天只拿出來用三次,這個(gè)硬件我覺得沒前途,就是賣點(diǎn)硬件的錢,甚至模型、所有的功能都無法成長。
所以有可能存在這么一個(gè)點(diǎn),我可能說得有點(diǎn)武斷,就是未來AI智能硬件的佩戴時(shí)長得三五個(gè)小時(shí)起步,否則可能還是賣了個(gè)AI噱頭,沒有真正長期的成長性。
夏勇峰:AI硬件就是使用AI的硬件。總體來說,人們從早到晚都在用的有兩大巨頭——電腦和手機(jī),產(chǎn)品首先要從兩大巨頭之外找到自己生存的空間,在這個(gè)空間里,它要成為大家使用AI的第一優(yōu)先級,這個(gè)可能是最基礎(chǔ)的生存條件。
極客公園:今天得到的一個(gè)啟發(fā)就是怎么去看AI硬件,有一個(gè)很重要的維度,就是到底是拿AI當(dāng)賣點(diǎn)去賣硬件,還是硬件未來能順著AI的能力持續(xù)成長,釋放更大價(jià)值。這個(gè)核心的分界點(diǎn)就是,用戶到底有多少使用時(shí)長,要做到這一點(diǎn),就得先解決用戶的某個(gè)確定問題,把它解決好,才可能會(huì)有這個(gè)資格。
夏勇峰:我也做了幾百種不同的硬件了,越來越感覺到,人的需求能夠不斷地被滿足得更好,但是想要?jiǎng)?chuàng)造一個(gè)需求其實(shí)是非常難的。我覺得AI不會(huì)憑空給人創(chuàng)造一個(gè)之前本身就不存在的需求,它只會(huì)讓人的某些需求能夠被滿足得更好,或者是提高某些效率,或者是讓人聽什么內(nèi)容聽得更爽,看什么內(nèi)容看得更爽。
以前某些場景下滿足不了的需求,現(xiàn)在因?yàn)锳I可以滿足了,基本上只能是對需求的進(jìn)一步滿足,不太可能出現(xiàn)之前不存在的需求。比如說需要一個(gè)外腦,天天在你旁邊分析你每天從早到晚的事情,我覺得它太寬泛,或者說太理想化了,它得具體到人本身的需求。
可能這一點(diǎn)我也有一些武斷,我覺得需求只會(huì)被滿足得更好,但是不可憑空創(chuàng)造需求。我發(fā)現(xiàn)某一些AI硬件,它覺得有了AI可以憑空創(chuàng)造出之前不存在的需求,這一點(diǎn)我持比較謹(jǐn)慎的看法。
極客公園:Ray-Ban Meta的這副眼鏡,大家之所以這么關(guān)心,核心就是,這是所謂的科技眼鏡產(chǎn)品中,第一個(gè)賣過百萬臺(tái)的,除了之前VR這種被大平臺(tái)推薦的產(chǎn)品,這是用戶自己主動(dòng)去買的設(shè)備。你會(huì)怎么判斷它未來可能的走向?
自己內(nèi)部肯定也分析過,今天國內(nèi)至少有幾十家公司要復(fù)刻Ray-Ban Meta。它之所以具有這個(gè)所謂的階段性成功,是因?yàn)槭裁??它未來的發(fā)展會(huì)遇到什么樣的挑戰(zhàn)?會(huì)有可能往哪走?
夏勇峰:海外有一些關(guān)于Ray-Ban Meta的用戶調(diào)研報(bào)告,超過40%的用戶對它的第一訴求其實(shí)是第一視角拍攝的視頻質(zhì)量過關(guān),而不是AI。
極客公園:肯定不是,因?yàn)樗鰜淼臅r(shí)候還沒有什么AI相關(guān)的產(chǎn)品。
夏勇峰:然后我們再注意到,有很多用戶,其實(shí)首先是需要一副墨鏡,Ray-Ban又是一個(gè)足夠好的牌子。我有個(gè)朋友跟我說,他走進(jìn)了一家Ray-Ban的店,需要去買一副墨鏡,他發(fā)現(xiàn)有普通墨鏡和Ray-Ban Meta,中間的差價(jià)非常少,應(yīng)該是在幾十美元這樣的一個(gè)程度,一個(gè)是傳統(tǒng)的,一個(gè)帶了很多功能,然后用戶就選了Ray-Ban Meta。
極客公園:所以科技幾乎是贈(zèng)品對吧?是一個(gè)讓你覺得很合算的贈(zèng)品,有點(diǎn)這種感覺?
夏勇峰:反正我是覺得,因?yàn)锳I去買Ray-Ban Meta的人,在目前的用戶群里應(yīng)該是相對少數(shù)。如果沒有AI,它做了一款非常好的智能墨鏡,我覺得也能賣到跟今天相差不遠(yuǎn)的數(shù)量。
極客公園:所以它其實(shí)并不是因?yàn)锳I才火的。本質(zhì)上是一個(gè)好的品牌,然后加了科技感和一些有意思的功能的產(chǎn)品,大家一看差價(jià)也不太多,原來買個(gè)普通Ray-Ban也得這個(gè)錢,那就買了。
夏勇峰:但是話說回來,如果AI持續(xù)升級,它有可能從現(xiàn)在的第二賣點(diǎn)上升,直到某一天基于它的用戶群免費(fèi)(眼鏡的AI使用是免費(fèi)的,沒有訂閱費(fèi)),它變成了一個(gè)非常高價(jià)值的點(diǎn),這個(gè)時(shí)候它可能會(huì)完成從一個(gè)足夠好的智能墨鏡到一個(gè)真正的AI眼鏡的轉(zhuǎn)變,這是有可能會(huì)發(fā)生的。
極客公園:同意。在今年Founder Park的AGI Playground上,我曾經(jīng)做了一個(gè)演講,專門分析了Ray-Ban Meta眼鏡為什么成功,探討了在硬件上的一些機(jī)會(huì)。
其實(shí)我的觀點(diǎn)跟你很一致,我也認(rèn)為最開始的核心的賣點(diǎn)絕大部分來自于眼鏡本身。但它未來的價(jià)值,可能70%會(huì)來自于AI。
06/
越是無限可能
越要約束自己的想象
極客公園:如果從我的視角來看,這個(gè)產(chǎn)品放在海外,大家就會(huì)覺得你不夠猛,比如,怎么可能上來不加傳感器呢?但是我覺得你會(huì)關(guān)注的是,它怎樣成為一個(gè)穩(wěn)定的、能交付、能滿足用戶需求的產(chǎn)品,用戶不用為我的創(chuàng)新付出過大的代價(jià)。先讓大家戴上它,解決問題,然后軟件和AI是可以往上疊加的,功能是可以越做越多的。
再追問一下,今年一開始火起來的AI Pin后來也遇到了很多吐槽,它的問題到底在哪?
夏勇峰:它實(shí)現(xiàn)不了想要的那個(gè)感覺,如果硬件概念更多一些,就會(huì)知道,不管是投影還是固定的方式,根本不能夠支撐它作為手機(jī)備用品的定位,投影就得有流明的概念,就會(huì)設(shè)想它在室外和室內(nèi)的使用問題,其實(shí)通過非常簡單的一些數(shù)據(jù)和參數(shù)的推導(dǎo),就會(huì)知道這個(gè)產(chǎn)品存在問題。
極客公園:在2013年初,我們倆一起去見張小龍(編者注:騰訊集團(tuán)高級執(zhí)行副總裁,微信事業(yè)群總裁),被他啟發(fā)過。當(dāng)時(shí)我們聊到一個(gè)結(jié)論,那時(shí)候微信看起來有非常好的勢頭,他說:“越是無限可能,越要約束自己的想象。”你看微信今天已經(jīng)成為了能干這么多事的產(chǎn)品,但在那個(gè)時(shí)刻,其實(shí)我們跟他說了無數(shù)個(gè),你可以干這個(gè),也可以干那個(gè)。
他就是特別沉靜,不著急,一步一步地來。我突然想起了這個(gè)場景,這個(gè)讓我回憶起來還是印象蠻深的。所以AI智能硬件這件事還真的要一步一個(gè)腳印的來。
據(jù)我所知,中國已經(jīng)有大量團(tuán)隊(duì)在這種所謂智能眼鏡領(lǐng)域里聚集了,你怎么看?是不是很快會(huì)有百鏡大戰(zhàn)了?在這里,最終要能夠活下來,能夠創(chuàng)造更大的價(jià)值,你會(huì)覺得核心是考驗(yàn)什么?
夏勇峰:我知道的創(chuàng)業(yè)團(tuán)隊(duì)和一些公司的項(xiàng)目中,大部分類似于Ray-Ban Meta,然后也有一部分是基于現(xiàn)有的一些智能眼鏡,直接往上加攝像頭的,你知道它能夠幫你識別內(nèi)容,但是大部分人其實(shí)就是問一下這是什么,然后得到一個(gè)回答,嘗嘗鮮。
可能是我了解不夠,現(xiàn)在我還沒有看到更深入的一些應(yīng)用。我覺得未來的百鏡大戰(zhàn)會(huì)迅速產(chǎn)生,然后教育市場,會(huì)出現(xiàn)非??焖俚奶蕴偷倪^程。
極客公園:漲潮快退潮也快。
夏勇峰:如果出現(xiàn)真正創(chuàng)新的產(chǎn)品,它的崛起也會(huì)非常快。不會(huì)給慢性子的人留時(shí)間、留空間。所以我覺得,考驗(yàn)的一是資源能力,二是對于AI和硬件的理解力,三是一個(gè)組織的效率。基本上就是考驗(yàn)這幾點(diǎn),以現(xiàn)在我們所知道的信息,類似這樣的局面應(yīng)該在不久的將來就會(huì)到來。
極客公園:我們說百鏡大戰(zhàn)在路上,但是可能也是一場快速的戰(zhàn)役,記得當(dāng)年無人機(jī)曾經(jīng)也有過一波熱潮,后來就消退了,今天應(yīng)該是很多人都在關(guān)注、在做,但把這事做對、做到位,變得很關(guān)鍵。
最后我再追問個(gè)問題,蜂巢科技在界環(huán)這樣的品牌下,未來想實(shí)現(xiàn)的是什么目標(biāo)?你階段性想實(shí)現(xiàn)的目標(biāo)到底是什么?你覺得大概會(huì)用多長的周期去實(shí)現(xiàn)它?實(shí)現(xiàn)的時(shí)候可能會(huì)是什么樣?
夏勇峰:所謂界環(huán),就是世界之環(huán)的意思。什么叫世界之環(huán)呢?就是自我和世界,他人即世界,你自己和世界中間的界限,我們想要倡導(dǎo)的理念是“融入世界而不喪失自我,取悅自己而不是自我封閉”。
為什么不做VR,是因?yàn)槲矣X得VR是一個(gè)把自己完全封閉起來的產(chǎn)物。我希望在日常生活、實(shí)現(xiàn)目標(biāo)的過程中,它能夠幫助你,給到附加價(jià)值,我希望做這類產(chǎn)品。所以眼鏡相機(jī)和現(xiàn)在的音頻眼鏡,其實(shí)目標(biāo)是一致的,就是有自己的目標(biāo),然后不要封閉,但是也不要喪失自我。
我希望現(xiàn)在第一階段實(shí)現(xiàn)的目標(biāo)就是,音頻眼鏡能夠以每年兩倍、三倍銷量的增速去替代傳統(tǒng)眼鏡。今年實(shí)現(xiàn)了這一目標(biāo),我覺得明年大概率也能實(shí)現(xiàn),用3-4年的時(shí)間,每年超過100萬副,我覺得它會(huì)迎來一些質(zhì)變。目前我的核心還是在滿足傳統(tǒng)眼鏡需求的同時(shí),逐漸去對傳統(tǒng)眼鏡產(chǎn)生一些替代性的作用,能夠在每個(gè)人的耳機(jī)使用時(shí)間上占到比其他類型耳機(jī)更多的時(shí)間。
極客公園:很清晰。我覺得一個(gè)優(yōu)秀的創(chuàng)業(yè)者往往是能夠在無限可能的時(shí)候約束想象,把每一步走扎實(shí)。聚焦這個(gè)階段是什么問題,然后把它解決好。因?yàn)榧夹g(shù)永遠(yuǎn)能給你帶來無限的可能性,只要你把這個(gè)產(chǎn)品做扎實(shí),那這些新的功能永遠(yuǎn)不缺。但容易犯的錯(cuò)誤是,一上來說了一款恢弘的產(chǎn)品,但忽略了該做好的基本功。尤其是在硬件上,軟件還可以改代碼,但硬件就沒機(jī)會(huì)了。
來源 | 極客公園