編者按:日前,啟明創(chuàng)投投資企業(yè)蜂巢科技發(fā)布自有品牌“界環(huán)”及首款自有品牌產(chǎn)品——界環(huán)AI音頻眼鏡。界環(huán)認(rèn)為做好智能眼鏡的前提是先做好一副眼鏡,因此,在保證聽覺體驗(yàn)的同時,界環(huán)AI音頻眼鏡力圖在舒適、輕量、時尚等屬性上媲美普通眼鏡,可以像普通眼鏡一樣隨時隨地、長時間佩戴。
蜂巢科技創(chuàng)始人兼CEO夏勇峰日前與極客公園創(chuàng)始人兼總裁張鵬展開對話,他分享了創(chuàng)立蜂巢科技的歷程,選擇深耕頭戴式智能硬件的原因,以及產(chǎn)品研發(fā)的目標(biāo)。談及與大模型技術(shù)浪潮的結(jié)合點(diǎn),他指出,開發(fā)新的AI硬件要抓住手機(jī)和筆記本使用之外的時間,開發(fā)的硬件要能隨時在用戶旁邊,并且與用戶進(jìn)行交互。他表示,此次推出的品牌“界環(huán)”,倡導(dǎo)“融入世界而不喪失自我,取悅自己而不是自我封閉”,蜂巢科技希望能在用戶的日常生活、實(shí)現(xiàn)目標(biāo)的過程中提供幫助和附加價值。
啟明創(chuàng)投微信公眾號經(jīng)授權(quán)轉(zhuǎn)載。
蜂巢科技創(chuàng)始人兼CEO夏勇峰
除了手機(jī)之外,AI硬件最大的機(jī)會是什么?
Ray-Ban Meta銷量破百萬之后,AI眼鏡越來越成為共識。
超過1/4的用戶,每天佩戴10小時以上,每人每天媒體的平均使用時間超過7小時。“眼鏡(作為產(chǎn)品形態(tài))不需要證明什么了。”蜂巢科技創(chuàng)始人兼CEO夏勇峰說。
參與創(chuàng)辦小米生態(tài)鏈的夏勇峰,親眼見證了數(shù)百種硬件產(chǎn)品的誕生,他確信,“百鏡大戰(zhàn)”很快就會發(fā)生,然后迅速教育市場,接下來,“考驗(yàn)的一是資源能力,二是對于AI和硬件的理解力,三是一個組織的效率?!?/strong>
在“界環(huán)AI音頻眼鏡”發(fā)布會之后,夏勇峰與極客公園創(chuàng)始人兼總裁張鵬進(jìn)行了一場關(guān)于AI智能硬件的對話。
以下系經(jīng)精編整理的對話實(shí)錄。
01/
短時間內(nèi)
AR硬件很難變成大眾消費(fèi)品
極客公園:蜂巢科技是怎樣誕生的?包括你自己過去的一些經(jīng)歷。
夏勇峰:從我作為極客公園的一份子開始聊起吧。早些年,我是極客公園最早期的創(chuàng)始員工之一,后來為了圓自己做硬件的夢,在極客公園的同意下,我受邀加入了小米集團(tuán)(編者注:啟明創(chuàng)投投資企業(yè))。
在小米集團(tuán),我最開始是做小米路由器,后來加入了小米生態(tài)鏈的組建。那時候,小米生態(tài)鏈剛剛起步,包括老板在內(nèi)只有三位員工。小米生態(tài)鏈的成立時間是以我2014年1月8日到崗的時間為準(zhǔn)的。我參與了小米手環(huán)、掃地機(jī)器人等一系列產(chǎn)品的發(fā)布,還參與創(chuàng)辦了米家品牌。剛開始米家品牌的各種發(fā)布會其實(shí)都是我來做的。
到了2018年,小米生態(tài)鏈已經(jīng)投了70多家公司,每年做300多個產(chǎn)品。那個時候,我感覺離當(dāng)初做硬件產(chǎn)品經(jīng)理的想法越來越遠(yuǎn),我的日常工作變成了管理工作,和真正做產(chǎn)品已經(jīng)有點(diǎn)距離。
極客公園知道我是一個相對比較理想主義的人,比如早年間我只想當(dāng)記者,不想當(dāng)編輯,要堅持在一線。所以,2018年我跟雷總(編者注:小米集團(tuán)創(chuàng)始人、董事長兼首席執(zhí)行官雷軍)溝通之后,就離開生態(tài)鏈加入了小米手機(jī)部,開始做手機(jī)。做到2020年,我就覺得我給小米集團(tuán)帶來的價值也差不多了,該去實(shí)現(xiàn)一些自己的夢想。
于是,2020年我創(chuàng)辦了蜂巢科技。我們有一個新的定義,就是頭戴式可穿戴智能硬件,我想做這個方向的產(chǎn)品??赡茉谥笫?、二十年、三十年,我們所有的產(chǎn)品都會圍繞這個方向來做。后來我們先后推出了眼鏡、相機(jī)、米家音頻眼鏡等產(chǎn)品,包括“界環(huán)”AI音頻眼鏡,這是我們的一系列產(chǎn)品。
極客公園:2020年創(chuàng)立蜂巢科技時,做的第一代產(chǎn)品是一款眼鏡相機(jī),第二代是一款藍(lán)牙音頻眼鏡,你現(xiàn)在在做“界環(huán)”這款產(chǎn)品,這之間的思路看起來也有一些變化。能不能復(fù)盤一下,這三四年你是怎么走過來的?
夏勇峰:3年時間很短,但對我來說,真的特別漫長。
我們一開始想做頭戴式智能硬件,是因?yàn)楫?dāng)時做完手機(jī)后,發(fā)現(xiàn)大趨勢是手機(jī)每年的全球銷量都在下滑。手機(jī)質(zhì)量越來越好,性能也完全足夠了,所以大家的手機(jī)更換頻率比以前降低了。當(dāng)時我們和很多手機(jī)的重要技術(shù)合作伙伴聊,包括做屏幕的、做芯片的、做相機(jī)的,很多人都呈現(xiàn)出一種長期焦慮感,產(chǎn)業(yè)大到一定的程度之后,其實(shí)找不到新的落點(diǎn)。
當(dāng)時我覺得,可能有手機(jī)技術(shù)溢出的機(jī)會。除了汽車,手機(jī)就應(yīng)該是人類硬件皇冠上的明珠,還帶來了一系列技術(shù)的持續(xù)提升,比如說低功耗、高性能、結(jié)構(gòu)堆疊等等。
我就開始思考,手機(jī)技術(shù)溢出之后,有什么新的硬件產(chǎn)品可以承載這個趨勢?
直觀上來講,如果技術(shù)持續(xù)發(fā)展,目前手持設(shè)備跟數(shù)字世界與真實(shí)世界交互的效果還不夠好。長期交互,應(yīng)該就是五感,這些五感通過某個硬件,比如戒指,直接去跟現(xiàn)實(shí)世界交互就好了。所以我覺得未來,必定有一款可能取代手機(jī)的頭部設(shè)備,成為最重要的隨身智能終端。頭戴式智能硬件領(lǐng)域會涌現(xiàn)非常多的機(jī)會,我就把它設(shè)為了我們公司的一個超長期目標(biāo)。
當(dāng)時正好元宇宙處于起起落落的新一波,自然而然就想把AR作為第一階段的產(chǎn)品方向,現(xiàn)在聽起來有一點(diǎn)狂妄,因?yàn)锳R到現(xiàn)在其實(shí)還沒有非常好的產(chǎn)品。但當(dāng)時我比較樂觀,通過各種渠道和信息,知道好多大廠在研究AR硬件,有些大廠在立項(xiàng),一些代工廠也在做各種各樣的嘗試。所以當(dāng)時預(yù)計5-10年,AR有可能會成為主流硬件。
當(dāng)時的技術(shù)還不夠成熟,就先做了一款眼鏡相機(jī),它是我認(rèn)為頭戴的最小可運(yùn)行模型。有一個近眼顯示的最小屏幕,配置了足夠好的相機(jī)。我做了一個相對比較完善的一體機(jī)體系,可以聯(lián)網(wǎng),同時還能夠支持開發(fā)者在上面充分開發(fā)。系統(tǒng)基于安卓,但是還是有很多的調(diào)整。
這款眼鏡相機(jī)確實(shí)給一些人帶來了價值,但是這個產(chǎn)品有一個很大的問題,我覺得未來的AR眼鏡短期內(nèi)都無法解決,就是用戶所支付的代價遠(yuǎn)遠(yuǎn)大于他們能獲得的回報??赡苤挥杏绣X又向往科技,愿意為信仰充值的人,才會成為早期用戶。
基本上在2022年左右,我就意識到這一點(diǎn),AR很難在相對比較短的時間內(nèi),變成一個大眾的電子消費(fèi)品。
極客公園:今天我依然認(rèn)為長期來看,AR這件事肯定有價值,但這個“長期”究竟有多長?確實(shí)是個值得探討的問題。
你剛才提到了一個關(guān)鍵點(diǎn),認(rèn)為現(xiàn)在如果要做一款真正的AR設(shè)備,還是不太成熟。但隨著AI的興起,很多人認(rèn)為AR可能又重新熱起來了。但你今天的這款眼鏡,既沒有攝像頭,也沒有屏幕,是基于音頻接入AI的。為什么不在產(chǎn)品里加屏幕呢?為什么你不堅持走AR的路線?在過去兩年里,有什么因素影響了你的決策?
夏勇峰:我在發(fā)布會上也提到了,有些非??岬闹悄苎坨R在傳統(tǒng)眼鏡的基礎(chǔ)上邁出了巨大的步伐。但我認(rèn)為,哪怕是一小步,也可能帶來眼鏡行業(yè)的革命性變化。如果這一步走得不夠穩(wěn)健,那么后面的大步可能在短期內(nèi)也不會出現(xiàn)。
比如說,我們提到了Ray-Ban Meta,這是一款相當(dāng)不錯的墨鏡。我們也是希望努力做出一款優(yōu)秀的眼鏡。你可以看到,我們的產(chǎn)品與傳統(tǒng)眼鏡行業(yè)非常接近。正是這種接近,滿足了大家的基本需求,為我們提供了一個相對較大的市場基礎(chǔ)。
如果在這個時候,我們急于推出一款過于創(chuàng)新的產(chǎn)品,反而可能會破壞傳統(tǒng)眼鏡的基本需求。比如,佩戴可能不夠舒適,或者配近視鏡片不夠方便,這樣我們就需要去創(chuàng)造全新的需求,然后告訴大家,盡管眼鏡的基本需求沒有得到很好的滿足,但我們能滿足其他需求。事實(shí)上,至少在目前這個階段,我還沒有發(fā)現(xiàn)真正能夠成立的需求。
極客公園:我挺認(rèn)同你的觀點(diǎn),戴這副眼鏡,我沒有付出太大的代價。但你不加顯示屏這件事,是一個挺有意思的選擇。你的一代產(chǎn)品還是有屏幕的,這次不加屏幕背后的邏輯是什么?
夏勇峰:選擇不加屏幕的核心邏輯是,加了屏幕能帶來什么實(shí)際用途?首先單色Micro LED技術(shù)已經(jīng)非常成熟了,但關(guān)鍵是,它能用來做什么?打個比方,如果你前面加了一個顯示屏幕,價格貴了1500-2000元,你覺得你用它來做什么,能夠讓你心甘情愿地多掏這筆錢?
極客公園:現(xiàn)在市場上的驗(yàn)證是,大家拿它當(dāng)顯示屏,比如看視頻等等,其實(shí)就是個大屏。
夏勇峰:大屏單色顯示是不夠的,你提到的那個更貴,1500元搞不定?,F(xiàn)在大屏Micro LED技術(shù)還沒有完全成熟,我們現(xiàn)在所有的商務(wù)大屏,市面上大部分知名公司用的是Broadbus的方案,那個方案成本相對可控。
最終的AR設(shè)備需要的其實(shí)是一個非常好的Micro LED技術(shù)加上衍射光波導(dǎo)的鏡片,但這個技術(shù)還不成熟。去年有出640×480分辨率的,據(jù)說刷抖音很爽,相當(dāng)于一臺小電視。到明年,我估計它可以提升到1080P,但保守估計,成本至少要提高兩倍以上。即便如此,我覺得它也不能很好地替代手機(jī)或筆記本。
極客公園:核心問題是,今天我付出了很高的成本在眼鏡前加了屏幕,但它依舊不能全面替代手機(jī)或筆記本,所以這個時候去搶占它們的屏幕使用場景并不明智。所以這個決策并不可行,對吧?
夏勇峰:是,它只能作為一個筆記本或手機(jī)的擴(kuò)展屏,就像個配件。
極客公園:如果強(qiáng)行讓這個人自此不再用筆記本和手機(jī),用戶要付出的代價就會比較大。所以你今天反而從之前AR的路線走向了音頻眼鏡。
02/
Ray-Ban Meta的核心
是做好了一款墨鏡
極客公園:我其實(shí)挺好奇你看到大模型領(lǐng)域出現(xiàn)后,是怎樣的心情?是怎么找到跟這個技術(shù)浪潮的結(jié)合點(diǎn)?
夏勇峰:首先我覺得產(chǎn)品越接近傳統(tǒng)眼鏡,它就越能替代它們。這會帶來明顯的好處,因?yàn)橛脩舻幕拘枨蟮玫綕M足,產(chǎn)品佩戴時間就會非常長。如果你做出一款能替代傳統(tǒng)墨鏡的眼鏡,基本上你就錨定了人們每一天戴墨鏡的時間。如果你的產(chǎn)品特別接近傳統(tǒng)眼鏡,比如近視鏡,那么產(chǎn)品的使用時間就會接近傳統(tǒng)眼鏡的使用時間。
我們的后臺數(shù)據(jù)顯示,用戶使用我們產(chǎn)品的時間很長,前25%的用戶每天佩戴超過10個小時,每人每天媒體的平均使用時長超過7個小時。這是非常長的時間。
AI到來之后,如果用戶在手機(jī)或筆記本旁邊,他們肯定會使用手機(jī)和電腦上的AI,用來做PPT、寫稿子、加字幕、外文翻譯等等。因?yàn)橛脩魰苯釉诂F(xiàn)有硬件上使用AI,所以我們開發(fā)新的AI硬件,要抓住手機(jī)和筆記本使用時間之外的時間。開發(fā)的硬件要能在用戶旁邊,并且與用戶進(jìn)行交互。
極客公園:你的意思是,今天不應(yīng)該去嘗試搶占手機(jī)和筆記本的使用時間,那是不可能的。相反,我們應(yīng)該在它們之外找到對用戶有價值的事情,并且這種價值足以讓用戶愿意長時間佩戴。比如VR眼鏡就不行,通常只在看電影時佩戴,之后我們就摘下來了。所以這個產(chǎn)品是推理出來的嗎?
夏勇峰:那也不是。最初我們是先開發(fā)了音頻眼鏡,后來AI技術(shù)興起,我們就發(fā)現(xiàn)AI非常適合這種產(chǎn)品,特別是在用戶不在使用手機(jī)和筆記本的時候,比如開車、騎行或跑步等場景,通過音頻眼鏡使用AI是一種更自然的方式。如果他們在這些時刻需要AI,可能可供選擇的硬件很少。除了眼鏡,我認(rèn)為還有兩個設(shè)備非常適合集成AI,那就是汽車,還有手表或高續(xù)航的手環(huán)。在特殊場景下,人們無法使用手機(jī)或筆記本,這些設(shè)備就能發(fā)揮作用。
極客公園:手環(huán)和手表傳遞價值的方式可能只能是振動,發(fā)出聲音感覺不太合理。眼鏡的位置我覺得比較好,因?yàn)樗梢远Z,這就很合理。
一個大家可能都很關(guān)心的問題是,現(xiàn)在很多人覺得Ray-Ban Meta眼鏡不錯,前面有兩個大大的攝像頭。之前討論了為什么不加屏幕,那你覺得未來你的眼鏡會加攝像頭嗎?這一代沒有攝像頭,未來會有嗎?你是怎么考慮的?
夏勇峰:我也知道現(xiàn)在市面上其實(shí)有很多人在做類似的,無意冒犯大家,我講講純個人觀點(diǎn)。我認(rèn)為Ray-Ban Meta的核心是做好了一款墨鏡。
它是一個與人的社交距離較遠(yuǎn)的設(shè)備。在一些地廣人稀的地方,你在墨鏡上加一個攝像頭,不管用來做什么,至少是合理的。在遠(yuǎn)處人們佩戴一個攝像頭不會對別人構(gòu)成冒犯,但如果在人口密集的地方,每天佩戴著搭載攝像頭的產(chǎn)品,從早到晚。我試過,感覺非常尷尬,給別人帶來的社交壓力,會回到我自己身上。
極客公園:從別人的眼神里你能觀察到,他們覺得這款產(chǎn)品有點(diǎn)可怕。
夏勇峰:對,所以我認(rèn)為加攝像頭的AI眼鏡,和我們現(xiàn)在做的AI音頻眼鏡本質(zhì)上是兩個完全不同的產(chǎn)品。
攝像頭AI眼鏡更適合在一些短時場景里給用戶提供更高的價值,但具體能提供多少,還得看后續(xù)的發(fā)展。它替代墨鏡還可以,但大部分中國人其實(shí)是不戴墨鏡的,外國人才戴。這不是武斷,是從百分比來看的,中國的近視人群相對較多,如果他們要戴墨鏡,要么就是戴隱形,要么就是配一副帶度數(shù)的墨鏡,或者戴一個套鏡,但總體來講,墨鏡的總量百分比遠(yuǎn)低于歐美。在美國很多地方墨鏡是剛需,是每個人必須要買的產(chǎn)品,在這個時候AI眼鏡替代墨鏡,群眾基礎(chǔ)會比較好一些。
墨鏡天然適合加攝像頭,AI又需要攝像頭,這個故事就閉環(huán)了。
極客公園:如果按照這個邏輯來看,你今天選擇的道路并不是從墨鏡的角度出發(fā),而是我們?nèi)粘E宕鞯难坨R,對吧?它本質(zhì)上就是我們?nèi)粘K宕鞯溺R框,只是換成了近視眼鏡,這樣確實(shí)能有效解決問題。
既然我們談到了AI,現(xiàn)在大家都很關(guān)注AI領(lǐng)域,從去年開始,AI已經(jīng)從純語言模型發(fā)展到了更加多模態(tài)的階段。AI的演進(jìn)意味著如果你有攝像頭,你就具備了多模態(tài)的能力。你可以通過視覺去理解很多事情,進(jìn)而幫助解決很多問題,比如看到某個內(nèi)容能翻譯成英文,或者識別出這是什么,這本質(zhì)上就像是攝像頭變成了傳感器。所以產(chǎn)品如果加上一個明顯的、用于拍攝視頻的攝像頭,這已經(jīng)變成了另一個品類。
你現(xiàn)在的產(chǎn)品是智能音頻眼鏡,如果未來要運(yùn)用AI實(shí)現(xiàn)多模態(tài),增加傳感器是否必要?在什么情況下會考慮增加?
夏勇峰:我確實(shí)考慮過這樣的問題,甚至和一些大公司探討過制作demo的可能性。我認(rèn)為可能有兩種方式。
第一種方式是,攝像頭前面的鏡片通常是玻璃的,你可以把它做成電子變色的,由AI控制何時需要開啟。平時它就像是“閉著眼睛”,需要時就“睜開眼睛”,這樣或許能緩解一些隱私問題。另一種情況是,你帶一個攝像頭,AI能分辨圖像,但不能拍照,也不強(qiáng)調(diào)畫質(zhì),并且要讓所有人都知道這不是用來拍照的,而是一個傳感器。因?yàn)锳I需要的分辨率并不高,600×400的分辨率基本上已經(jīng)夠用了,不需要像Ray-Ban Meta那樣高分辨率的攝像頭和高級芯片,以及加載那么多拍照算法。
極客公園:所以,如果從智能的角度來看,確實(shí)有必要加入有效的傳感器,但這一代產(chǎn)品還沒有加。我相信你肯定在這方面做了技術(shù)儲備,剛才提到的加“眼皮”,或者明確告訴大家這是傳感器,沒有拍攝功能,只是識別,才能解決隱私問題。我覺得很有道理。
夏勇峰:需要考慮在人群密度較高的場景下,能否正常無障礙地使用它,這可能和它本身實(shí)現(xiàn)的功能同等重要。
極客公園:那么,如果這種傳感器加入之后,這副眼鏡會實(shí)現(xiàn)一些超越我們想象的能力嗎?
夏勇峰:可以稍微透露一點(diǎn)。與其說它能實(shí)現(xiàn)什么具體功能,不如說它能讓AI更加了解人的意圖。我們之前討論過,未來可能是AI接管一切,你只需要做自己,因?yàn)锳I機(jī)器非常聰明,當(dāng)你做自己的時候,AI基本上就能知道你想要做什么,你的意圖是什么。它可能會取代一些現(xiàn)有的圖形用戶界面(GUI)的功能。我認(rèn)為它能夠幫助機(jī)器更好地識別人的意圖。
極客公園:所以,它實(shí)際上是一種用于識別意圖的傳感器,我們不應(yīng)該將其理解為傳統(tǒng)意義上的攝像頭拍攝功能。這一點(diǎn)可能是核心。
03/
先做好一款好用的音頻眼鏡
然后加入AI
極客公園:加入了AI之后,這一代產(chǎn)品有哪些特點(diǎn)?會帶來哪些與之前音頻眼鏡不同的體驗(yàn)?
夏勇峰:我們其實(shí)設(shè)定了目標(biāo)。第一是要做世界上最好看的眼鏡,顏值即正義。第二,我們要做世界上用起來最舒服的眼鏡。第三,我們要做這個世界上最聰明的眼鏡。
第一個目標(biāo):最好看。我們的眼鏡像傳統(tǒng)眼鏡一樣有很多框型,8框14色,能夠有效提升顏值。
第二個目標(biāo):最好用。我們已經(jīng)開發(fā)了三代音頻眼鏡,這一代在實(shí)際使用體驗(yàn)、人體工程學(xué)設(shè)計以及鏡框方面都有明顯的提升,最輕的只有30.7克,整體佩戴舒適度都有顯著提高。為了制作優(yōu)質(zhì)的眼鏡,我們還提供定制鏡片服務(wù)。如果你不確定要購買什么樣的鏡片,可以直接在我們這里購買眼鏡并配鏡片,確保性價比。
我們的變色鏡片在室內(nèi)可以防藍(lán)光,在室外則自動變?yōu)槟R,能防紫外線,當(dāng)然也相對貴一些?,F(xiàn)在鏡片已經(jīng)正式納入了我們的眼鏡業(yè)務(wù),會統(tǒng)一給大家提供相關(guān)服務(wù)。
第三個聰明,其實(shí)就是說AI。
極客公園:講講AI吧,你的AI音頻眼鏡叫智能眼鏡,這個智能體現(xiàn)在哪里?
夏勇峰:我們的AI,你可以將其簡單理解為是語音助手的升級版。從ChatGPT開始,到現(xiàn)在我們的國產(chǎn)AI模型,在大眾端還沒有出現(xiàn)非常核心、為大眾帶來顯著價值的應(yīng)用,但它擁有無限的可能性,基本上能夠?qū)崿F(xiàn)從文本到文本,語音到語音的轉(zhuǎn)換,這是AI從1.0到現(xiàn)在能夠?yàn)榇蠹規(guī)淼墓δ堋?/span>
對我們來說,什么是語音助手的升級版呢?
當(dāng)你向它提出一個問題后,它能夠識別出你的意圖和不同需求,并將這些需求分配給不同的AI代理(agent)去執(zhí)行。執(zhí)行完畢后,再匯總回答給你。我們稱這些不同的AI代理為“AI小人”,它們在你的眼鏡后面不停地為你工作。比如你說:“明天我想聽聽法國媒體對奧運(yùn)會的評價,請在明天晚上8時前給我一個總結(jié)?!甭牭降腁I小人就會告訴工作小人:“你明天要產(chǎn)出這個內(nèi)容?!钡诙焱砩?時,工作小人會把總結(jié)交給負(fù)責(zé)與你對話的小人,然后這個小人會念給你聽。
與你對話的小人,我們稱之為VUI,即基于語音的用戶界面。當(dāng)基于語音的交互因?yàn)锳I能產(chǎn)生越來越多的價值時,它就會變成一個交互界面。這是利用AI核心目標(biāo)的一部分,我們希望在跨平臺上讓用戶擁有一個統(tǒng)一的VUI體驗(yàn)。
極客公園:我嘗試?yán)斫庖幌?,如果要說這副眼鏡帶來的根本性改變,那就是通過它,你能夠調(diào)用無所不能的AI,圍繞你的目標(biāo)去解決問題,通過這個眼鏡用語音的方式給你完成合適的任務(wù)。
背后的技術(shù)是大模型,也就是你用語音就可以調(diào)動AI,這是交互的核心節(jié)點(diǎn)。我們不用像原來拿著手機(jī)一樣,跟手機(jī)發(fā)消息,我覺得這個是關(guān)鍵的改變。
夏勇峰:如果看背后的架構(gòu),我們是通過眼鏡以及與眼鏡長期連接的手機(jī)App進(jìn)行第一道處理,處理完后,再將用戶的日常生活習(xí)慣與服務(wù)器上的需求進(jìn)行匹配。
在我們的服務(wù)器上,有預(yù)設(shè)的prompt,還有AI Hub,它連接著許多服務(wù),當(dāng)然還有很多AI agent。我們會整體打包,指導(dǎo)它找到適合處理這個事情的大模型,大模型完成工作后結(jié)果返回服務(wù)器,再通過手機(jī)端返回到眼鏡上,基本上的工作邏輯是這樣的。
極客公園:有人說這類似第一代小愛,現(xiàn)在用上大模型,有什么優(yōu)點(diǎn)?
夏勇峰:關(guān)鍵是,第一代小愛發(fā)布的時候,根本沒有大模型。
極客公園:小愛其實(shí)并不具備今天我們說的這種無所不能的能力,對吧?
夏勇峰:舉個例子,我們有一個功能叫做AI通知播報。比如我在飛書上收到了同事發(fā)來的圖片,如果是傳統(tǒng)的通知播報,它沒有任何能力告訴你具體內(nèi)容,你只能掏出手機(jī)來查看飛書。
現(xiàn)在有了AI通知播報,我還沒掏出手機(jī),就聽到信息:“xxx剛才給你發(fā)了一張圖片,可能需要你確認(rèn)?!边@就是AI通知播報的一個例子。當(dāng)然,我們同事也在考慮,是否加入圖像識別,但目前我們還沒打算做。
還有一個例子,這是我真實(shí)遇到的情況,有時候你會突然被拉進(jìn)一個微信群,在設(shè)置免打擾之前,這個群會一直發(fā)出通知聲。如果你戴了這副眼鏡,你不必立刻查看并回應(yīng),甚至不用掏出手機(jī),AI會先自動給你一個小結(jié)。如果你發(fā)現(xiàn)確實(shí)與你相關(guān),再進(jìn)行回復(fù)。AI為你提供了一層篩選,確保你不會錯過重要信息,同時也不會被信息過度打擾。大家現(xiàn)在不得不經(jīng)常查看手機(jī),一看到微信通知就得解鎖手機(jī)。使用AI后,這樣的動作大大減少了。
有些人可能認(rèn)為這不是剛需,但根據(jù)我們之前的數(shù)據(jù)統(tǒng)計,打開通知播報的用戶比例非常高。我們之前有近10萬用戶,超過36%的人開啟了通知播報,即便通知播報有非常多垃圾信息,但他還是打開了。這個確實(shí)是一個挺高頻的需求。
極客公園:我在發(fā)布之前用了測試版,一上來就發(fā)現(xiàn)有通知播報,就打開了微信和飛書這兩個App的通知播報。我發(fā)現(xiàn)它不是簡單地把那個通知給我念一遍,其實(shí)會做一下概括,我后來發(fā)現(xiàn)這一點(diǎn)很好。
這個功能,反而讓我更及時地收到信息,以前我是隔一個小時打開手機(jī)看看有什么事,通知功能對我沒用,因?yàn)槲沂謾C(jī)都不放在身邊,我也不看,但現(xiàn)在可能有一些比較緊急的事,我可以快速響應(yīng)。
經(jīng)常有人給我發(fā)對話的截圖,發(fā)圖是想給我一些背景信息,讓我看看他們是怎么聊的。未來要是能幫我把圖識別了,直接幫我總結(jié)一下,我就不用看截圖里的對話了,那我會非常期待。
夏勇峰:不過識別圖片會有新的問題,它屬于多模態(tài)識別,我們還在討論,還沒有確定要加這個功能。但是AI通知播報我們已經(jīng)優(yōu)化了兩個月,現(xiàn)在可用性其實(shí)蠻高的。
極客公園:如果讓我推薦一個功能,肯定也是通知播報。我用了大概一周,感覺在這種比較智能的總結(jié)播報中能明顯感覺到AI的作用。未來甚至可以讓它去生成簡報,把我要看的內(nèi)容都先概括一下。
我現(xiàn)在用得比較多的是AI通知播報功能,可能未來還會有新的功能??梢越o我們透露一下可能的新功能嗎?
夏勇峰:年底我們會推出“界環(huán)愛聽”,AI cast這個功能。因?yàn)槲覀冇泻芏嗟挠脩舳际侵囟鹊亩鷻C(jī)用戶,或者說重度的音頻內(nèi)容消費(fèi)用戶。舉個例子,我們的用戶里聽小宇宙和喜馬拉雅的用戶占比是非常高的,遠(yuǎn)高于互聯(lián)網(wǎng)的平均占比,他們是重度播客用戶,經(jīng)常會一邊聽播客,一邊干其他的事。
我們做了一款短音頻的應(yīng)用。但是它和短視頻應(yīng)用最大的區(qū)別就是,它不需要那么多的UP主,不需要那么多的真人,每一個UP主都是一個AI小人。比如說,有一個AI小人專門給你講東周的歷史,有一個小人專門給你講三國,有個小人專門給你講笑話,也有小人專門去總結(jié)新聞,像這樣的AI小人會非常多,我們會關(guān)注到播客里有哪些內(nèi)容是比較受歡迎的。
極客公園:就是用agent替代了所謂的UP主,對吧?
夏勇峰:對,它跟短視頻的區(qū)別在于,我們的短音頻的時間會稍微長一些。生成內(nèi)容之后有一個AI小人當(dāng)內(nèi)容審核官,質(zhì)量差的打回去改,質(zhì)量好的就放出來。
剛開始的數(shù)量可能會少一點(diǎn),目前我試用的這個版本每天大概只有20個左右的短音頻,但是未來它會有很多。用戶使用它就像聽播客一樣,不感興趣,往后滑,它就跳到下一個,覺得又不感興趣,再往下滑,當(dāng)你滑得足夠快,你就會發(fā)現(xiàn)你討厭的內(nèi)容漸漸不會出現(xiàn)在你的“界環(huán)愛聽”里面了,然后它逐漸就會知道應(yīng)該給你放什么。這是我們會在今年冬天上線的一個功能。
極客公園:有人問,是覺得UP主還不夠多,還是AI比人強(qiáng)?我說一下我的理解,這些agent本質(zhì)上是要更無限貼合用戶的需求,倒不是說UP主不夠,也可以理解為完全跟你貼合的UP主是不夠的,但不一定說是AI比人強(qiáng)。因?yàn)閁P主再多,也是你在尋找能夠匹配你需求的UP主,而且也不是真人UP主的每個作品你都覺得特別好,人家也不會只為你創(chuàng)造內(nèi)容,但這個AI agent是只為你創(chuàng)造內(nèi)容。
所以我覺得,理論上如果這些平臺有API,你其實(shí)也可以直接去聽那個UP主的內(nèi)容,UP主內(nèi)容也是可以接進(jìn)來。但是如果覺得不夠匹配,AI可以再圍繞你的需求去生成內(nèi)容,那這個其實(shí)就叫真正的大規(guī)模個性化。
夏勇峰:如果覺得這個功能不好,還可以聽小宇宙,我們就當(dāng)一副音頻眼鏡用。如果覺得這個功能好,你就會用。我們逐漸會把它越做越好,因?yàn)楫吘刮抑恍枰狝I小人,我不需要UGC。
極客公園:這個挺好,用戶只要先戴上,使用通知的功能,覺得挺好就長期戴上了。若告知用戶有短音頻功能,如果我本身就有短音頻的消費(fèi)習(xí)慣,那可能就用上了。一開始就是消費(fèi)一些原來認(rèn)識的UP主,逐漸發(fā)現(xiàn),如果不夠還能生成。這就是滴水穿石,緩慢滲透。
04/
不是接了API就叫AI智能硬件
極客公園:真的把大模型塞到硬件里去,還是要做一些基礎(chǔ)功能的,比如怎么搭架構(gòu)、怎么用。AI語音播報這個功能的背后,架構(gòu)怎么搭的?是端側(cè)有模型嗎?還是都是在云端?為什么不直接調(diào)小愛大模型?
夏勇峰:我們現(xiàn)在眼鏡沒有端側(cè)大模型,其實(shí)也沒有必要。一定程度上我們參考了Meta的一些做法,就是通過眼鏡加手機(jī)的App端,一起去做第一道處理。如果未來手機(jī)開放了一些大模型語音的能力,包括分享、通知的權(quán)限,甚至NPU,可以讓我們在上面跑一個小模型的話,肯定會部署端側(cè)的。為了加快本地的處理速度,實(shí)現(xiàn)更多的功能。
但現(xiàn)在還沒有,現(xiàn)在我們是通過App直連到服務(wù)器。首先在App端做了基于語音的一些分析,包括TTS、ASR、音色。在服務(wù)器端,與用戶對話的agent的性格、情緒都是用戶自己設(shè)定的。第二是RAG,第三是AI Hub,我們連了十幾個大模型。我們還有一個AI長期記憶的功能,也就是有更長時間的歷史信息的上下文,由此來更準(zhǔn)確地判斷你的意圖。
把這些實(shí)現(xiàn)了之后,我們還做了內(nèi)容質(zhì)量審核AI,提交給用戶的內(nèi)容質(zhì)量過關(guān)了才能發(fā)給用戶。同時,我們在服務(wù)器端還做了關(guān)于大模型調(diào)度的prompt,把它交給大模型,然后再回來做一些類似的工作,最后推到手機(jī)端,推到眼鏡端。
極客公園:所謂的AI智能硬件,如果只是接個API,是不能交付足夠好的結(jié)果的。它確實(shí)要站在用戶價值上,要做一套比較完整、合理的架構(gòu),然后去合理地調(diào)用。
你們已經(jīng)涉及到不同模型的調(diào)用,甚至涉及到更長期的記憶如何存儲、如何調(diào)用、如何配合。在不同場景、交付不同的價值等情況下,可能都要考慮怎么去更合理地運(yùn)用AI,這個我覺得會成為未來AI智能硬件里很重要的一點(diǎn),它真的不是只接個API就能解決的問題。
因?yàn)槲易罱戳撕脦讉€產(chǎn)品,說“我是AI硬件”,“接了某某的API”。這個不能叫AI硬件,不能很好地解決問題。
為什么花了很長時間在探討怎么定義這個產(chǎn)品?很重要的一點(diǎn)是,夏勇峰不認(rèn)為這副眼鏡能替代手機(jī),他其實(shí)是在手機(jī)的邊緣,來交付一個更好的體驗(yàn)。我覺得這個是核心點(diǎn),因?yàn)閯偛盼覀冋f到很多功能,其實(shí)手機(jī)就能實(shí)現(xiàn)。
但有一點(diǎn)很重要,前端的指令和意圖是通過眼鏡來的,而不是收入到手機(jī)里,也不是直接跟手機(jī)對話。交互的時候,用戶不需要拿出手機(jī),音頻就能交互。這就是剛才你說的VUI。
我們理解GUI,剛才你也說到VUI,還說到NUI,這本質(zhì)上就是未來的交互。未來的交互和交付并不是要替代手機(jī)和電腦,但是它有可能會增加一種更接近用戶自然體驗(yàn)的交互和交付,交互和交付都因?yàn)樗鼤兴煌D阍趺慈ザx和理解所謂的GUI、VUI、NUI?
夏勇峰:GUI其實(shí)就是我們熟知的圖形用戶界面,當(dāng)時對計算機(jī)來講是一次非常重要的革命,因?yàn)橐寵C(jī)器知道人想干什么,其實(shí)是一件很困難的事。計算機(jī)早期的匯編語言都是非常標(biāo)準(zhǔn)化的,這個時候規(guī)定了一種范式,后來就到了智能手機(jī)時代,但是它其實(shí)仍然是一種范式,比如說屏幕,你需要告訴這個機(jī)器,你點(diǎn)到哪了。這就是為什么早期有一些老年人,使用智能手機(jī)其實(shí)有很高的門檻,因?yàn)檫€是需要學(xué)習(xí),雖然學(xué)習(xí)的成本比學(xué)文字輸入、學(xué)QWERTY的鍵盤要簡單一些,但它還是有門檻。
未來整體的交互,很多朋友都認(rèn)為,會進(jìn)入一個NUI自然用戶界面。你只需要做自己就好了,該說什么話說什么話,該做什么動作做什么動作,機(jī)器變得越來越聰明了。
你做自己,機(jī)器就知道你想干什么,然后就給你相應(yīng)的服務(wù),這個是我們認(rèn)為未來的交互,它可能形成了一種形態(tài),特別是在通用大模型出現(xiàn)之后,可能我們沒辦法很快出現(xiàn)通用人工智能,但是讓機(jī)器能夠識別到你的自然行為,這件事情會容易很多。
我認(rèn)為這個也是我們未來眼鏡要實(shí)現(xiàn)的一個目標(biāo),當(dāng)然同時也是因?yàn)椋绻朐谘坨R上用鍵盤打字,或者要用觸摸操作,這基本上也實(shí)現(xiàn)不了。
極客公園:舉個例子,假如說我旁邊有個助理,我用手指這里,跟助理說“把這個關(guān)掉”,這是我們正常的情況,但如果在今天我要去跟小愛同學(xué)交流,我恐怕還得說“小愛同學(xué),把我臥室里的空調(diào)往下調(diào)低多少度”。
但理論上,未來如果你有這樣的一個設(shè)備,假定它是能夠開眼看世界的,有一個傳感器,我說把這個關(guān)掉有點(diǎn)冷,它應(yīng)該就能識別我在哪個空間,同時知道我說的是空調(diào),我不需要去指出具體的要求,這是我具象化一下你說的那個場景。按照這個推理來講,我越來越覺得,真的不考慮加上攝像頭輸入交互嗎?
夏勇峰:攝像頭看了之后,如果還是需要自己去輸入指令給機(jī)器的話,其實(shí)還是VUI,但是機(jī)器有一個攝像頭,可以減少你的輸入成本。
極客公園:就像我說,“把這個關(guān)掉”,而不是說“把臥室的空調(diào)下調(diào)幾度”,這個其實(shí)就降低了我的輸入成本。這個攝像頭本質(zhì)是意圖傳感器,我猜未來肯定會加的。
夏勇峰:我先把VUI做好,其實(shí)對我來說VUI是NUI的一個前置階段,VUI做好的價值就非常大了。
05/
AI不會憑空創(chuàng)造需求
只能無限提升體驗(yàn)
極客公園:耳機(jī)看起來也是可以應(yīng)用VUI的。為什么你做的不是耳機(jī),而是眼鏡呢?
夏勇峰:我覺得耳機(jī)跟墨鏡基本上是一類產(chǎn)品。用戶不是每天無感的,或者從早到晚戴,它是一個有了需求才會戴上,需求結(jié)束馬上摘掉的產(chǎn)品。VUI需要有很多交互,當(dāng)你需要用這個交互的時候,它可能根本不在你的耳朵上。
極客公園:本質(zhì)上還是用戶使用時長不夠。
夏勇峰:你不可能戴一天的耳機(jī),否則走路很危險,開車也用不了。
有人問我們,為什么不做充電盒?因?yàn)槲覀儧]有“不用了就把它摘下來”這樣的一個場景。如果是耳機(jī)不用了,你會把它摘下來,放到充電盒里,它可以繼續(xù)充電,這是很自然的。但是眼鏡就得用一天,所以我們的續(xù)航一定要能用一天,不可能說,我是一個近視的用戶,下午2時就把它摘下來了。
對AI來說,有主動發(fā)出指令,也有被動收到AI通知的場景。比如說通知,主動給你小結(jié)的這種,當(dāng)你耳機(jī)在充電盒里的時候,沒有任何作用,但是如果戴的是一副眼鏡,基本上每天是無縫無感地在使用,這是它最大的一個區(qū)別。
極客公園:這個視角也對,我覺得要從讓用戶能戴上且能長期戴上出發(fā),才能讓AI在需要發(fā)揮作用的時候真的能起到作用。不能把它變成一個“目的地”型的產(chǎn)品,什么時候要用AI了再戴上。所以第一要義就是大家戴上。
這個設(shè)備終于不用再提醒我,你戴了一個智能設(shè)備。它出現(xiàn)一些耳語的時候是給到我驚喜的,因?yàn)槲矣X得就是戴了個眼鏡而已。
這里也涉及到一個考慮,它叫智能音頻眼鏡,很重要的一個功能也確實(shí)就是耳機(jī)的功能,所以你到底是在革新眼鏡還是在革新耳機(jī)?
夏勇峰:我們有一句slogan叫“科技革新傳統(tǒng)眼鏡”,因?yàn)槲覀冎暗挠脩衾铮?9%都是矯正用戶,即近視或者老花用戶。他們用了這個眼鏡之后,如果是長期戴眼鏡的人,基本上是近乎100%替代了自己平常使用的傳統(tǒng)眼鏡,傳統(tǒng)眼鏡就變成了它的備用鏡,所以它的替代性是很明顯的。
但是我們其實(shí)沒有替代耳機(jī)。因?yàn)楝F(xiàn)在對耳機(jī)有很多需求,比如說想安靜的時候,有降噪的需求,我們做不到。打游戲的時候有低延時的需求,這個我們未來可能可以做到,但是現(xiàn)在肯定沒有游戲類的專業(yè)耳機(jī)好。比如說客服戴的耳機(jī),需要一個離嘴非常近的麥克風(fēng)??傊褪牵鷻C(jī)的多樣性非常多,不可能用我們這樣一個音頻類的產(chǎn)品就能覆蓋所有的耳機(jī)需求,但是基本上覆蓋了他們眼鏡的需求,這個是數(shù)據(jù)統(tǒng)計的結(jié)果。
極客公園:有道理,而且如果真的要讓科技革新傳統(tǒng)眼鏡,我就能理解為什么需要考慮很多不同的款型,不能說一出門,發(fā)現(xiàn)大家怎么戴的都是一個款型的眼鏡。
夏勇峰:傳統(tǒng)眼鏡的歷史已經(jīng)證明了,單一款型不奏效。
極客公園:所以它其實(shí)是需要更多個性化的選擇,但同時又要做到讓大家先能戴上,而且長時間地戴上。
這一點(diǎn)我覺得還挺重要的,我們判斷互聯(lián)網(wǎng)的一款產(chǎn)品在未來有沒有進(jìn)一步發(fā)展的能力,核心就是用戶的使用時長。
如果這副眼鏡我一天能戴10個小時,隨著未來傳感能力不斷升級,對我意圖的理解更徹底,那它能幫我干的事一定會更多。如果一天只拿出來用三次,這個硬件我覺得沒前途,就是賣點(diǎn)硬件的錢,甚至模型、所有的功能都無法成長。
所以有可能存在這么一個點(diǎn),我可能說得有點(diǎn)武斷,就是未來AI智能硬件的佩戴時長得三五個小時起步,否則可能還是賣了個AI噱頭,沒有真正長期的成長性。
夏勇峰:AI硬件就是使用AI的硬件。總體來說,人們從早到晚都在用的有兩大巨頭——電腦和手機(jī),產(chǎn)品首先要從兩大巨頭之外找到自己生存的空間,在這個空間里,它要成為大家使用AI的第一優(yōu)先級,這個可能是最基礎(chǔ)的生存條件。
極客公園:今天得到的一個啟發(fā)就是怎么去看AI硬件,有一個很重要的維度,就是到底是拿AI當(dāng)賣點(diǎn)去賣硬件,還是硬件未來能順著AI的能力持續(xù)成長,釋放更大價值。這個核心的分界點(diǎn)就是,用戶到底有多少使用時長,要做到這一點(diǎn),就得先解決用戶的某個確定問題,把它解決好,才可能會有這個資格。
夏勇峰:我也做了幾百種不同的硬件了,越來越感覺到,人的需求能夠不斷地被滿足得更好,但是想要創(chuàng)造一個需求其實(shí)是非常難的。我覺得AI不會憑空給人創(chuàng)造一個之前本身就不存在的需求,它只會讓人的某些需求能夠被滿足得更好,或者是提高某些效率,或者是讓人聽什么內(nèi)容聽得更爽,看什么內(nèi)容看得更爽。
以前某些場景下滿足不了的需求,現(xiàn)在因?yàn)锳I可以滿足了,基本上只能是對需求的進(jìn)一步滿足,不太可能出現(xiàn)之前不存在的需求。比如說需要一個外腦,天天在你旁邊分析你每天從早到晚的事情,我覺得它太寬泛,或者說太理想化了,它得具體到人本身的需求。
可能這一點(diǎn)我也有一些武斷,我覺得需求只會被滿足得更好,但是不可憑空創(chuàng)造需求。我發(fā)現(xiàn)某一些AI硬件,它覺得有了AI可以憑空創(chuàng)造出之前不存在的需求,這一點(diǎn)我持比較謹(jǐn)慎的看法。
極客公園:Ray-Ban Meta的這副眼鏡,大家之所以這么關(guān)心,核心就是,這是所謂的科技眼鏡產(chǎn)品中,第一個賣過百萬臺的,除了之前VR這種被大平臺推薦的產(chǎn)品,這是用戶自己主動去買的設(shè)備。你會怎么判斷它未來可能的走向?
自己內(nèi)部肯定也分析過,今天國內(nèi)至少有幾十家公司要復(fù)刻Ray-Ban Meta。它之所以具有這個所謂的階段性成功,是因?yàn)槭裁??它未來的發(fā)展會遇到什么樣的挑戰(zhàn)?會有可能往哪走?
夏勇峰:海外有一些關(guān)于Ray-Ban Meta的用戶調(diào)研報告,超過40%的用戶對它的第一訴求其實(shí)是第一視角拍攝的視頻質(zhì)量過關(guān),而不是AI。
極客公園:肯定不是,因?yàn)樗鰜淼臅r候還沒有什么AI相關(guān)的產(chǎn)品。
夏勇峰:然后我們再注意到,有很多用戶,其實(shí)首先是需要一副墨鏡,Ray-Ban又是一個足夠好的牌子。我有個朋友跟我說,他走進(jìn)了一家Ray-Ban的店,需要去買一副墨鏡,他發(fā)現(xiàn)有普通墨鏡和Ray-Ban Meta,中間的差價非常少,應(yīng)該是在幾十美元這樣的一個程度,一個是傳統(tǒng)的,一個帶了很多功能,然后用戶就選了Ray-Ban Meta。
極客公園:所以科技幾乎是贈品對吧?是一個讓你覺得很合算的贈品,有點(diǎn)這種感覺?
夏勇峰:反正我是覺得,因?yàn)锳I去買Ray-Ban Meta的人,在目前的用戶群里應(yīng)該是相對少數(shù)。如果沒有AI,它做了一款非常好的智能墨鏡,我覺得也能賣到跟今天相差不遠(yuǎn)的數(shù)量。
極客公園:所以它其實(shí)并不是因?yàn)锳I才火的。本質(zhì)上是一個好的品牌,然后加了科技感和一些有意思的功能的產(chǎn)品,大家一看差價也不太多,原來買個普通Ray-Ban也得這個錢,那就買了。
夏勇峰:但是話說回來,如果AI持續(xù)升級,它有可能從現(xiàn)在的第二賣點(diǎn)上升,直到某一天基于它的用戶群免費(fèi)(眼鏡的AI使用是免費(fèi)的,沒有訂閱費(fèi)),它變成了一個非常高價值的點(diǎn),這個時候它可能會完成從一個足夠好的智能墨鏡到一個真正的AI眼鏡的轉(zhuǎn)變,這是有可能會發(fā)生的。
極客公園:同意。在今年Founder Park的AGI Playground上,我曾經(jīng)做了一個演講,專門分析了Ray-Ban Meta眼鏡為什么成功,探討了在硬件上的一些機(jī)會。
其實(shí)我的觀點(diǎn)跟你很一致,我也認(rèn)為最開始的核心的賣點(diǎn)絕大部分來自于眼鏡本身。但它未來的價值,可能70%會來自于AI。
06/
越是無限可能
越要約束自己的想象
極客公園:如果從我的視角來看,這個產(chǎn)品放在海外,大家就會覺得你不夠猛,比如,怎么可能上來不加傳感器呢?但是我覺得你會關(guān)注的是,它怎樣成為一個穩(wěn)定的、能交付、能滿足用戶需求的產(chǎn)品,用戶不用為我的創(chuàng)新付出過大的代價。先讓大家戴上它,解決問題,然后軟件和AI是可以往上疊加的,功能是可以越做越多的。
再追問一下,今年一開始火起來的AI Pin后來也遇到了很多吐槽,它的問題到底在哪?
夏勇峰:它實(shí)現(xiàn)不了想要的那個感覺,如果硬件概念更多一些,就會知道,不管是投影還是固定的方式,根本不能夠支撐它作為手機(jī)備用品的定位,投影就得有流明的概念,就會設(shè)想它在室外和室內(nèi)的使用問題,其實(shí)通過非常簡單的一些數(shù)據(jù)和參數(shù)的推導(dǎo),就會知道這個產(chǎn)品存在問題。
極客公園:在2013年初,我們倆一起去見張小龍(編者注:騰訊集團(tuán)高級執(zhí)行副總裁,微信事業(yè)群總裁),被他啟發(fā)過。當(dāng)時我們聊到一個結(jié)論,那時候微信看起來有非常好的勢頭,他說:“越是無限可能,越要約束自己的想象?!蹦憧次⑿沤裉煲呀?jīng)成為了能干這么多事的產(chǎn)品,但在那個時刻,其實(shí)我們跟他說了無數(shù)個,你可以干這個,也可以干那個。
他就是特別沉靜,不著急,一步一步地來。我突然想起了這個場景,這個讓我回憶起來還是印象蠻深的。所以AI智能硬件這件事還真的要一步一個腳印的來。
據(jù)我所知,中國已經(jīng)有大量團(tuán)隊(duì)在這種所謂智能眼鏡領(lǐng)域里聚集了,你怎么看?是不是很快會有百鏡大戰(zhàn)了?在這里,最終要能夠活下來,能夠創(chuàng)造更大的價值,你會覺得核心是考驗(yàn)什么?
夏勇峰:我知道的創(chuàng)業(yè)團(tuán)隊(duì)和一些公司的項(xiàng)目中,大部分類似于Ray-Ban Meta,然后也有一部分是基于現(xiàn)有的一些智能眼鏡,直接往上加攝像頭的,你知道它能夠幫你識別內(nèi)容,但是大部分人其實(shí)就是問一下這是什么,然后得到一個回答,嘗嘗鮮。
可能是我了解不夠,現(xiàn)在我還沒有看到更深入的一些應(yīng)用。我覺得未來的百鏡大戰(zhàn)會迅速產(chǎn)生,然后教育市場,會出現(xiàn)非??焖俚奶蕴偷倪^程。
極客公園:漲潮快退潮也快。
夏勇峰:如果出現(xiàn)真正創(chuàng)新的產(chǎn)品,它的崛起也會非常快。不會給慢性子的人留時間、留空間。所以我覺得,考驗(yàn)的一是資源能力,二是對于AI和硬件的理解力,三是一個組織的效率。基本上就是考驗(yàn)這幾點(diǎn),以現(xiàn)在我們所知道的信息,類似這樣的局面應(yīng)該在不久的將來就會到來。
極客公園:我們說百鏡大戰(zhàn)在路上,但是可能也是一場快速的戰(zhàn)役,記得當(dāng)年無人機(jī)曾經(jīng)也有過一波熱潮,后來就消退了,今天應(yīng)該是很多人都在關(guān)注、在做,但把這事做對、做到位,變得很關(guān)鍵。
最后我再追問個問題,蜂巢科技在界環(huán)這樣的品牌下,未來想實(shí)現(xiàn)的是什么目標(biāo)?你階段性想實(shí)現(xiàn)的目標(biāo)到底是什么?你覺得大概會用多長的周期去實(shí)現(xiàn)它?實(shí)現(xiàn)的時候可能會是什么樣?
夏勇峰:所謂界環(huán),就是世界之環(huán)的意思。什么叫世界之環(huán)呢?就是自我和世界,他人即世界,你自己和世界中間的界限,我們想要倡導(dǎo)的理念是“融入世界而不喪失自我,取悅自己而不是自我封閉”。
為什么不做VR,是因?yàn)槲矣X得VR是一個把自己完全封閉起來的產(chǎn)物。我希望在日常生活、實(shí)現(xiàn)目標(biāo)的過程中,它能夠幫助你,給到附加價值,我希望做這類產(chǎn)品。所以眼鏡相機(jī)和現(xiàn)在的音頻眼鏡,其實(shí)目標(biāo)是一致的,就是有自己的目標(biāo),然后不要封閉,但是也不要喪失自我。
我希望現(xiàn)在第一階段實(shí)現(xiàn)的目標(biāo)就是,音頻眼鏡能夠以每年兩倍、三倍銷量的增速去替代傳統(tǒng)眼鏡。今年實(shí)現(xiàn)了這一目標(biāo),我覺得明年大概率也能實(shí)現(xiàn),用3-4年的時間,每年超過100萬副,我覺得它會迎來一些質(zhì)變。目前我的核心還是在滿足傳統(tǒng)眼鏡需求的同時,逐漸去對傳統(tǒng)眼鏡產(chǎn)生一些替代性的作用,能夠在每個人的耳機(jī)使用時間上占到比其他類型耳機(jī)更多的時間。
極客公園:很清晰。我覺得一個優(yōu)秀的創(chuàng)業(yè)者往往是能夠在無限可能的時候約束想象,把每一步走扎實(shí)。聚焦這個階段是什么問題,然后把它解決好。因?yàn)榧夹g(shù)永遠(yuǎn)能給你帶來無限的可能性,只要你把這個產(chǎn)品做扎實(shí),那這些新的功能永遠(yuǎn)不缺。但容易犯的錯誤是,一上來說了一款恢弘的產(chǎn)品,但忽略了該做好的基本功。尤其是在硬件上,軟件還可以改代碼,但硬件就沒機(jī)會了。
來源 | 極客公園