前言
技術(shù)不是一家公司的長期、唯一的壁壘,技術(shù)只是我們撬動這個行業(yè)的起點。
立夏之后5月24日,啟明創(chuàng)投在北京舉辦了第一屆“智啟社”春季沙龍。
這是一場極具啟明創(chuàng)投特色的沙龍,從組織者和主持人(啟明創(chuàng)投負責(zé)科技創(chuàng)新投資的周志峰)到與會者(絕大多數(shù)與會者都是啟明創(chuàng)投的被投企業(yè)的CEO或CTO),都和啟明創(chuàng)投有莫大的關(guān)系。
此外,主辦方還延請了諸位人工智能業(yè)內(nèi)的領(lǐng)頭人,比如微軟首席語音科學(xué)家黃學(xué)東、前金山軟件CEO張宏江、京東集團負責(zé)AI平臺和研究部的副總裁周伯文、騰訊AI實驗室視覺首席科學(xué)家劉威、今日頭條AI實驗室負責(zé)人李航、平安科技的首席醫(yī)療科學(xué)家謝國彤等參加了本次春季沙龍。
(沙龍現(xiàn)場圖)
這場春季沙龍的核心目的之一,是“志同道合的AI從業(yè)者們,一起交流和討論,啟迪心智,共同提高”。啟明創(chuàng)投創(chuàng)始主管合伙人鄺子平在開場致辭時,回顧了啟明從2012年開始系統(tǒng)布局AI的歷程,分享了收獲與遺憾。他希望多聽聽大家的發(fā)言,“希望本次沙龍既沒有特殊的演講者,也沒有聽眾,大家都參與”。
鄺子平的目的達到了。本次沙龍,歷時4個多小時,討論涉及AI底層技術(shù)最新趨勢和其應(yīng)用場景等方面的內(nèi)容。本文只摘錄了AI創(chuàng)業(yè)的商業(yè)模式及其如何突圍的相關(guān)內(nèi)容。京東副總裁周伯文、曠視科技Face++的CEO印奇、云知聲的CEO黃偉、啟明創(chuàng)投合伙人葉冠泰、優(yōu)必選機器人的CTO熊友軍等參與了這一小環(huán)節(jié)的討論。他們無保留地分享了如何構(gòu)建護城河的思考。
(周伯文)
這是本次沙龍討論的小高潮之一,由周伯文而起。他問了云知聲一個問題:一個單向、有深度的技術(shù)創(chuàng)業(yè)公司能否繼續(xù)走下去,能走多遠?所有的人工智能公司都要變成全能型的企業(yè)嗎?(注:云知聲,在發(fā)展過程中,業(yè)務(wù)逐漸多元,技術(shù)能力也從語音拓展到語義,從語義拓展到對話,從對話拓展到針對具體場景的服務(wù))。以下是討論的主要內(nèi)容(略有刪減):
黃偉:創(chuàng)業(yè)公司到底是單點突破還是越做越多?這是一個非常深刻的問題,也是每個CEO應(yīng)該仔細思考的問題。2012年,我們曾經(jīng)很天真地認為只要我們把語音識別做好就可以了。很多人也跟我講,你們就專注去做語音識別,把語音識別做到業(yè)界No.1。如果當(dāng)時我聽了這個建議,云知聲現(xiàn)在已經(jīng)掛了。
(黃偉)
為什么呢?第一,語音和語義是不分家的。語音信號包含在信息里面;第二,無論是用語音識別還是用圖像識別,用戶用的是整個的交互鏈條。比如我說一句話,怎么把噪音處理掉,怎么識別語音,怎么聽到,怎么去理解,怎么去聽懂,聽懂之后怎么把你想要的東西做聚合,這是一個完整的閉環(huán)。如果只做一點,這意味著其他環(huán)節(jié)需要別人來幫你做。誰來幫你做呢?沒人幫你做。
技術(shù)點,并不是孤立的。一個公司去做麥克風(fēng)處理技術(shù),信號處理完后,需要考慮的是怎么跟另外一家語音識別公司進行匹配呢?彼此都是黑盒子,是沒法打通的,不能保證效果的。一個比較理想的情況是,有一個公司或者一兩家公司能夠合作,把整個閉環(huán)的端到端打通。一開始,我們只做語音識別,后來發(fā)現(xiàn)不行,我們還得做語義理解,做完語義理解還不行,我們還得去做知識圖譜,甚至還要去溝通版權(quán)、做內(nèi)容聚合。對我們來說,任何一個環(huán)節(jié)不做,結(jié)果就是nothing。因為用戶要的不只是語音百分之百的精準(zhǔn)識別,他們要的是能解決具體問題的服務(wù),我們必須把整個服務(wù)鏈條做好。
這是一個痛苦的選擇。能力拓展,意味著你要投入資源。這個市場上又沒有那么多優(yōu)秀的人才加入創(chuàng)業(yè)公司,對創(chuàng)業(yè)公司來說,如何突破是一個非常艱難但又不得不做的選擇。我個人認為在市場里,創(chuàng)業(yè)公司要么占一個垂直領(lǐng)域,要么在技術(shù)鏈條上下苦工。前者,或許你的技術(shù)寬度不夠?qū)?,但是在場景里面扎得足夠深,你可以活。后者,十八般武藝你都會,你可能活得更久一點。
葉冠泰:我想跟進一個問題,我們跟創(chuàng)業(yè)公司聊的時候,經(jīng)常說大家要專注,要做得深,您現(xiàn)在說做得廣非常重要,不然就掛掉了。優(yōu)必選做機器人,終極目標(biāo)是做走進千家萬戶的智能人形機器人。你覺得優(yōu)必選是什么東西都要自己做嗎?
(葉冠泰)
黃偉:我覺得專注是一個相對的詞,比如在PC互聯(lián)網(wǎng)時代,你只要專注做好一個網(wǎng)站就夠了。在移動互聯(lián)網(wǎng)時代,一個創(chuàng)業(yè)公司做的事情比PC互聯(lián)網(wǎng)時期要做的多得多。IOT時代,你會做得更多。面向IOT時代,我覺得云知聲和曠視科技今天所做的遠遠不夠,因為未來的場景足夠大、足夠復(fù)雜。
像優(yōu)必選,他們做的是人形機器人,不見得所有的東西都得自己做,云知聲也不見得做完所有的東西,但是關(guān)鍵點是需要自己做的。因為你要確保整個服務(wù)鏈條是能夠跑通的。優(yōu)必選做機器人,可能會把一些聽覺、視覺的技術(shù)外包,但是它不會把機器人拆成18個零件,每一塊都交給一個合作方。所以,我覺得專注是相對的概念,多跟少也是相對的。
葉冠泰:優(yōu)必選對專注是怎么想的?
熊友軍:創(chuàng)業(yè)公司怎么去建自己的護城河,在這一塊,優(yōu)必選走過很多彎路。早期,我們活得非常辛苦。2008年,我們開始準(zhǔn)備做機器人。那時候我們的特長是在運動控制方面。當(dāng)時,我們做機器人,不用自己做元器件,我們?nèi)ベI供應(yīng)商的,從韓國、日本、德國進口了伺服,再結(jié)合著我們擅長的運動控制系統(tǒng),把樣機做了出來,效果還不錯。但是,等到我們?nèi)ヒ?guī)?;a(chǎn)的時候,發(fā)現(xiàn)成本太高了,一個伺服成本差不多要7、8百元,一臺機器人需要24個伺服,成本約近2萬元。成本太高了,根本沒法產(chǎn)業(yè)化。機器人要進入普通家庭,成本超過三千元是比較困難的。
(熊友軍)
于是,我們開始專注做伺服、做舵機,2008年到2012年,我們用了4年時間做舵機,2012年,才把它做得比較穩(wěn)定、可靠,而且價格遠低于韓國、日本,性能還比他們要好。
關(guān)于構(gòu)建護城河的問題,首先我們要找到“城”在哪里。運動控制是優(yōu)必選成立之初的核心優(yōu)勢,但實際上僅憑這一點,根本沒有辦法把公司撐下去。深入到機器人這個領(lǐng)域后,我們才知道這個行業(yè)現(xiàn)在缺的不是運動控制的算法,直到我們找到了真正的核心技術(shù)難題,解決了伺服系統(tǒng)之后,才在2012年注冊成立優(yōu)必選公司,并推出了我們的第一款產(chǎn)品。
第一款產(chǎn)品推出之后,市場反響平平,包括我們自己使用也覺得差強人意。問題出在了機器人跟人的交互上。為了解決這個問題,我們就去找了很多做語音語義的公司,包括云知聲和科大訊飛等。我們跟科大訊飛合作,把它們的語音交互系統(tǒng)跟機器人結(jié)合起來,推出了第二代語音交互機器人。問題又出現(xiàn)了,我們發(fā)現(xiàn)用戶在跟機器人交互的時候,機器人需要識別情緒和情感、及人的身份,還需要觸摸和避障,需要各種各樣的知識。我們發(fā)現(xiàn)太多的東西需要被拓展。
一步一步走過來,我們發(fā)現(xiàn)只有真正深入到行業(yè),真正去做用戶場景,了解客戶的需求,才能找到自己的核心,才能知道如何搭建自己的護城河。如果脫離行業(yè)、脫離產(chǎn)品、脫離客戶需求談護城河,我覺得這是不現(xiàn)實的,甚至是錯的。
周志峰:請問一下印奇,在機器視覺領(lǐng)域,國內(nèi)幾家領(lǐng)先的人工智能公司,以人臉識別算法為例,在LFW等類似的計算機視覺比賽中都取得99.xx%的識別精度。每家公司相差不過0.1% - 0.2%,這是不是意味著在圖像識別這一塊,我們可以認為AI算法已經(jīng)趨同了。在這種情況下,如何構(gòu)建自己的競爭力呢?
(周志峰)
印奇:周總的問題應(yīng)該放在最后,問完了,我就可以走了。剛才的討論很精彩,我覺得我們跟云知聲是兩個挺有意思的AI技術(shù)主賽道。我們有很多類似之處,一開始,講的都是技術(shù)平臺的故事。我們講的是視覺技術(shù)平臺,他們講的是語音技術(shù)平臺。越走越覺得自己走不通。在不斷的進化當(dāng)中,我認為優(yōu)必選實踐出了很好一條路徑。大家不要再覺得我們估值高,優(yōu)必選的估值更高,還有在場的今日頭條,大家可以多向他們請教融資策略。
優(yōu)必選估值高是有理由的,剛才熊總講的最核心的點是“城”在哪里的問題。所有技術(shù)驅(qū)動的AI創(chuàng)業(yè)公司,單點技術(shù)一定不是城。之前去日本,我看了一圈日本的機器人公司,很多技術(shù)在國外很成熟,這都不是城。優(yōu)必選為什么值幾十億億美金?本質(zhì)上,它已經(jīng)走完了一個閉環(huán)。優(yōu)必選的核心是在機器人整體產(chǎn)品的能力,以及品牌、市場、銷售整體運作能力。對于企業(yè)來說,我覺得有兩類的選擇,一種是小城,另一種是大城。如果我們想做一個小而美的公司,像在場的長亭科技,在網(wǎng)絡(luò)安全這個細分領(lǐng)域里,是可以選擇在早期走小而美路徑的。我們曠視科技在巨頭參與的主賽道(機器視覺賽道)里,是沒有選擇的,要么掛掉,要么在一個固定的時間窗口中做大。沒有其他選擇。我們所解的這個命題是在一個固定時間段里怎么做大的問題,起點在哪并不重要。我認為,技術(shù)不是一家公司的長期、唯一的壁壘,技術(shù)只是我們撬動這個行業(yè)的起點。
回到城的話題,在C端,城一定是產(chǎn)品。沒有用戶,其他都不是城。在B端,現(xiàn)在,我們在做B2B2B,甚至B2B2C,我認為只有在某個細分行業(yè)中體現(xiàn)出你的終極價值,才能夠說這是我的城。我覺得,所有的AI公司應(yīng)該不斷往前沖,拿到你的用戶價值,提供各種閉環(huán)的解決方案。
(印奇)
另一方面,技術(shù)為什么是很重要的?技術(shù)是你去攻城略地時,你能比別人稍微跑得快那么一點點的核心區(qū)別。我們不斷請最優(yōu)秀的人提高我們的系統(tǒng),并獲得更多的數(shù)據(jù),這是在階段性獲得技術(shù)的差異化的能力。我認為我們的核心差異還是體現(xiàn)在選行業(yè)和場景上。
回到黃偉說的邏輯,公司是應(yīng)該專注的。我們中間有一個階段是不專注的。因為我們要融資,需要告訴別人Face++是一個平臺公司,因此我們進入了很多的行業(yè)。今年,我們更加自信一點,要做減法,從原來的四五個行業(yè)減到三個行業(yè),明年或許還會更少。我們本質(zhì)上是從從一個行業(yè)切入進去市場,要么從終端的硬件核心元器件切入,要么從上層業(yè)務(wù)和應(yīng)用場景切入。大部分AI公司,基本上是從中間技術(shù)層切入的,切入之后,你要迅速選擇一個方向,我覺得一定要盡快跑到一個端上,要么接地,要么上天。
我們這個行業(yè)競爭很激烈。跟同類型的公司相比,我們發(fā)現(xiàn)大家選的路徑是不太一樣的,我們在做“少”,其他公司在做“多”。當(dāng)我們做少的時候,作為技術(shù)背景的團隊,我們會變得更安心一些。我們無論是選擇現(xiàn)在的三個場景,還是明年的兩個場景,如果銷售額能夠乘以10,這代表你真正構(gòu)建了屬于你的壁壘。但,這是一條非常艱辛的路。