智東西(公眾號:zhidxcom)
文 | 季瑜生
當經歷了2017年的瘋狂點位大戰以及2018年的巔峰急墜之後,智能貨櫃終於迎來了行業的終極形態——3D動態智能貨櫃!
3D動態智能貨櫃就能為這個行業帶來了什麽?高空間利用率、精準商品識別效率以及低計算量之外,技術是否已經成熟,產業鏈的構建是否完善,巨頭們到底有誰在瓜分這塊距離用戶最近的蛋糕?
帶著這些問題,在過去的幾周裏,智東西在采訪了數十位行業頭部玩家以及領域內專家後發現:當前的3D動態視覺貨櫃正處在大規模爆發的前夜,壹場關於技術以及點位搶占的商業競賽在2019年壹觸即發。
壹、壹年升級四次,智能貨櫃終極形態顯現
站在3D動態貨櫃破空而出的當下,我們會發現在經歷了壹年多的發展後,無人貨櫃早已脫離了草莽階段,精細化運營以及角色區分正成為當下行業的壹大趨勢。
這壹階段,出現了阿裏為代表的智能貨櫃平臺商,以每日優鮮為代表的貨櫃運營商,以及以小賣櫃為代表的整體貨櫃制造商,進壹步拓展到產業鏈上遊,我們會發現以圖漾 科技 為代表的3D攝像頭廠商已經準備就緒,同時以深視 科技 為代表的3D動態子模塊提供商也早已等待多時。
而從技術角度來看,妳會發現壹切發展的迅速而又靜默,短短壹年多時間,產品方案就已經經歷了四代升級。
從無人貨架進化到智能貨櫃的第壹代雛形大概發生在2017年初,當年4月“CITYBOX”智能貨櫃上線,主要采用了RFID頻射標簽進行自動扣款的方式。
在這種運營方式中,每壹件商品都會貼上壹個成本大約為5毛的RFID標簽,然後貨櫃的每壹層都會裝上相應的傳感器,價格約在千元左右,商品進出全部會被傳感器所捕捉。
但是沒過多久,RFID方案就由於用戶可能撕標簽帶來商品盜損,以及部署、運營成本過高而迅速被市場淘汰。曾有業內人士笑稱,做RFID方案貨櫃的最後都是給標簽廠打工的。
接著,到了2018年年初,以非典型智能貨櫃玩家深蘭 科技 為代表的機器視覺智能貨櫃面世,將智能貨櫃的市場帶到了“攝像頭”時代。
這壹時期的智能貨櫃會在每層的頂部中央位置都放壹個攝像頭,或者在每層的左右兩側各布壹個攝像頭,然後算法會根據每層的攝像頭記錄下的貨櫃開門前後每層商品的變化來完成扣款。
但是這種方案由於需要攝像頭完整的拍到每層商品變化,因此這就需要商品的擺放不能發生堆疊,並且攝像頭與商品中間也要留出很大空距,因此這壹方案雖然保障了安全但卻造成了極高的空間浪費。
另外,壹旦需要對SKU進行增減,靜態方案就需要對單品SKU的訓練進行不斷的位置調整訓練,以應對各種可能的取放情況,因此方案整體會出現過擬合以及對SKU品類限制較高的情況。當前市面上的主流靜態方案應用還都停留在賣飲料等典型標品的階段。
可以彌補這種缺陷的則是動態視覺方案,2018年3月,YI Tunnel在“中國零售數字化創新大會”上首先亮相了這項技術。同樣是以計算機視覺識別商品,動態方案利用的是門口的四個攝像頭來識別用戶開門後手上的商品,因此對於貨櫃內部商品的擺放幾乎沒有任何要求,同時也減少了智能貨櫃內部的攝像頭數量。
不過與靜態識別可以將所有數據上傳雲端後再進行識別不同,動態識別需要對連續多幀的圖像中的每壹個像素點都進行識別,需要進行大計算量的本地化部署。具體來說,傳統動態方案通常需要攝像頭配備720的像素,每秒60幀的速率。計算所需的最普通的壹個1070的顯卡就要五千塊左右,另外還需要主板、CPU、內存、封裝等壹系列配置,最後,壹套系統部署下來單櫃成本就會提升近萬元。
為了降低本地化部署的成本同時降低背景對識別效率的影響,3D動態方案在2019年年初正式登場。
3D動態方案與傳統動態方案的主要區別在於壹個用於定位的3D攝像頭的引入,它可以原有的2D攝像頭抓拍中從空間角度對用戶手上的物品進行像素級定位,進而將無關背景做到擦除,只識別特定區域內的商品,做到減少計算量從而降低成本的目標。
二、三大頭部入場,2019戰事壹觸即發
在3D動態視覺貨櫃迎來爆發的前夜,最先面世的產品是小賣櫃在2018年12月中旬發布的“極目系列動態視覺智能貨櫃”。
有業內人士透露,當前小賣櫃的這壹款產品事實上還沒有進入大規模的地推階段,不過已經有了小範圍的量產,在壹些展會上我們可以看到該款產品的亮相。
從技術角度來看,這款產品是主要利用Intel OpenVINO AI工具包開發,基於3D+2D的動態視覺識別輔以重力感應的方式,貨櫃可以容納240件商品堆疊放置,而結算的準確率則可以達到99%。無論用戶單手、雙手還是多次取放都能做到實時交互與識別。
硬件配備上,極目系列動態視覺智能貨櫃使用的是壹款低功耗的邊緣計算設備來實現模型推導加速,可以在用戶關門的瞬間,在本地就完成結算,極大的縮短了用戶購物的結算時間與寬帶成本。
耗電量上,這款產品的容量櫃機容量510升 ,還配上了壹塊21.5寸的LED大屏,可以實時顯現用戶取放的商品及定價,但是功耗僅為3度/天。
除了整櫃制造商小賣櫃外,當前阿裏也在以平臺商的角度對這壹方面進行積極的 探索 。
自2016年的雙十壹起,阿裏的新零售智能事業群就已經開始了智能貨櫃的立項,到了2018年年底,正式開始了對3D動態智能貨櫃的 探索 。
據悉,阿裏為了鋪設這套3D動態方案曾經前後接觸過三家方案商的產品,其中準確率、售價、用戶體驗都是重要考量。
不過據阿裏內部人士表示,設備正式鋪開之前,設備還需要壹段時間的測試與優化,當前在阿裏巴巴的西溪園區已經有了少量設備開始了測試。 預計今年的11月份左右,阿裏將對這套設備進行大範圍的鋪展推廣 。
貨櫃運營商每日優鮮方面,有消息稱其早在2018年的四月左右就已經開始了對3D動態視覺方案的 探索 ,當前已經在個別點位進行了試運營。
三、迎接市場爆發,三維視覺算法提供商已經就位
“如果三維的方案都跑不出來,智能貨櫃也就別做了。”在問及關於智能貨櫃未來幾年的發展後,深視 科技 CEO張磊這樣對智東西表示。
深視 科技 是壹家計算機三維視覺算法提供商,核心創始人員均畢業於北大電子系,擁有芯片、算法、計算機視覺等多個領域十余年工作經歷,同時擁有多項相關的行業專利。
早在2017年年中的無人貨架浪潮剛剛興起的時候,張磊與其他兩位核心創始人員就將目光瞄準了3D動態視覺方案的智能貨櫃之中。
而他們所負責的正是貨櫃當中的3D動態視覺系統子模塊,簡單來說就是3D動態方案中的商品識別算法研發以及相應的硬件采購配置。
在他看來,此前市面上主流的智能貨櫃解決方案都或多或少有壹些致命傷的存在。而3D視覺方案所帶來的貨櫃空間利用率高、本地化部署成本低以及商品識別的精準度高這三大優勢則正好可以解決此前的壹些行業方案的不足。
當下定決心做這壹行之後,他首先確認了壹個原則就是要將方案做的通用且高效。
此前市面上的壹些3D動態視覺方案,大多與微軟的三維視覺 遊戲 Kinect相類似,但是這種方案當時只能跑在X86的平臺之上,如果要做到大規模的行業應用,成本就成了致命傷。
因此如何能夠ARM平臺,根據硬件特性對算法進行優化就成了當務之急。在解決了這壹問題之後,成本問題也就隨之驟降,張磊表示,當前深視 科技 壹套完成CPU、GPU、內存等封裝的系統也不過兩千元左右,僅僅是2D動態方案的三分之壹左右。
在解決了技術上的難題之後,如何將壹個demo變成行業通用的穩定方案也同樣是壹個不容忽視的問題。
最簡單的事情,就比如四個2D攝像頭的布局,壹般人可能會想到頂上兩個攝像頭方向向下,底部兩個攝像頭方向向上,這樣就可以將用戶的行為比較清晰的捕捉完全。
但是實際應用之後,就發現這壹方案根本行不通,夏天女孩子穿短裙的話就足以讓這套方案變得十分尷尬。經過商討,最終大家才確定了四個2D攝像頭兩個在頂上,兩個在中間,壹個3D攝像頭在頂部的中間位置,全部向下拍攝的方案。
甚至關於3D攝像頭的位置也是壹個被反復商討優化的問題。最開始,由於3D攝像頭會存在壹定的盲區,大家會將3D攝像頭的位置放的比較高,但這樣部署之後攝像頭就無法捕捉到用戶本身,這又對識別效率帶來壹定的影響。
另外,有時候會出現用戶單手拿多件產品的問題,這會對商品的識別效率帶來壹定的影響。
本以為這是個要通過各種硬件升級或者算法優化的復雜問題,但是最後通過在櫃子頂部以及每層貨架的底部加上壹塊透明擋板,就完成了讓用戶無法在盲區內取出商品,也無法壹次性取出太多商品的目的。有壹位前來參觀的行業大佬曾經笑言,妳們這壹塊板子可以申請專利了。
在解決這壹系列的難題之後,當前深視 科技 的這壹套系統也已經在壹些主流的整櫃廠商完成了小規模的部署以及內測。
四、迎接市場爆發,3D攝像頭迎來了智能貨櫃的定制化時代
深視 科技 的3D攝像頭提供方圖漾 科技 幾乎也是在2017年就將目光瞄準了消費領域。
在圖漾 科技 CEO費浙平看來,3D攝像頭在工業級的應用在當時已經逐漸成熟,足以支撐企業的穩定盈利。而同樣對3D視覺有著迫切需要的零售行業當前還處於藍海階段。
雖然底層的硬件技術上,工業領域與零售領域的區別並不算大,但是針對不同行業,攝像頭的參數、鏡頭等配置依舊需要漫長的時間調整。
從2017年決定進軍消費領域到2018年需求逐漸顯現的壹年時間裏,費浙平把精力主要放在了產品針對特定消費領域的打磨上。
首先是技術的選擇上,當前市面上的3D攝像頭方案主要有以下幾種類型:TOF、RGB雙目、結構光。
三種主流方案中,比較成熟的是結構光和TOF。其中結構光方案最為成熟,但是極易受到外界光的幹擾、響應速度較慢、識別精度較低;TOF則在這幾個方面比結構光方案具有壹定的優勢,因此TOF成為了目前在移動端被看好的方案。基於視差原理的雙目立體成像方案抗環境光幹擾強,分辨率高,也是移動端可選方案之壹。但是純雙目方案當前頁存在著在紋理單調的環境中找不到匹配點而失效的缺點。
與市面上的傳統方案不同的是,圖漾采用的則是主動雙目視覺方案,3D視覺傳感器由雙目紅外攝像頭、彩色攝像頭和光學增強系統組成,也就是將雙目方案與結構光方案整合。
其中,光學增強系統也就是業界所成稱的結構光,本質上就是壹個激光投射器,雙目攝像頭相當於接收器。當投射器投出的光線打在物體表面,物體將光線反射到兩個攝像頭內,以此收集相應參數信息,再由圖漾搭配的算法,通過計算給出物體的長寬高、距離等物理屬性。可以克服以上幾種方案在精準度以及效率上的不足。
除了技術問題,還有產業定制化的問題需要應對。
壹般來說,應用在消費領域的攝像頭售價僅在中下遊的水平,因為其對於遠距離識別的精準度要求並不高。但是針對這壹領域,對硬件的盲區範圍、視角以及速度卻有著更高的要求。
以幀率來說,壹般的3D攝像頭幀率是每秒30幀,但是在智能貨櫃中就需要60幀才能支持用戶的快速的取放。視覺盲區的大小上,當前市場主流的方案盲區較大,壹般要50公分開外才能有數據,但是在智能貨櫃中,這壹參數必須縮短到20甚至15厘米以內,以防止用戶從盲區取貨帶來商品的盜損。與此相配合的鏡頭視角上,也需要從60度擴展到90度或者100度。
這些看似容易,但是卻涉及到了鏡頭的更換,傳感器參數的調試,以及重新打版的產能投入,如果沒有提前預測到市場的這壹需求或者沒有足夠的技術保障,是無法滿足客戶的這些需求的。
而在完成demo之後,如何保障在真實情況下適用,依舊需要漫長的壓力測試之路要走。例如最基本的問題:用戶什麽動作才是正常的,什麽動作是違規的,真實情況下會出現什麽比較異常的消費行為,需要對相應的硬件產品的參數要提出什麽需求,這些都需要時間的驗證。
但獲取消費者行為數據並不是普通硬件廠所擅長的,因此獲得頭部客戶的支持,***同完成產品的打磨又成了必須邁過的壹道坎,費浙平表示,當前圖漾已經與多家頭部3D動態貨櫃廠商達成了深度合作。
五、3D智能貨櫃未來的可能與當下的局限
為什麽做智能貨櫃?不同的身份會有不同的考量,於品牌商小賣櫃而言或許這將帶來更大的貨櫃銷量,於運營商每日優鮮而言,這或許將帶來運營效率的成倍提升以及成本的急速下降,而於阿裏而言,作為對新零售的重要 探索 方式,這或許將為其再造壹個線下的天貓。
當前階段,國內的電商的爆發性增長幾乎不會再來臨,而剩下的用戶大多沈澱在農村與線下領域。農村方面,無論是拓展的速度還是增長的幅度都十分有限,而線下則幾乎是壹塊未經開墾的處女地,如果將其利用得當,很可能會帶來壹次爆發式的增長。
簡單的算壹筆賬,如果運營商鋪設兩萬臺設備,單臺設備壹天的訂單量僅為15單,那麽單日的訂單量就可以達到三十萬。而電商新貴拼多多在創立兩年後的日訂單量也不過30-40萬。於阿裏而言,這幾乎是再造了壹版線下的天貓。
而深紮線下場景的智能貨櫃還可以完成壹些線上的天貓與拼多多所不能完成的事情。例如天然的廣告展示屬性與和用戶更近的距離。
以友寶在線為例,這是壹家傳統的自動販售機廠家,根據其財報披露,友寶在線2018年上半年運營設備總量大約為5.5萬臺,營業收入11.41億元,凈利潤8604.85萬元,而其中廣告端的收入就達到了2.14 億元。
如果以日本***計五百多萬臺收貨機的密度來算,而當前的市場總量還遠遠未到飽和。如果將中國的售貨機、智能貨櫃大屏全部利用起來,那麽再造壹個分眾傳媒也不是難事。
未來可能無數,但是眼前仍有問題有待解決,從技術成型到市場成熟,涉及的壹整條產業鏈的交互配合。
盡管在當前階段,3D動態識別技術在智能貨櫃中的應用已經基本成型,但如何保障及真實情況下的運營效率以及其他配套硬件的產能供給,這都是需要在不斷的優化中慢慢改進的。
壹方面,從技術指標上來看,如何降低用戶單手取三件或多件商品的識別誤差還需壹些改進,這種針對各種突發情況的改進還需真實情況下的貨櫃運營方反饋。
效率上,盡管3D動態識別相較傳統的靜態識別的SKU訓練速度已經有了非常大的改進,但是單品兩千張的訓練樣本需求在面對大規模SKU上架時仍舊需要對算法、算力、成本以及時間消耗進行壹定的考量。
配套設施上,盡管當前的3D視覺技術已經相對成熟,但是用於復核校驗的微重力感應設備還沒有完成對零售行業的定制化生產,這也對設備的大規模投放時間帶來了壹定的影響。
不過,當技術與模式都已成型,剩下的事情壹切交給時間就好。
結語:終極形態已定,市場是否將重現2017點位大戰?
從興起到如今,無人貨櫃走過了過山車似的兩年,第壹年裏,草莽叢生,資本、點位大戰高潮叠起,第二年裏,玩家瘋狂退卻,形態壹年四變。
當終極形態被基本定格在3D的動態方案,技術已經成型,智能貨櫃的下半場將走向何方?2017年的點位大戰又是否將重現江湖?
或許技術的成型會給這個行業帶來壹管大劑量的強心針,但是市場卻從來不會這麽簡單,形態只是這個市場上露出的冰山壹角,海平面之下的供應鏈之戰、支付入口之戰、供應商搶奪戰……壹切都,還待定。
盡管如此,技術的進步依舊為這個行業的發展帶來了無限可能,在壹片高呼智能貨櫃已死,無人零售沒有未來的唱衰中,3D動態視覺正將智能貨櫃推向再壹次爆發的前夜。