時(shí)間：2023.08.16

振華航空芯資訊：三分鐘看懂“人臉識(shí)別”芯片之爭！

在過去的幾十年間，人工智能一直在默默地發(fā)展，期間出現(xiàn)過數(shù)次“指日可待”的破發(fā)期，但最終都因?yàn)樗惴ú怀墒於磸?fù)沉淪。直到2013-2014年，隨著曠視、商湯（這兩家企業(yè)同根同源）的橫空出世，以人臉識(shí)別技術(shù)為代表的人工智能瞬間引爆資本市場，隨之而來的就是捷報(bào)頻傳的AI應(yīng)用創(chuàng)新。

發(fā)展強(qiáng)勁，牽引AI一路狂奔

據(jù)科技部火炬中心發(fā)布的《2017年中國獨(dú)角獸企業(yè)發(fā)展報(bào)告》顯示，2017年我國164家獨(dú)角獸企業(yè)中，人工智能企業(yè)數(shù)量有6家，占比3.66%，獨(dú)角獸企

數(shù)量排名第10位；據(jù)報(bào)告分析，這6家企業(yè)總估值120億美元，在整個(gè)獨(dú)角獸企業(yè)估值中占比1.91%，位居全行業(yè)第11位。

在這一波AI浪潮中，人臉識(shí)別作為爆發(fā)點(diǎn)，是目前成長最為迅速的AI應(yīng)用，據(jù)前瞻產(chǎn)業(yè)研究院發(fā)布的《人臉識(shí)別行業(yè)市場前瞻與投資戰(zhàn)略規(guī)劃分析報(bào)告》數(shù)據(jù)顯示，2017年全球人臉識(shí)別市場規(guī)模約為31.8億美元，預(yù)計(jì)未來一段時(shí)間人臉識(shí)別市場規(guī)模將保持20%左右的增速，預(yù)測(cè)到2022年，全球人臉識(shí)別市場規(guī)模將達(dá)75.95億美元。

本土人臉識(shí)別企業(yè)也隨著這一波浪潮成為了中國“萬眾創(chuàng)新”的一張名片，商湯、曠視、云從、云天勵(lì)飛、依圖這5家企業(yè)，放眼全球，它們的技術(shù)水平均處于行業(yè)領(lǐng)先地位。

前瞻數(shù)據(jù)庫公布的數(shù)據(jù)顯示，我國人臉識(shí)別市場規(guī)模近幾年年均復(fù)合增長率達(dá)27%。2016年，我國人臉識(shí)別行業(yè)市場規(guī)模約為17.25億元；2017年其市場規(guī)模已超過20億元，預(yù)計(jì)未來5年增速仍將保持年均25%的高度，至2022年達(dá)到65億元以上。

當(dāng)然，其背后與資本的推助離不開，去年11月，曠視科技(Face++)完成了4.6億美元的C輪融資，本輪融資一舉打破了國際范圍內(nèi)人工智能領(lǐng)域融資記錄；而不久后，該記錄即被商湯打破，今年4月9日，商湯獲得6億美元C輪融資；緊接著5月31日，再次獲得6.2億美元C+輪融資，從2014年創(chuàng)立至今，商湯科技的融資總額可能已超過17億美元。

神經(jīng)網(wǎng)絡(luò)卷積深度學(xué)習(xí)技術(shù)令人臉識(shí)別瞬間提升到3D多維算法領(lǐng)域，人類這才終于從算法層面解決了人臉識(shí)別不精準(zhǔn)、實(shí)戰(zhàn)難的問題，讓人臉識(shí)別技術(shù)從此走向應(yīng)用。

不過，問題也隨之而來：即便融資號(hào)令全球，但沒有落地，人臉識(shí)別就只能飄在天空，落地才是硬道理。于是行業(yè)玩家在繼續(xù)追逐算法極致的同時(shí)，開始了一輪又一輪的產(chǎn)品硬件化。

經(jīng)過幾年的實(shí)踐檢驗(yàn)后發(fā)現(xiàn)，當(dāng)下AI三大要素中影響人臉識(shí)別推廣應(yīng)用的關(guān)鍵不是算法、也不是大數(shù)據(jù)，而是主觀認(rèn)為早已解決的算力問題——運(yùn)行人臉識(shí)別深度學(xué)習(xí)算法的最佳處理器。

人臉識(shí)別運(yùn)算流程主要有4個(gè)：視頻采集→特征提取→數(shù)據(jù)比對(duì)→識(shí)別。

由于目前沒有專門用于人臉識(shí)別的處理芯片，只能采用通用芯片代為處理。因深度學(xué)習(xí)算法對(duì)算力資源需求高，一般采取核心處理器，如CPU、ARM芯片進(jìn)行視頻采集，把視頻中的人臉圖像摳取下來，然后把該人臉圖像發(fā)送給下一處理單元進(jìn)行結(jié)構(gòu)化處理。

結(jié)構(gòu)化處理是人臉識(shí)別的關(guān)鍵。最初方案是在CPU上做處理，但由于CPU負(fù)責(zé)邏輯算數(shù)的部分并不多，在多任務(wù)處理時(shí)效率低下，有分析認(rèn)為，12顆NVIDIA GPU可以提供相當(dāng)于2000顆CPU的深度學(xué)習(xí)性能；在圖像處理，CPU的先天劣勢(shì)決定了其在人臉識(shí)別應(yīng)用上被棄用的結(jié)局，該結(jié)論同樣適用于應(yīng)用于Linux系統(tǒng)的ARM處理器。

核心數(shù)據(jù)處理芯片無法執(zhí)行人臉識(shí)別結(jié)構(gòu)化運(yùn)算，只能將圖像處理的工作交給更合適的專門處理芯片，目前常見的有GPU顯示核心、FPGA現(xiàn)場可編程門陣列、ASIC專用集成電路、DSP數(shù)字信號(hào)處理。

GPU：當(dāng)下AI的主導(dǎo)者

GPU的優(yōu)勢(shì)在于解決浮點(diǎn)運(yùn)算、數(shù)據(jù)并行計(jì)算問題，在大量數(shù)據(jù)元素并行程序方面具有極高的計(jì)算密度。

GPU的應(yīng)用現(xiàn)已不再局限于3D圖形處理了，而是具備強(qiáng)大計(jì)算能力的處理器，其在人工智能、深度學(xué)習(xí)高速并行運(yùn)算的優(yōu)勢(shì)凸顯。

GPU在云計(jì)算、AR/VR、AI中的重要性不斷被產(chǎn)業(yè)界和資本市場驗(yàn)證和認(rèn)可，其中，全球龍頭NVIDIA是GPU領(lǐng)域的絕對(duì)領(lǐng)導(dǎo)者，過去幾年實(shí)現(xiàn)了股票的數(shù)倍增長；業(yè)績方面也是處于高速增長態(tài)勢(shì)，在整個(gè)2018財(cái)年，英偉達(dá)營收為97.14億美元，與2017財(cái)年的69.10億美元相比增長41%；凈利潤為30.47億美元，與2017財(cái)年的16.66億美元相比增長83%。

目前全球超級(jí)計(jì)算機(jī)TOP 500上榜的所有超級(jí)計(jì)算機(jī)有96%都使用了配備英偉達(dá)GPU的核心加速器，它所占份額為60%。緊隨其后的是Xeon Phi，所占份額為21%。

無形中，GPU成為了當(dāng)下人臉識(shí)別算力資源的絕對(duì)主力，從行業(yè)采用情況看，但凡是采用中心集中處理組網(wǎng)架構(gòu)的人臉識(shí)別項(xiàng)目，清一色采用GPU作為人像數(shù)據(jù)結(jié)構(gòu)化的處理單元，特別是在X86服務(wù)器集群中，GPU更是成為唯一選擇。

雖然GPU優(yōu)勢(shì)凸顯，卻也存在兩個(gè)致命硬傷，一是功耗大，需依托X86架構(gòu)服務(wù)器運(yùn)行，不適用于更為廣泛的人臉識(shí)別產(chǎn)品方案開發(fā)；尤其是人臉識(shí)別民用化趨勢(shì)日漸增強(qiáng)的當(dāng)下，GPU不適于在小型化項(xiàng)目的采用。二是成本高昂，采用GPU方案，折算單路人臉識(shí)別成本在萬元以上，相較其他千元級(jí)，甚至是百元級(jí)的方案，毫無成本優(yōu)勢(shì)可言，不利于商業(yè)平民化推廣。

這兩個(gè)致命短板，令眾人臉識(shí)別創(chuàng)業(yè)公司不得不尋求新的方案；目前在一些中小型項(xiàng)目中，GPU早已被棄選，如道閘、過道等前景同樣廣闊的領(lǐng)域。

FPGA：被賦予厚望的替代品

場效可編程邏輯閘陣列FPGA運(yùn)用硬件語言描述電路，根據(jù)所需要的邏輯功能對(duì)電路進(jìn)行快速燒錄。一個(gè)出廠后的成品FPGA的邏輯塊和連接可以按照設(shè)計(jì)者的需要而改變。

FPGA和GPU內(nèi)都有大量的計(jì)算單元，因此它們的計(jì)算能力都很強(qiáng)。不過FPGA的可編程性，讓軟件與終端應(yīng)用公司能夠提供與其競爭對(duì)手不同的解決方案，并且能夠靈活地針對(duì)自己所用的算法修改電路。其中峰值性能、平均性能與功耗能效比就是決定FPGA與GPU誰能在服務(wù)器端占領(lǐng)高地的重要因素。

同樣是擅長并行計(jì)算的FPGA和GPU，兩者性能都較CPU強(qiáng)許多，其中GPU能同時(shí)運(yùn)行成千上萬個(gè)核心同時(shí)跑在GHz的頻率上，最新的GPU峰值性能甚至可以達(dá)到10TFlops以上。

相對(duì)而言，F(xiàn)PGA首先設(shè)計(jì)資源受到很大的限制，例如GPU如果想多加幾個(gè)核心只要增加芯片面積就行，但FPGA一旦型號(hào)選定了，其邏輯資源上限就確定了。

而且，F(xiàn)PGA里面的邏輯單元是基于SRAM查找表，其性能會(huì)比GPU里面的標(biāo)準(zhǔn)邏輯單元差很多。

最后，F(xiàn)PGA的布線資源也受限制，因?yàn)橛行┚€必須要繞很遠(yuǎn)，不像GPU這樣走ASIC flow可以隨意布線，因此，在峰值性能方面，F(xiàn)PGA要遠(yuǎn)遜于GPU。

平均性能方面，目前機(jī)器學(xué)習(xí)大多使用SIMD架構(gòu)，即只需一條指令可以平行處理大量數(shù)據(jù)，因此用GPU很適合。但是有些應(yīng)用是MISD，即單一數(shù)據(jù)需要用許多條指令平行處理，這種情況下用FPGA做一個(gè)MISD的架構(gòu)就會(huì)比GPU有優(yōu)勢(shì)。對(duì)于平均性能，看的就是FPGA加速器架構(gòu)上的優(yōu)勢(shì)是否能彌補(bǔ)運(yùn)行速度上的劣勢(shì)。如果FPGA上的架構(gòu)優(yōu)化可以帶來相比GPU架構(gòu)兩到三個(gè)數(shù)量級(jí)的優(yōu)勢(shì)，那么FPGA在平均性能上會(huì)好于GPU。

功耗方面，GPU的功耗遠(yuǎn)大于FPGA的功耗，單一比對(duì)中，F(xiàn)PGA無疑是分布式部署人臉識(shí)別網(wǎng)絡(luò)的最佳選擇。但如果要比較功耗的同時(shí)再比較同等執(zhí)行效率的功耗，F(xiàn)PGA則沒有優(yōu)勢(shì)。不過在GPU無法改變的當(dāng)下，F(xiàn)PGA給予了行業(yè)無限的希望，如果FPGA的架構(gòu)優(yōu)化能做到很好以致于一塊FPGA的平均性能能夠接近一塊GPU，那么FPGA方案的總功耗遠(yuǎn)小于GPU，那么FPGA取代GPU將成為人臉圖像結(jié)構(gòu)化的不二選擇。

FPGA器件的行業(yè)集中度同樣很高，全球前四大產(chǎn)商均來自美國，分別為：Xilinx（賽靈思）、Altera（阿爾特拉）、Lattice（萊迪思）和Microsemi（美高森美），總共占據(jù)了98%以上的市場份額。其中第一的Xilinx占49%，第二的Altera占39%，二者合計(jì)占比達(dá)88%市場份額，形成了雙寡頭的競爭格局。

廠家	所屬國家	市場份額
Xilinx	美國	49%
Altera	美國	39%
Lattice	美國	12%
Microsemi	美國
同方國芯	中國
京微齊力	中國
Agate Logic	中國
其他	其他

圖表4：全球FPGA主要廠商和中國廠商市場份額分布（數(shù)據(jù)來源：華創(chuàng)證券）

ASIC、DSP：小型項(xiàng)目高性價(jià)比選配方案

ASIC、DSP都屬于串行計(jì)算。ASIC芯片的優(yōu)勢(shì)是運(yùn)算能力強(qiáng)、規(guī)模量產(chǎn)成本低，但開發(fā)周期長、單次流片成本高，主要適用于量大、對(duì)運(yùn)算能力要求較高、開發(fā)周期較長的領(lǐng)域，比如大部分消費(fèi)電子芯片和實(shí)驗(yàn)。

DSP內(nèi)包括有控制單元、運(yùn)算單元、各種寄存器以及一定數(shù)量的存儲(chǔ)單元等等，在其外圍還可以連接若干存儲(chǔ)器，并可以與一定數(shù)量的外部設(shè)備互相通信，有軟、硬件的全面功能，本身就是一個(gè)微型計(jì)算機(jī)。它不僅具有可編程性，而且其實(shí)時(shí)運(yùn)行速度可達(dá)每秒數(shù)以千萬條復(fù)雜指令程序，遠(yuǎn)遠(yuǎn)超過通用微處理器，是數(shù)字化電子世界中日益重要的電腦芯片。它的強(qiáng)大數(shù)據(jù)處理能力和高運(yùn)行速度，是最值得稱道的兩大特色。

由于它運(yùn)算能力很強(qiáng)、速度很快、體積很小，而且采用軟件編程具有高度的靈活性，因此為從事各種復(fù)雜的應(yīng)用提供了一條有效途徑。當(dāng)然，與通用微處理器相比，DSP芯片的其他通用功能相對(duì)弱些。但到目前為止，DSP 并沒能真正提供任何有用的性能或是可以與 GPU 相匹敵的器件，其主要原因就是核數(shù)量，導(dǎo)致不少 DSP 被FPGA取代。

圖表5：FPGA、ASIC、DSP優(yōu)缺點(diǎn)比較、應(yīng)用領(lǐng)域（數(shù)據(jù)來源：華創(chuàng)證券）

相較ASIC、DSP來說，F(xiàn)PGA的功耗仍比較大，成本優(yōu)勢(shì)也不足以支撐高性價(jià)比的人臉識(shí)別方案設(shè)計(jì)，因此，目前針對(duì)邊緣云計(jì)算的最新應(yīng)用方案，ASIC、DSP的選用性更強(qiáng)。

而當(dāng)下人臉識(shí)別算法基本都得到了充分的大數(shù)據(jù)訓(xùn)練，算法成熟度已經(jīng)較高，其應(yīng)用也不再一味追求極限，對(duì)一些準(zhǔn)確率不是極度變態(tài)的場合，ASIC、DSP成為了首選，比如監(jiān)控的AI賦能。

其中，又因DSP更具開發(fā)周期優(yōu)勢(shì)，我們已經(jīng)看到，ARM+DSP的處理方案已經(jīng)成為人臉識(shí)別超低性價(jià)比首選，目前的百元級(jí)、千元級(jí)人臉識(shí)別產(chǎn)品正是基于該方案實(shí)現(xiàn)；當(dāng)然，受限于DSP的大量數(shù)據(jù)處理性能，可在小型化服務(wù)器中同時(shí)采用多顆DSP共同組建方案，如一部分資源負(fù)責(zé)人像分析，另一部分DSP資源用于特征提取。

目前TI和海思的方案采用最為廣泛。

TI的達(dá)芬奇解決方案中，DM644X系統(tǒng)內(nèi)嵌DSP，可將人臉檢測(cè)置于其中便能達(dá)到實(shí)時(shí)處理，適用于DVS解決方案設(shè)計(jì)，當(dāng)然，因?yàn)樵摲桨赶到y(tǒng)架構(gòu)較為復(fù)雜，軟件設(shè)計(jì)困難度要相對(duì)高些。

而海思的351X系統(tǒng)為ARM+ASIC結(jié)構(gòu)，編碼算法運(yùn)行于ASIC中，其他功能則運(yùn)行于內(nèi)嵌的ARM中。這兩個(gè)方案中，TI的解決方案處理能力最好，但價(jià)格也略高；海思則在系統(tǒng)簡潔化、開發(fā)成本上有優(yōu)勢(shì)。

為滿足當(dāng)下人臉識(shí)別等人工智能的發(fā)展需求，行業(yè)也推出了各種針對(duì)深度學(xué)習(xí)芯片，如TPU、NPU、DPU、BPU等。

相比GPU，TPU更加類似于DSP，盡管計(jì)算能力略有遜色，可其功耗大大降低，當(dāng)然，TPU的應(yīng)用還是要受到CPU的控制；

深鑒科技基于Xilinx可重構(gòu)特性FPGA芯片開發(fā)的DPU屬于半定制化的FPGA，作為專用的深度學(xué)習(xí)處理單元使用；

NPU相比于CPU中采取的存儲(chǔ)與計(jì)算相分離的馮諾伊曼結(jié)構(gòu)，NPU通過突觸權(quán)重實(shí)現(xiàn)存儲(chǔ)和計(jì)算一體化，從而大大提高運(yùn)行效率，其典型代表有國內(nèi)的寒武紀(jì)芯片和IBM的TrueNorth，另外，中星微電子的“星光智能一號(hào)”雖說對(duì)外號(hào)稱是NPU，但其實(shí)只是DSP，僅支持網(wǎng)絡(luò)正向運(yùn)算，無法支持神經(jīng)網(wǎng)絡(luò)訓(xùn)練；

BPU主要是用來支撐深度神經(jīng)網(wǎng)絡(luò)，比如圖像、語音、文字、控制等方面的任務(wù)，而不是去做所有的事情，用BPU來實(shí)現(xiàn)會(huì)比在CPU上用軟件實(shí)現(xiàn)要高效，一般來說會(huì)提高2-3個(gè)數(shù)量級(jí)，然而，BPU一旦生產(chǎn)，不可再編程，且必須在CPU控制下使用。

此外，算法企業(yè)也在積極與芯片企業(yè)合作，加速推出符合需求的人臉識(shí)別芯片產(chǎn)品。

如近日商湯就與中國芯片研發(fā)企業(yè)Rockchip瑞芯微展開了深度合作，瑞芯微將在旗下芯片平臺(tái)全線預(yù)裝商湯人臉識(shí)別SDK軟件包，首批芯片包括瑞芯微RK3399Pro、RK3399、RK3288三大主力平臺(tái)。其中RK3399ProAI芯片首次采用了CPU+GPU+NPU硬件結(jié)構(gòu)設(shè)計(jì)。

而英特爾作為一代芯片巨頭，也在發(fā)力GPU以期穩(wěn)固其龍頭地位，接連收購了Altera、Mobileye等企業(yè)，欲在搭載強(qiáng)大CPU核心的多核異構(gòu)處理器方面大展宏圖，雖然目前該夢(mèng)想還沒有得到很好實(shí)現(xiàn)，不過也被認(rèn)為是未來解決人工智能算力瓶頸的有效方案之一。

小結(jié)

目前人臉識(shí)別的最佳芯片方案仍是GPU，實(shí)際落地的小型項(xiàng)目則可以采用DSP等能耗低的高性價(jià)比方案；而FPGA的優(yōu)勢(shì)，也讓它具備取代GPU的可能，只是受制于專利墻及技術(shù)，更多的希望只能寄托于FPGA四大家族發(fā)展進(jìn)度。

當(dāng)然，人臉識(shí)別的應(yīng)用萬萬千，場景應(yīng)用創(chuàng)新也還在持續(xù)開發(fā)中，概括起來主要有三種場景方案需求。

一是終端一體化集成圖像采集、人臉采集、特征提取、數(shù)據(jù)比對(duì)、識(shí)別全流程，如手機(jī)解鎖、移動(dòng)支付等，該場景主要是1:1識(shí)別方式，其對(duì)安全性要求最為嚴(yán)苛，一般都會(huì)通過紅外技術(shù)輔助建立3D人像模型以確保真人識(shí)別；

二是云邊應(yīng)用，此時(shí)圖像采集與人臉識(shí)別AI應(yīng)用獨(dú)立，對(duì)分析處理模塊性能要求較高，一般有1:N、N:N兩種識(shí)別方式，而需要紅外輔助建模還是平臺(tái)虛擬建模，根據(jù)場景安全等級(jí)抉擇，如人臉道閘以支持真人識(shí)別為佳；

三是中心處理，該模式基本不用做圖像采集，主要是識(shí)別認(rèn)證和大數(shù)據(jù)碰撞研判，動(dòng)輒百億、千億量級(jí)，對(duì)處理芯片要求非常高，目前基本可以說只有GPU才是最佳選擇。

三種場景，需求不一樣，方案也將不一樣，以目前的芯片技術(shù)水平，還很難下結(jié)論說誰是最好的芯片，只有最適合、最容易落地的方案才是王道，人臉識(shí)別作為AI創(chuàng)新的引領(lǐng)者，活下去，才能推助性能更優(yōu)芯片面世。

振華航空芯資訊：DRAM，前三名洗牌

“實(shí)體清單”、“EAR”、“ECCN” 出口管制

返回列表

亚洲午夜无码久久_国产二级一片内射视频插放_国产AV无码专区亚洲AV_久久久久久国产精品无码超碰国产理论电影在线观看-久久精品国产清自在天天线-1

新聞資訊