當前位置:主頁 > 名人 > 歷史 > 正文

機器視覺:超越傳統 商機無限_0

未知 2019-06-16 14:08

  因應機器人產業與工業自動化快速發展,結合相機與影像處理以取代或補強人力的機器視覺技術與相關應用持續升溫,并在工業檢測與制造領域獲得了廣泛的部署。然而,對于超越傳統應用以外的日常生活與其他領域,機器視覺仍然深藏著無限潛力與商機。

  過去幾年來,這個以知識為導向的產業經歷機器視覺系統的元件與模組日益復雜化;另一方面,與機器視覺系統相關的市場應用也持續擴展到超越工業制造以外的新應用領域,特別是如今當硬體尺寸縮減以及嵌入式系統持續展現動能之際,即將來臨的奈米技術、先進感測器、機器對機器(M2M)通訊系統以及物聯網(IoT)等新興技術發展,將進一步推動機器視覺應用擴展至消費性電子、可穿戴式裝置、汽車先進駕駛輔助系統(ADAS)以及智能化監控等更貼近大眾生活的領域。

  根據市場調查機構MarketsandMarkets在去年發布的調查報告指出,2012年機器視覺系統與元件的全球市場規模超過30億美元,預計在2013-2018年間將以8.2%的年復合成長率(CAGR)成長,在2018年以前達到50億美元。全球機器視覺市場帶來的新商機已經成為業界廠商關注的焦點。

  CEVA公司投資者關系與企業傳播副總裁RichardKingston透露,該公司已經將電腦視覺DSP授權給八家企業,其中包括三家行動領域的OEM廠商。而加拿大CogniVue公司業務開發副總裁TomWilson也看好可穿戴式裝置和汽車領域將存在非常強烈的成長商機。

  全球機器視覺市場可望在2018年以前超越50億美元大關。

  視覺處理向3D跨越

  隨著Google正式發布ProjectTango后,3D機器視覺變得更熱門。Kingston表示,消費領域的3D處理主要瞄準3D成像、自然使用者界面(NUI)和3D視覺應用,如PC、筆記型電腦、平板電腦、智能手機和其它消費性設備。

  業界追尋3D視覺的主要原因在于解決2D機器視覺的固有局限,若能更有效地實現在分割(分離近景和遠景)、照明(用于人臉辨識)、相對位置(場景中的物體)等方面的功能,就能讓更多應用透過3D空間資訊來簡化并提高視覺系統的精密度與可靠性。

  但無論是3D感測器(例如TOF相機)或以2個2D影像感測器實現的立體感測器,對于處理能力的要求也更高。Wilson指出,立體匹配(使用兩個影像感測器的輸入)要求差異映射來產生3D景深圖。這是一個非常困難的電腦視覺問題,學術界也積極研究最佳化立體辨識演算法。由于實現3D感測的每一種方法都存在性能的折衷,CogniVue目前正開發一種新的演算法,期望針對低成本3D感測器計算其視差圖。

  處理大量即時資料需要密集的運算能力。若是想實現穩定的3D感測映射是非常困難的,特別是對于低功耗的設備來說。為此,他強調,CogniVue的APEX影像辨識處理(ICP)技術能在電量有限的3D視覺應用中發揮關鍵作用。

  對于系統設計人員來說,設計一款能有效執行不同視覺演算法的硬體是一項艱巨的挑戰。系統廠商選擇影像/視訊處理解決方案時,可以選擇全部集中在CPU完成,也可以選擇卸載一部份影像處理工作給GPU,或者專為影像處理增加硬體邏輯。在需要3D處理的應用中,GPU已經讓系統的一部份執行多種電腦視覺演算法,從而有助于為通用CPU分擔工作負載。

  i.MX6擁有強大的GPU運算能力,其3D引擎GC2000內含4個渲染核心,可提供高達30GFLOPS的運算能力,支援OpenCL1.1EP,飛思卡爾(Freescale)微控制器事業部亞太區市場行銷和業務拓展經理李星宇介紹,此外,i.MX6Q還擁有一個專用的2D引擎(1Gpixel/s)和一個向量繪圖處理引擎。

  針對影像擷取領域,經常利用2D相機感測器或其他光學感測技術來分析運算3D資料。除了飛行時間法(TOF)3D成像(為目標物連續發送光線脈沖,根據光線脈沖與感測器接收反射光線之間的時間,計算出目標物距離),在工業制造檢測方面較廣泛應用的是3D雷射三角法,差別在于3D雷射感測器采用逐點掃描,而TOF相機則同時得到整幅影像的深度資訊。

  相較于雷射三角的3D成像方式,美商國家儀器(NI)技術行銷工程師黃翔鉎介紹,NILabVIEW可為3D視覺應用提供雙目立體視覺功能,工程師可將2部相機安裝在物體的不同角度后,使用校準技術調校兩部相機之間的畫素資訊以及擷取資料,并透過LabVIEW的3D工具庫進行數學運算分析。透過一個軟硬體無縫整合的繪圖開發環境來設計3D視覺應用,更能簡化工程師的工作。

  IP與處理器的完美結合

  為了在日益精巧的機臺或裝置中整合嵌入式視覺系統,需要更先進的CPU進行密集運算來處理龐大的資料量,黃翔鉎強調,這將持續對于CPU效能、功耗與資源是否足以支援強大的視覺分析運算帶來了挑戰。

  CongmiVue在官網上提到,為了滿足不斷提高的應用需求,過去幾十年來,處理器架構持續因應不同階段而進展。1980年代的用于桌上型電腦和和伺服器的CPU;1990年代DSP出現加速音訊編解碼和無線/有線語音/資料編解碼的要求;2000年GPU達到更先進的性能與平行性,從而實現2D和3D影像;如今,嵌入式視覺處理需要的是完全不同的處理器架構:ICP。

  TomWilson也指出,新一代的視覺應用需要100倍以上的嵌入式視覺性能/功耗,為了滿足這些應用的性能和功率需求,我們必須在相同功耗下提升較傳統處理架構更高100-400倍的性能,因此,CogniVue強調其APEXICP技術可實現這一性能要求。

  連同APEXICP核心、APEX程式設計工具以及一個APEX-CV嵌入式視覺功能庫,可涵蓋多種視覺應用。例如特征檢測和搭配適用于可穿戴式(增強實境)和汽車(光流和運動追蹤)等。他補充道:除了常見的電腦視覺功能,CognVue還為特定應用提供更先進的產品,例如用于人臉辨識的FaceVue、用于監控應用中運動監測的MotionVue、用于汽車車道偏離警示的FrontVue,以及用于汽車盲點監測的SideVue等。

  針對密集型運算需求,CEVA公司包括CEVA-MM3101在內的CEVA-MM3000系列使用非常高效且功能強大的向量引擎,從而實現電腦視覺所需的大量平行運算。此外,整合的功率調節單元(PSU)可在處理器內實現動態電壓調節,協助實現永不斷線的應用類型。

  除了CogniVue和CEVA,致力于機器視覺IP的廠商還包括Mobileye、Tensilica(現隸屬于CadenceIP部門)與ImaginationTechnologies等。Imagination基于Raptor的可合成ISPIP核心已于2014年第一季上市,使得IP陣營的競爭愈發激烈。

  多家半導體廠商則透過與專業IP廠商合作/授權的方式,推出其專用視覺處理器,包括飛思卡爾(Freescale)、德州儀器(TI)以及意法半導體(ST)等。ST與Mobileye共同開發EyeQ3影像處理器,可實現行人檢測;飛思卡爾基于CogiVue核心推出影像辨識處理器家族SCP2200;以色列Inuitive公司開發基于雙CEVA-MM3101引擎的3D視覺處理器,實現3D景深圖;賽靈思(Xilinx)利用MVTec公司的HALCON以及SiliconSoftware公司的VisualApplets開發平臺,為Zynq-7000AllProgrammableSoC打造端對端的SmarterVision開發環境。

  TI旗下種類繁多的處理器產品中,KeyStone系列多核心處理器具備5.6GHz的ARM及9.6GHz的DSP處理能力,且具備比多晶片方案低功耗的優勢,適合機器視覺領域的攝影機應用;此外該公司的Jacito6系列車用處理器,亦可用于ADAS中的行人辨識、防碰撞警示等機器視覺功能。

標簽
乒乓球大魔王