Intelligentie wordt snel toegevoegd aan al onze elektronische apparaten. Of het nu onze voertuigen zijn die automatisch remmen als het gevaarlijk wordt, de camera's van onze telefoon die ervoor zorgen dat elke foto die we maken er geweldig uitziet, of onze datacenters die niet alleen onze video's moeten opslaan en verspreiden, maar ook moeten begrijpen wat erin zit – intelligente beeldverwerking met behulp van deep learning is overal.
Maar alleen het toevoegen van een deep learning-versneller naast het host-CPU-subsysteem van een chip, betekent niet dat je een chip hebt die alle vereiste visuele computertaken aankan. Hoewel we enkele ontwerpen hebben gezien die dit niet beseften, hebben veel SOC's tegenwoordig meerdere rekenmachines voor de verschillende beeldverwerkingsgerelateerde verwerkingstaken.
Vorig jaar schreven we een artikel dat 6 redenen gaf waarom deep learning-versnellers hebben naast hen vision-processors op dezelfde chip nodig. Hier volgt een korte herhaling van de grondgedachte:
- Voed het beest: afbeeldingen moeten worden voorbewerkt voordat ze klaar zijn voor consumptie door de DL-engine
- Algoritmen gebruiken zowel deep learning als computer vision: hybride oplossingen worden nog vaak gebruikt
- Kracht en kosten: deep learning is rekenintensief; gebruik het alleen als klassieke computervisie niet aan uw behoeften voldoet
- Video verwerken: gebruik deep learning om te detecteren en herkennen, maar gebruik computervisie om van frame tot frame te volgen
- Niet nodig om AI te gebruiken wanneer wiskunde werkt: technieken zoals gelijktijdige lokalisatie en mapping gebruiken wiskunde in plaats van diep leren
- Flexibiliteit: vast bedrade versnellers voor diep leren kunnen niet alle netten gebruiken
Maar wat als u een uniforme vision-processor had die deep learning-taken net zo efficiënt uitvoert als een bedrade deep learning-versneller? In een ander artikel dat we onlangs schreven, leggen we uit dat dit weliswaar onmogelijk lijkt, maar dat het niet is. Er kan een processor worden gerealiseerd die zowel softwarematig programmeerbaar is als efficiënter is dan een deep learning accelerator, met behulp van een groot aantal zorgvuldige software- en hardware-optimalisaties.
Dus eerst voegen we een vision-processor toe en daarna vervangen we de deep learning-accelerator door een uniform DL/vision-processor-subsysteem. Nu wordt het beeldsignaalverwerkingsblok dat de onbewerkte beelden verwerkt die zijn vastgelegd met de beeldsensor ook complexer en moet het ook meer intelligentie bevatten, wat betekent dat er nog een uniforme DL/vision-processor moet worden toegevoegd. Vaak worden de afbeeldingen gecomprimeerd om de opslag en bandbreedte voor verzending te beperken. Als uw visual computing-subsysteem flexibel genoeg is, wat onze uniforme v-MP6000UDX-architectuur is, kan het deze taak ook aan.
We kunnen nu zien dat een uniforme multicore vision-verwerkingsarchitectuur die alle intelligentie en visuele computing afhandelt taken heeft veel zin. Naast het kunnen verwerken van alle verwerkingstaken, zijn er verschillende voordelen van het gebruik van zo'n enkelvoudig multicore-systeem. Er is bijvoorbeeld maar één keten van softwareontwikkelingstools die programmeurs hoeven te leren, hergebruik van code wordt gemaximaliseerd en gegevensverplaatsingen tussen verschillende acceleratorblokken worden geminimaliseerd. Het hardware-ontwerp, de integratie en de verificatie-inspanningen zijn ook aanzienlijk verminderd, aangezien er slechts één enkel blok hoeft te worden geïntegreerd en gerepliceerd.
Een dergelijke architectuur is precies wat we bij videantis hebben gebouwd.  ;Ons uniforme, schaalbare, programmeerbare v-MP6000UDX visual computing-subsysteem is gemakkelijker te integreren, gebruiksvriendelijker en efficiënter. Soms loont het eenvoudig om dingen eenvoudig te houden.
Marco Jacobs
Vice-president Marketing, videantis