Spil Guider > pc spil > alle pc > GPGPU forvandler indlejret militær /rumfart applications

GPGPU forvandler indlejret militær /rumfart applications

Udfordrende programmer

Video stablilization, kompression, dekompression og behandling; målrette sporing; billedforbedring; sensor fusion; radar og lidar; kryptering, dekryptering og kryptoanalyse; software defineret radio; og simulering. Alle disse er sofistikerede militære /rumfart indlejret computing applikationer, der udfordrer udviklere, ikke mindst fordi de kræver betydelige mængder computing hestekræfter (figur 1). Mere end det: stigende, kravet er at indsætte disse applikationer i lukkede rum, der skal have minimal vægt, forbruge lidt strøm, og som er underlagt barske betingelser à¢ à ¢ â € šÂ¬Ã ¢ â,¬â "såsom ubemandet aerial køretøjer

Figur 1:.. Video tracking er en typisk militær /rumfart program, hvor GPGPU teknologi kan levere væsentlig gavn

Multicore /mange core processorer

almindelige processorer har typisk ikke haft den beregningskraft at kunne løse denne type anvendelse. Faktisk har et interessant fænomen begyndte at dukke op i løbet af de sidste par år à¢ à ¢ â € šÂ¬Ã ¢ â,¬â "et fænomen, der har set mainstream processor producenter implicit anerkender, at de er begyndt at nå grænserne for ur fart. Dette har set dem ændre deres arkitektoniske kursus à¢ à ¢ â € šÂ¬Ã ¢ â,¬â "forfølger multicore /mange centrale arkitekturer à¢ à ¢ â € šÂ¬Ã ¢ â,¬â" som i første omgang med Intelà¢ à ¢ â € šÂ¬Ã ¢ â € Za ¢ s Core2 Duo à¢ à ¢ â € šÂ¬Ã ¢ â,¬â "som en måde at øge ydeevnen inden for rammerne af clock hastigheder. Intel dual core processorer har været med os siden 2006, og quad core processorer bliver mainstream. Otte kerne er lige rundt om hjørnet. Brug af flere kerner er hurtigt ved at blive de facto standard for at opnå optimal ydelse

Historisk betragtning af begrænsningerne i generelle formål processorer, applikationer såsom dem beskrevet tidligere er blevet behandlet af to alternative processorteknologier:. FPGA og DSP. En tredje teknologi, men er nu bliver tilgængelige, der har tre vigtige fordele. GPGPU à¢ à ¢ â € šÂ¬Ã ¢ â,¬â "generelle formål computing på en Graphics Processing Unit à¢ à ¢ â € šÂ¬Ã ¢ â,¬â" giver den form for massivt parallel kapacitet computing som udfordrende applikationer efterspørgsel. Det kan levere denne førende computing ydeevne i lille størrelse, lav vægt, lavt miljøer strømforbrug. Og det lider ikke mange af de ulemper, historisk forbundet med FPGA og DSP-teknologi.

anerkendte leder i GPGPU er NVIDIA med sin CUDA teknologi, og GE Intelligent Platforms arbejder med NVIDIA at bringe CUDA evne til militæret /rumfart marked med en række 6U og 3U VPX og OpenVPX produkter.

Reduktion størrelse, vægt og effekt (sWAP)

en typisk target ansøgning om disse produkter kan findes i en stor amerikansk militær program platform, som omfatter 72 konventionelle processorer på 18 6U boards, som indtager fire kubikfod, vejer mere end 100 lbs, forbruger 2.000 watt og leverer 576 GFLOPS af beregningsmæssige resultater. Et sådant system med rimelighed kunne implementeres i et krigsskib eller en stor flyskrog à¢ à ¢ â € šÂ¬Ã ¢ â,¬â ", men ikke i en lille, selvstændig, langtrækkende ubemandet køretøj. En CUDA-baseret system, på en lige-for-like beregningskraft ydeevne grundlag, ville realistisk besætte 20% af pladsen, bære 10% af vægten og forbruge 10% af kraften i at 18-board løsning (figur 2). Ligeledes har GE vist, hvordan fire CUDA-aktiveret 3U VPX brædder med en floating point præstation af 766 GFLOPS kan implementeres på mindre end 0,4 kubikfod

Figur 1: a. CUDA-baseret system Ligesom GE magic 1 (til højre) kan optage en brøkdel af rummet af et traditionelt system og forbruge væsentligt mindre effekt, og alligevel levere sammenlignelige beregning ydeevne.

Som et eksempel på rå computing kapacitet, en quad core Intel i7 processor vil typisk være benchmarkes på omkring 50 GFLOPS. NVIDIA GTX 480 à¢ à ¢ â € šÂ¬Ã ¢ â,¬â "bredt anerkendt som den højeste ydeevne GPU til rådighed i dag à¢ à ¢ â € šÂ¬Ã ¢ â,¬â" benchmarks på omkring 1300 GFLOPS. Fra den simple sammenligning, er det let at se, hvordan en større militær hovedleverandør formået at opnå en 15x stigning i gennemløb ved at bruge CUDA teknologi til at gennemføre en radar ansøgning.

Faktisk er det 15x stigning er beskeden i sammenligning til forbedringer af ydeevnen, der er blevet påvist andetsteds. Forbedringer af 140x er opnået i en signalbehandling ansøgning fra High Performance Computing Sveriges; af 300x i signalbehandling element i en syntetisk apertur radar ansøgning på Brigham Young University; og på over 250 x i et billedbehandlingsprogram ansøgning fra Rochester Institute of Technology. CUDA er meget udbredt i en bred vifte af kommercielle applikationer, herunder medicinsk billedbehandling, finans, kortlægning og køretøj telemetri.

Typiske GPGPU applikationer

GPU teknologi er beregnet til anvendelser, der egner sig til parallel behandling , applikationer, hvor data kan realistisk set behandles parallelt à¢ à ¢ â € šÂ¬Ã ¢ â,¬â "i modsætning til den sekventielle behandling, hvortil almindelige processorer anvendelse er konstrueret. GPGPUs, på grund af deres oprindelse som er indrettet til at gengive billeder, er særligt godt rustet til at behandle enkelt præcision (SP) med flydende komma data. Den gennemløb af single-præcision floating-point tilføje, mangfoldige og formere-tilføje operationer er typisk otte operationer pr clock cyklus. Nogle heltal operationer kan forekomme i samme takt, men andre, såsom multiplicere, forekomme på to operationer pr cyklus. GPGPU applikationer generelt falder i en kategori kaldet Single Instruction Multiple Tråde (SIMT), hvorved en algoritme skal opdeles i en implementering, der kan køre på hundredvis til tusindvis af samtidige tråde, hver henrettet en instruktion ad gangen i lockstep tværs snesevis til hundredvis af processorkerner, der hver arbejder på en anden stykke af dataene.

Som sådan GPU teknologi er ikke en erstatning for todayà¢ à ¢ â € šÂ¬Ã ¢ â € Za ¢ s mainstream processorer à¢ à ¢ â € šÂ¬Ã ¢ â,¬â "snarere, det er et supplement til det. Typisk à¢ à ¢ â € šÂ¬Ã ¢ â,¬â "på en platform som GEà¢ à ¢ â € šÂ¬Ã ¢ â € Za ¢ s IPN250 (figur 3), for eksempel à¢ à ¢ â € šÂ¬Ã ¢ â,¬â "Intel værtsprocessoren ville losse parallel databehandling til en onboard NVIDIA GPU. Faktisk GEà¢ à ¢ â € šÂ¬Ã ¢ â € Za ¢ s produktsortiment er designet til at tillade losse på flere GPU'er, alle opererer parallelt (på en række NPN240 bestyrelser, for eksempel, hver med to CUDA-aktiveret GPU'er) à¢ à ¢ â € šÂ¬Ã ¢ â,¬â "at give mulighed for enormt kraftfulde løsninger, der skal udformes og gennemføres

Figur 3:. GE IPN250 har en Intel vært processor og et NVIDIA CUDA co-processor

GPGPUs excel med beregningsmæssigt-intensive applikationer

grunden til at GPU'er kan tilbyde så mange (16 til flere hundrede) processorkerner er, at de handler funktionalitet for kvantitet à¢ à ¢ â € šÂ¬Ã ¢ â,¬â "med andre ord, die fast ejendom, der ville blive overgivet til mere komplekse funktioner bruges til at implementere mange flere kerner, der er i stand til kun relativt simple operationer. Per definition processorer generelle formål har en arkitektur, der er designet til at hjælpe med at løse så mange forskellige typer af problemer som muligt à¢ à ¢ â € šÂ¬Ã ¢ â,¬â ", mens GPU'er er designet til at løse, i kraft, kun én type problem. Den GPU kerne er forenklet, og omfatter ikke de attributter, der normalt forbindes med generelle formål processorer såsom store og multi-level caches, ud af ordreafvikling, gren forudsigelse og så videre. Det kan siges, at hvis et program kræver en sådan funktionalitet, det er dårligt egnet til implementering på en GPU.

Identifikation passende applikationer er nøglen til at maksimere fordelene, der kan opnås fra GPGPU teknologi. F.eks GPGPUs er meget effektive til floating point beregning, forudsat at det problem, der løses har visse egenskaber. Groft sagt, disse er, at datasættene er rimelig store, og at den beregningsmæssige intensitet (dvs. antallet af operationer anvendt på hvert datapunkt) er høj. Pulsen kompression og Doppler behandling typisk for radar applikationer normalt benytte Fast Fourier Transform (FFTs), der opfylder kriterierne for høj beregningsmæssige intensitet og dermed gøre GPGPU en ideel teknologi løsning (figur 4)

Figur 4.: Fordi radar stærkt afhængig FFTs, det er den slags regnekraft ansøgning, som GPGPU teknologi er ideel.

CUDA udviklingsmiljø

CUDA GPU arkitektur understøtter en særligt simpel programmering model. Det gør det muligt for bygherren at skrive en kildefil, med kode for værten processor og GPU inkluderet i-line. C for Cuda strækker C ved at tillade programmøren at definere C

funktioner, kaldet kerner, der, når de kaldes, der udføres n gange parallelt af n forskellige CUDA tråde, i modsætning til kun en gang som almindelig C-funktioner. Den toolchain splitter værten og GPGPU koder, samler og forbinder dem separat, og derefter kan kombinere de to i en enkelt eksekverbar fil. Resultatet er kode, der er mere let konstrueres og analyseres, hvilket minimerer programmering og vedligeholdelsesomkostninger. Værktøjet kæder til disse mange-core enheder er nu modne, have været i brug af store grupper af udviklere i flere år. Det er den relative lethed og lave omkostninger ved kode udvikling, der er en af ​​de vigtigste fordele, som CUDA teknologien har over FPGA teknologi. Et eksempel på dette er, at koden kan udvikles på en billig CUDA-aktiveret pc, før de sættes på en robust militær platform. Over 100 millioner CUDA-kompatible GPU'er er blevet afsendt til dato, og NVIDIA CUDA programmering

miljø er nu undervist på over 120 universiteter i hele verden.

Andre udviklere bruger OpenCL. OpenCL er den første åbne, royalty-fri standard for generelle formål parallel programmering af heterogene systemer. Det giver en ensartet programmeringsmiljø for software-udviklere til at skrive effektive, bærbare kode til højtydende beregne servere, desktop computere og håndholdte enheder ved hjælp af en varieret blanding af multi-core CPU'er, GPU'er, celle-type arkitekturer og andre

parallelle processorer såsom DSPs.

sagen for GPGPU teknologi

sagen for GPGPU teknologi i krævende, sofistikeret mil /aero applikationer er en overbevisende én, og en som mange forsvarsorganisationer er aktivt evaluere.

Hvad har manglet indtil nu er evnen til at overføre denne kraftfulde teknologi fra kommercielle kvalitet komponenter i laboratoriet til robuste, udvidet temperaturområde, varmeledningskølede enheder, der opfylder kravene fra udsendte mil /aero applikationer à¢ à ¢ â € šÂ¬Ã ¢ â,¬â ", men med tilgængeligheden af ​​en bred vifte af robuste CUDA-aktiverede platforme fra GE, at vitale kapacitet er nu på plads.

Brug mange-kerne processorer kan tillade system designere til at passe en hidtil uset mængde regnekraft i en meget kompakt pakke. Regnekraft, systemets størrelse og strømforbrug fordele ved GPGPU teknologi er overbevisende nok, men når de kombineres med den lethed, programmering i CUDA miljø, især når man sammenligner med FPGA'er, og de væsentligt lavere omkostninger, der er involveret, at fordelene bliver overvældende.

www.edco.co.il

Relaterede artikler