Targetes gràfiques

Nous detalls sobre els avenços de turing

Taula de continguts:

Anonim

L'arquitectura de Turing de Nvidia és un dels majors salts en gràfics en 20 anys, fem un repàs a les majors novetats ofertes per aquesta moderna arquitectura de GPU per gaming.

Les novetats més interessants de Turing

CUDA 10: CUDA 10 inclou suport per GPU de Turing, biblioteques optimitzades per al rendiment, un nou model de programació de gràfics de tasques asíncrones, interoperabilitat CUDA i API millorada de gràfics, i noves eines de desenvolupament. CUDA 10 també proporciona tots els components necessaris, per crear aplicacions per a les plataformes de servidor més poderoses de Nvidia, per a càrregues de treball de computació d'alt rendiment (HPC) i AI, tant en lloc (DGX-2) com en el núvol (HGX-2).

Et recomanem la lectura del nostre post sobre Què és Nvidia Scanner i com funciona

TensorRT 5 - Release Candidate: TensorRT 5 ofereix un rendiment d'inferència fins a 40 vegades més ràpid que les CPU a través de noves optimitzacions, API i suport per a GPU Turing. Optimitza la inferència de precisió mixta de forma espectacular en aplicacions com recomanadors, traducció automàtica neuronal, parla i processament de el llenguatge natural.

cuDNN 7.3: els marcs d'aprenentatge profund que utilitzen cuDNN 7.3, poden aprofitar les noves característiques i el rendiment de les arquitectures de Turing, per oferir un rendiment d'entrenament més ràpid.

NCCL 2.3: els marcs d'aprenentatge profund que fan servir NCCL 2.3 i posterior, poden aprofitar les noves característiques i el rendiment de l'arquitectura Volta i Turing, per oferir un escalament d'alt rendiment i eficient multi-node, multi-GPU d'aprenentatge profund. Les noves característiques inclouen algoritmes millorats de baixa latència per mides de missatges petits, i un control més precís de quan usar GPU Direct P2P i RDMA.

Cutlass 1.1: permet als desenvolupadors utilitzar els Turing Tensor Cores per a la multiplicació de matrius d'alt rendiment en CUDA C ++. Les noves característiques inclouen suport per a CUDA 10, i noves funcions de matriu de distorsió, per accedir a les capacitats de sub-byte de Turing, per permetre la investigació d'aprenentatge profund amb precisió ultrabaixa.

VRWorks Graphics 3.0: les funcions de gràfics de VRWorks estan dirigides als desenvolupadors de jocs i aplicacions i aporten un nou nivell de fidelitat visual, rendiment i capacitat de resposta a la realitat virtual. Aquesta versió combinada amb les GPU basades en Turing ofereix moltes tecnologies noves que inclouen l'ombrejat de taxa variable i la representació de múltiples vistes.

Nsight Compute 1.0: és una eina de pròxima generació que proporciona d epuración interactiva d'API CUDA i perfils de nucli. Aquesta versió de Nsight Compute, ofereix un recull ràpida de dades de mètriques de rendiment detallades, i la depuració API a través d'una interfície d'usuari i una eina de línia d'ordres.

Nsight Systems 2018.2: és una eina d'anàlisi de baix rendiment que està dissenyada per proporcionar les idees que els desenvolupadors necessiten per optimitzar el seu programari, com la identificació de colls d'ampolla en les CPU i GPU. Les actualitzacions en Nsight Systems 2018.2 inclouen compatibilitat amb CUDA 10, millores en la interfície de línia d'ordres per cobrir nous escenaris d'ús i diverses millores de compatibilitat i usabilitat.

Nsight Graphics 2018.5: és una eina de desenvolupador independent que li permet depurar, crear perfils i exportar quadres creats amb API gràfiques populars. La versió 2018.5 fa que GPU Trace estigui disponible públicament, afegeix suport per a extensions Direct3D 12 DXR i Vulkan Ray Tracing, amplia la funció d'historial de píxels per cobrir DirectX 12 i completa la compatibilitat amb Windows RS3 DirectX 12 SDK.

Nsight VSE 6.0: és un entorn de desenvolupament d'aplicacions per GPU que li permet crear, depurar, crear perfils i rastrejar una àmplia gamma d'aplicacions. Les actualitzacions en Nsight VSE 6.0 inclouen depuració de gràfics amb suport de rastreig de llamps i depuració, i anàlisi de còmput millorats amb suport CUDA 10.

font techpowerup

Targetes gràfiques

Selecció de l'editor

Back to top button