Biblioteker skrevet i Cuda

instant-ngp

Øjeblikkelige neurale grafikprimitiver: lynhurtig NeRF og mere.
  • 13.4k
  • GNU General Public License v3.0

deep-high-resolution-net.pytorch

Projektet er en officiel implementering af vores CVPR2019 papir "Deep High-Resolution Representation Learning for Human Pose Estimation".
  • 4.1k
  • MIT

cub

Kooperative primitiver til CUDA C++. (af NVIDIA).
  • 1.5k
  • BSD 3-clause "New" or "Revised"

cugraph

cuGraph - RAPIDS Graph Analytics Library.
  • 1.3k
  • Apache License 2.0

blocksparse

Effektive GPU-kerner til blokspare matrixmultiplikation og foldning.
  • 948
  • MIT

k2

FSA/FST-algoritmer, differentierbare, med PyTorch-kompatibilitet..
  • 927
  • Apache License 2.0

nv-wavenet

Referenceimplementering af autoregressiv wavenet-inferens i realtid.
  • 700
  • BSD 3-clause "New" or "Revised"

nvParse

Hurtig, gpu-baseret CSV-parser.
  • 550
  • Apache License 2.0

instant-ngp-Windows

Øjeblikkelige neurale grafikprimitiver: lynhurtig NeRF og mere.
  • 458
  • GNU General Public License v3.0

nccl-tests

NCCL test.
  • 436
  • BSD 3-clause "New" or "Revised"

MegBA

MegBA: Et GPU-baseret distribueret bibliotek til pakkejustering i stor skala.
  • 368
  • Apache License 2.0

raft

RAFT indeholder grundlæggende udbredte algoritmer og primitiver til datavidenskab, grafer og maskinlæring. (af rapidsai).
  • 278
  • Apache License 2.0

dietgpu

GPU-implementering af en hurtig generaliseret ANS (asymmetrisk numeral system) entropikoder og dekoder med udvidelser til tabsfri komprimering af numeriske og andre datatyper i HPC/ML-applikationer.
  • 247
  • MIT

TorchPQ

Tilnærmet nærmeste nabosøgning med produktkvantisering på GPU i pytorch og cuda.
  • 173
  • MIT

Lantern

  • 163
  • BSD 3-clause "New" or "Revised"

RWKV-CUDA

CUDA-versionen af ​​RWKV-sprogmodellen (https://github.com/BlinkDL/RWKV-LM).
  • 113

cuhnsw

CUDA implementering af Hierarchical Navigable Small World Graph algoritme.
  • 88
  • Apache License 2.0

CUB

DETTE REPOSITOR ER FLYTTET TIL github.com/nvidia/cub, SOM ER AUTOMATISK AFSPILT HER..
  • 71
  • BSD 3-clause "New" or "Revised"

array-language-comparisons

En sammenligning af array sprog og biblioteker: APL, J, BQN, Q, Julia, R, NumPy, Nial, Futhark, SaC & ArrayFire..
  • 60
  • MIT

mish-cuda

Mish-aktiveringsfunktion til PyTorch (af JunnYu).
  • 48
  • MIT

rocm-examples

  • 39
  • MIT

xgboost-node

Kør XGBoost-modellen og lav forudsigelser i Node.js.
  • 33
  • GNU General Public License v3.0

CUDA-Guide

CUDA Guide.
  • 29

kobra

Forskningsorienteret spilmotor, der udforsker de nyeste gengivelsesteknikker (af vedavamadathil).
  • 21

CryptoGPU

Analyse af kryptovalutapriser.
  • 16

LSQR-CUDA

Dette er en LSQR-CUDA-implementering skrevet af Lawrence Ayers under opsyn af Stefan Guthe fra GRIS-instituttet ved Technische Universität Darmstadt. LSQR-biblioteket var forfatter Chris Paige og Michael Saunders..
  • 11
  • MIT

SBNN

Singular Binarized Neural Network baseret på GPU Bit Operations (se vores SC-19 papir).
  • 10
  • GNU General Public License v3.0

GCGT

Kildekode til papiret: GPU-baseret Compressed Graph Traversal.
  • 7
  • MIT

FirstCollisionTimestepRarefiedGasSimulator

Denne simulator beregner alle mulige skæringspunkter i et meget lille tidstrin for en partikelmodel.
  • 2

DOKSparse

sparsomme DOK-tensorer på GPU, pytorch.
  • 1
  • MIT