[FEA]: Validate cuda.parallel type matching in build and execution by rwgk · Pull Request #2429 · NVIDIA/cccl

rwgk · 2024-09-18T21:27:50Z

Description

Closes: #2416

Checklist

New or existing tests cover these changes.
The documentation is up to date with these changes.

github-actions · 2024-09-19T03:30:54Z

🟨 CI finished in 6h 01m: Pass: 97%/437 | Total: 2d 12h | Avg: 8m 18s | Max: 1h 27m | Hits: 99%/41645

🟨 cub: Pass: 93%/136 | Total: 23h 20m | Avg: 10m 17s | Max: 1h 27m | Hits: 99%/4362

🔍 cpu: amd64 🔍
  🔍 amd64              Pass:  92%/128 | Total: 22h 47m | Avg: 10m 40s | Max:  1h 27m | Hits:  99%/4362  
  🟩 arm64              Pass: 100%/8   | Total: 33m 37s | Avg:  4m 12s | Max:  4m 26s
🔍 ctk: 12.6 🔍
  🟩 11.1               Pass: 100%/15  | Total:  1h 07m | Avg:  4m 31s | Max: 16m 51s | Hits:  99%/727   
  🟩 11.8               Pass: 100%/3   | Total: 14m 18s | Avg:  4m 46s | Max:  5m 03s
  🔍 12.6               Pass:  92%/118 | Total: 21h 58m | Avg: 11m 10s | Max:  1h 27m | Hits:  99%/3635  
🔍 cudacxx: nvcc12.6 🔍
  🟩 ClangCUDA18        Pass: 100%/2   | Total:  7m 38s | Avg:  3m 49s | Max:  3m 54s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  1h 07m | Avg:  4m 31s | Max: 16m 51s | Hits:  99%/727   
  🟩 nvcc11.8           Pass: 100%/3   | Total: 14m 18s | Avg:  4m 46s | Max:  5m 03s
  🔍 nvcc12.6           Pass:  92%/116 | Total: 21h 51m | Avg: 11m 18s | Max:  1h 27m | Hits:  99%/3635  
🔍 cudacxx_family: nvcc 🔍
  🟩 ClangCUDA          Pass: 100%/2   | Total:  7m 38s | Avg:  3m 49s | Max:  3m 54s
  🔍 nvcc               Pass:  93%/134 | Total: 23h 13m | Avg: 10m 23s | Max:  1h 27m | Hits:  99%/4362  
🟨 cxx
  🟩 Clang9             Pass: 100%/6   | Total: 27m 31s | Avg:  4m 35s | Max:  5m 41s
  🟩 Clang10            Pass: 100%/3   | Total: 16m 06s | Avg:  5m 22s | Max:  5m 54s
  🟩 Clang11            Pass: 100%/4   | Total: 18m 27s | Avg:  4m 36s | Max:  4m 42s
  🟩 Clang12            Pass: 100%/4   | Total: 18m 03s | Avg:  4m 30s | Max:  4m 44s
  🟩 Clang13            Pass: 100%/4   | Total: 18m 25s | Avg:  4m 36s | Max:  4m 53s
  🟩 Clang14            Pass: 100%/4   | Total: 19m 04s | Avg:  4m 46s | Max:  5m 18s
  🟩 Clang15            Pass: 100%/4   | Total: 20m 57s | Avg:  5m 14s | Max:  5m 32s
  🟩 Clang16            Pass: 100%/4   | Total: 19m 11s | Avg:  4m 47s | Max:  5m 37s
  🟩 Clang17            Pass: 100%/4   | Total: 19m 40s | Avg:  4m 55s | Max:  5m 16s
  🟨 Clang18            Pass:  84%/26  | Total:  7h 21m | Avg: 16m 57s | Max: 42m 29s
  🟩 GCC6               Pass: 100%/2   | Total:  7m 40s | Avg:  3m 50s | Max:  4m 10s
  🟩 GCC7               Pass: 100%/6   | Total: 24m 25s | Avg:  4m 04s | Max:  5m 04s
  🟩 GCC8               Pass: 100%/6   | Total: 22m 27s | Avg:  3m 44s | Max:  4m 07s
  🟩 GCC9               Pass: 100%/6   | Total: 24m 37s | Avg:  4m 06s | Max:  4m 43s
  🟩 GCC10              Pass: 100%/4   | Total: 17m 38s | Avg:  4m 24s | Max:  4m 45s
  🟩 GCC11              Pass: 100%/7   | Total: 31m 41s | Avg:  4m 31s | Max:  5m 03s
  🟩 GCC12              Pass: 100%/4   | Total: 18m 19s | Avg:  4m 34s | Max:  4m 59s
  🟨 GCC13              Pass:  82%/29  | Total:  8h 55m | Avg: 18m 28s | Max:  1h 27m
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 16m 14s | Avg:  5m 24s | Max:  5m 33s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 16m 51s | Avg: 16m 51s | Max: 16m 51s | Hits:  99%/727   
  🟩 MSVC14.29          Pass: 100%/2   | Total: 25m 16s | Avg: 12m 38s | Max: 12m 39s | Hits:  99%/1454  
  🟩 MSVC14.39          Pass: 100%/3   | Total: 41m 14s | Avg: 13m 44s | Max: 14m 02s | Hits:  99%/2181  
🟨 cxx_family
  🟨 Clang              Pass:  93%/63  | Total: 10h 18m | Avg:  9m 49s | Max: 42m 29s
  🟨 GCC                Pass:  92%/64  | Total: 11h 22m | Avg: 10m 40s | Max:  1h 27m
  🟩 Intel              Pass: 100%/3   | Total: 16m 14s | Avg:  5m 24s | Max:  5m 33s
  🟩 MSVC               Pass: 100%/6   | Total:  1h 23m | Avg: 13m 53s | Max: 16m 51s | Hits:  99%/4362  
🟨 jobs
  🟩 Build              Pass: 100%/103 | Total:  8h 41m | Avg:  5m 04s | Max: 16m 51s | Hits:  99%/4362  
  🟩 DeviceLaunch       Pass: 100%/8   | Total:  4h 01m | Avg: 30m 09s | Max:  1h 27m
  🟩 GraphCapture       Pass: 100%/8   | Total:  2h 37m | Avg: 19m 40s | Max: 29m 36s
  🟩 HostLaunch         Pass: 100%/8   | Total:  2h 55m | Avg: 21m 53s | Max: 30m 19s
  🟥 SmallGMem          Pass:   0%/1   | Total: 40m 26s | Avg: 40m 26s | Max: 40m 26s
  🟥 TestGPU            Pass:   0%/8   | Total:  4h 24m | Avg: 33m 04s | Max: 49m 23s
🟨 gpu
  🟨 v100               Pass:  93%/136 | Total: 23h 20m | Avg: 10m 17s | Max:  1h 27m | Hits:  99%/4362  
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 14m 18s | Avg:  4m 46s | Max:  5m 03s
  🟩 90a                Pass: 100%/4   | Total: 15m 07s | Avg:  3m 46s | Max:  3m 56s
🟨 std
  🟨 11                 Pass:  94%/35  | Total:  4h 54m | Avg:  8m 25s | Max: 28m 04s
  🟨 14                 Pass:  94%/38  | Total:  6h 54m | Avg: 10m 54s | Max:  1h 27m | Hits:  99%/2181  
  🟨 17                 Pass:  92%/38  | Total:  6h 57m | Avg: 10m 59s | Max: 40m 26s | Hits:  99%/1454  
  🟨 20                 Pass:  92%/25  | Total:  4h 34m | Avg: 10m 58s | Max: 42m 29s | Hits:  99%/727

🟥 pycuda: Pass: 0%/1 | Total: 12m 44s | Avg: 12m 44s | Max: 12m 44s

🟥 cpu
  🟥 amd64              Pass:   0%/1   | Total: 12m 44s | Avg: 12m 44s | Max: 12m 44s
🟥 ctk
  🟥 12.5               Pass:   0%/1   | Total: 12m 44s | Avg: 12m 44s | Max: 12m 44s
🟥 cudacxx
  🟥 nvcc12.5           Pass:   0%/1   | Total: 12m 44s | Avg: 12m 44s | Max: 12m 44s
🟥 cudacxx_family
  🟥 nvcc               Pass:   0%/1   | Total: 12m 44s | Avg: 12m 44s | Max: 12m 44s
🟥 cxx
  🟥 GCC13              Pass:   0%/1   | Total: 12m 44s | Avg: 12m 44s | Max: 12m 44s
🟥 cxx_family
  🟥 GCC                Pass:   0%/1   | Total: 12m 44s | Avg: 12m 44s | Max: 12m 44s
🟥 gpu
  🟥 v100               Pass:   0%/1   | Total: 12m 44s | Avg: 12m 44s | Max: 12m 44s
🟥 jobs
  🟥 Test               Pass:   0%/1   | Total: 12m 44s | Avg: 12m 44s | Max: 12m 44s

🟩 thrust: Pass: 100%/122 | Total: 14h 15m | Avg: 7m 00s | Max: 38m 31s | Hits: 99%/20070

🟩 cpu
  🟩 amd64              Pass: 100%/114 | Total: 13h 38m | Avg:  7m 10s | Max: 38m 31s | Hits:  99%/20070 
  🟩 arm64              Pass: 100%/8   | Total: 37m 30s | Avg:  4m 41s | Max:  5m 12s
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  1h 19m | Avg:  5m 17s | Max: 20m 37s | Hits:  99%/2230  
  🟩 11.8               Pass: 100%/3   | Total: 15m 34s | Avg:  5m 11s | Max:  5m 53s
  🟩 12.6               Pass: 100%/104 | Total: 12h 40m | Avg:  7m 19s | Max: 38m 31s | Hits:  99%/17840 
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total: 10m 18s | Avg:  5m 09s | Max:  5m 20s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  1h 19m | Avg:  5m 17s | Max: 20m 37s | Hits:  99%/2230  
  🟩 nvcc11.8           Pass: 100%/3   | Total: 15m 34s | Avg:  5m 11s | Max:  5m 53s
  🟩 nvcc12.6           Pass: 100%/102 | Total: 12h 30m | Avg:  7m 21s | Max: 38m 31s | Hits:  99%/17840 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 10m 18s | Avg:  5m 09s | Max:  5m 20s
  🟩 nvcc               Pass: 100%/120 | Total: 14h 05m | Avg:  7m 02s | Max: 38m 31s | Hits:  99%/20070 
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total: 31m 25s | Avg:  5m 14s | Max:  6m 21s
  🟩 Clang10            Pass: 100%/3   | Total: 18m 03s | Avg:  6m 01s | Max:  6m 27s
  🟩 Clang11            Pass: 100%/4   | Total: 20m 57s | Avg:  5m 14s | Max:  5m 39s
  🟩 Clang12            Pass: 100%/4   | Total: 19m 38s | Avg:  4m 54s | Max:  5m 02s
  🟩 Clang13            Pass: 100%/4   | Total: 21m 03s | Avg:  5m 15s | Max:  5m 47s
  🟩 Clang14            Pass: 100%/4   | Total: 20m 42s | Avg:  5m 10s | Max:  5m 27s
  🟩 Clang15            Pass: 100%/4   | Total: 20m 32s | Avg:  5m 08s | Max:  5m 40s
  🟩 Clang16            Pass: 100%/4   | Total: 20m 59s | Avg:  5m 14s | Max:  5m 45s
  🟩 Clang17            Pass: 100%/4   | Total: 20m 52s | Avg:  5m 13s | Max:  5m 38s
  🟩 Clang18            Pass: 100%/18  | Total:  2h 03m | Avg:  6m 53s | Max: 13m 33s
  🟩 GCC6               Pass: 100%/2   | Total:  8m 27s | Avg:  4m 13s | Max:  4m 27s
  🟩 GCC7               Pass: 100%/6   | Total: 26m 19s | Avg:  4m 23s | Max:  4m 59s
  🟩 GCC8               Pass: 100%/6   | Total: 27m 55s | Avg:  4m 39s | Max:  5m 25s
  🟩 GCC9               Pass: 100%/6   | Total: 26m 47s | Avg:  4m 27s | Max:  5m 17s
  🟩 GCC10              Pass: 100%/4   | Total: 19m 56s | Avg:  4m 59s | Max:  5m 14s
  🟩 GCC11              Pass: 100%/7   | Total: 36m 54s | Avg:  5m 16s | Max:  5m 53s
  🟩 GCC12              Pass: 100%/4   | Total: 21m 24s | Avg:  5m 21s | Max:  5m 43s
  🟩 GCC13              Pass: 100%/20  | Total:  2h 43m | Avg:  8m 11s | Max: 38m 31s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 19m 14s | Avg:  6m 24s | Max:  6m 59s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 20m 37s | Avg: 20m 37s | Max: 20m 37s | Hits:  99%/2230  
  🟩 MSVC14.29          Pass: 100%/2   | Total: 35m 34s | Avg: 17m 47s | Max: 18m 21s | Hits:  99%/4460  
  🟩 MSVC14.39          Pass: 100%/6   | Total:  2h 10m | Avg: 21m 48s | Max: 25m 07s | Hits:  99%/13380 
🟩 cxx_family
  🟩 Clang              Pass: 100%/55  | Total:  5h 18m | Avg:  5m 47s | Max: 13m 33s
  🟩 GCC                Pass: 100%/55  | Total:  5h 31m | Avg:  6m 01s | Max: 38m 31s
  🟩 Intel              Pass: 100%/3   | Total: 19m 14s | Avg:  6m 24s | Max:  6m 59s
  🟩 MSVC               Pass: 100%/9   | Total:  3h 07m | Avg: 20m 46s | Max: 25m 07s | Hits:  99%/20070 
🟩 gpu
  🟩 v100               Pass: 100%/122 | Total: 14h 15m | Avg:  7m 00s | Max: 38m 31s | Hits:  99%/20070 
🟩 jobs
  🟩 Build              Pass: 100%/103 | Total: 10h 01m | Avg:  5m 50s | Max: 21m 02s | Hits:  99%/13380 
  🟩 TestCPU            Pass: 100%/11  | Total:  2h 09m | Avg: 11m 47s | Max: 25m 07s | Hits:  99%/6690  
  🟩 TestGPU            Pass: 100%/8   | Total:  2h 04m | Avg: 15m 37s | Max: 38m 31s
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 15m 34s | Avg:  5m 11s | Max:  5m 53s
  🟩 90a                Pass: 100%/4   | Total: 17m 47s | Avg:  4m 26s | Max:  4m 45s
🟩 std
  🟩 11                 Pass: 100%/31  | Total:  2h 43m | Avg:  5m 15s | Max: 13m 00s
  🟩 14                 Pass: 100%/35  | Total:  4h 16m | Avg:  7m 20s | Max: 24m 56s | Hits:  99%/8920  
  🟩 17                 Pass: 100%/34  | Total:  4h 04m | Avg:  7m 10s | Max: 23m 18s | Hits:  99%/6690  
  🟩 20                 Pass: 100%/22  | Total:  3h 11m | Avg:  8m 43s | Max: 38m 31s | Hits:  99%/4460

🟩 libcudacxx: Pass: 100%/116 | Total: 19h 43m | Avg: 10m 12s | Max: 36m 32s | Hits: 99%/17005

🟩 cpu
  🟩 amd64              Pass: 100%/108 | Total: 18h 52m | Avg: 10m 28s | Max: 36m 32s | Hits:  99%/17005 
  🟩 arm64              Pass: 100%/8   | Total: 51m 16s | Avg:  6m 24s | Max: 23m 32s
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  2h 08m | Avg:  8m 34s | Max: 36m 32s | Hits:  99%/2642  
  🟩 11.8               Pass: 100%/3   | Total: 56m 56s | Avg: 18m 58s | Max: 31m 25s
  🟩 12.6               Pass: 100%/98  | Total: 16h 37m | Avg: 10m 10s | Max: 31m 18s | Hits:  99%/14363 
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total: 38m 37s | Avg: 19m 18s | Max: 20m 37s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  2h 08m | Avg:  8m 34s | Max: 36m 32s | Hits:  99%/2642  
  🟩 nvcc11.8           Pass: 100%/3   | Total: 56m 56s | Avg: 18m 58s | Max: 31m 25s
  🟩 nvcc12.6           Pass: 100%/96  | Total: 15h 59m | Avg:  9m 59s | Max: 31m 18s | Hits:  99%/14363 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 38m 37s | Avg: 19m 18s | Max: 20m 37s
  🟩 nvcc               Pass: 100%/114 | Total: 19h 04m | Avg: 10m 02s | Max: 36m 32s | Hits:  99%/17005 
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total: 26m 59s | Avg:  4m 29s | Max:  5m 43s
  🟩 Clang10            Pass: 100%/3   | Total: 32m 40s | Avg: 10m 53s | Max: 21m 12s
  🟩 Clang11            Pass: 100%/4   | Total: 17m 46s | Avg:  4m 26s | Max:  4m 33s
  🟩 Clang12            Pass: 100%/4   | Total: 58m 13s | Avg: 14m 33s | Max: 28m 33s
  🟩 Clang13            Pass: 100%/4   | Total: 18m 38s | Avg:  4m 39s | Max:  5m 03s
  🟩 Clang14            Pass: 100%/4   | Total: 17m 58s | Avg:  4m 29s | Max:  4m 47s
  🟩 Clang15            Pass: 100%/4   | Total: 58m 17s | Avg: 14m 34s | Max: 28m 55s
  🟩 Clang16            Pass: 100%/4   | Total: 38m 26s | Avg:  9m 36s | Max: 25m 04s
  🟩 Clang17            Pass: 100%/4   | Total:  1h 18m | Avg: 19m 31s | Max: 31m 18s
  🟩 Clang18            Pass: 100%/14  | Total:  2h 47m | Avg: 11m 56s | Max: 28m 27s
  🟩 GCC6               Pass: 100%/2   | Total: 39m 43s | Avg: 19m 51s | Max: 36m 32s
  🟩 GCC7               Pass: 100%/6   | Total:  1h 05m | Avg: 10m 50s | Max: 27m 59s
  🟩 GCC8               Pass: 100%/6   | Total: 20m 39s | Avg:  3m 26s | Max:  4m 08s
  🟩 GCC9               Pass: 100%/6   | Total: 32m 29s | Avg:  5m 24s | Max: 13m 57s
  🟩 GCC10              Pass: 100%/4   | Total: 36m 24s | Avg:  9m 06s | Max: 23m 07s
  🟩 GCC11              Pass: 100%/7   | Total:  1h 29m | Avg: 12m 50s | Max: 31m 25s
  🟩 GCC12              Pass: 100%/4   | Total: 37m 41s | Avg:  9m 25s | Max: 25m 36s
  🟩 GCC13              Pass: 100%/21  | Total:  3h 53m | Avg: 11m 07s | Max: 29m 53s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 18m 49s | Avg:  6m 16s | Max:  6m 39s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 20m 12s | Avg: 20m 12s | Max: 20m 12s | Hits:  99%/2642  
  🟩 MSVC14.29          Pass: 100%/2   | Total: 27m 46s | Avg: 13m 53s | Max: 14m 31s | Hits:  99%/5646  
  🟩 MSVC14.39          Pass: 100%/3   | Total: 46m 54s | Avg: 15m 38s | Max: 16m 09s | Hits:  99%/8717  
🟩 cxx_family
  🟩 Clang              Pass: 100%/51  | Total:  8h 34m | Avg: 10m 04s | Max: 31m 18s
  🟩 GCC                Pass: 100%/56  | Total:  9h 15m | Avg:  9m 55s | Max: 36m 32s
  🟩 Intel              Pass: 100%/3   | Total: 18m 49s | Avg:  6m 16s | Max:  6m 39s
  🟩 MSVC               Pass: 100%/6   | Total:  1h 34m | Avg: 15m 48s | Max: 20m 12s | Hits:  99%/17005 
🟩 gpu
  🟩 v100               Pass: 100%/116 | Total: 19h 43m | Avg: 10m 12s | Max: 36m 32s | Hits:  99%/17005 
🟩 jobs
  🟩 Build              Pass: 100%/103 | Total: 15h 20m | Avg:  8m 56s | Max: 36m 32s | Hits:  99%/17005 
  🟩 NVRTC              Pass: 100%/4   | Total:  1h 44m | Avg: 26m 01s | Max: 29m 53s
  🟩 Test               Pass: 100%/8   | Total:  2h 36m | Avg: 19m 34s | Max: 28m 27s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  2m 18s | Avg:  2m 18s | Max:  2m 18s
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 56m 56s | Avg: 18m 58s | Max: 31m 25s
  🟩 90a                Pass: 100%/4   | Total: 16m 51s | Avg:  4m 12s | Max:  4m 31s
🟩 std
  🟩 11                 Pass: 100%/30  | Total:  4h 16m | Avg:  8m 33s | Max: 36m 32s
  🟩 14                 Pass: 100%/33  | Total:  4h 57m | Avg:  9m 00s | Max: 27m 21s | Hits:  99%/8128  
  🟩 17                 Pass: 100%/32  | Total:  6h 35m | Avg: 12m 22s | Max: 31m 25s | Hits:  99%/5806  
  🟩 20                 Pass: 100%/20  | Total:  3h 51m | Avg: 11m 33s | Max: 31m 18s | Hits:  99%/3071

🟩 cudax: Pass: 100%/58 | Total: 2h 43m | Avg: 2m 48s | Max: 11m 02s | Hits: 90%/208

🟩 cpu
  🟩 amd64              Pass: 100%/54  | Total:  2h 34m | Avg:  2m 51s | Max: 11m 02s | Hits:  90%/208   
  🟩 arm64              Pass: 100%/4   | Total:  9m 03s | Avg:  2m 15s | Max:  2m 57s
🟩 ctk
  🟩 12.0               Pass: 100%/23  | Total:  1h 04m | Avg:  2m 47s | Max: 11m 02s | Hits:  90%/104   
  🟩 12.6               Pass: 100%/35  | Total:  1h 38m | Avg:  2m 49s | Max: 10m 00s | Hits:  90%/104   
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/23  | Total:  1h 04m | Avg:  2m 47s | Max: 11m 02s | Hits:  90%/104   
  🟩 nvcc12.6           Pass: 100%/35  | Total:  1h 38m | Avg:  2m 49s | Max: 10m 00s | Hits:  90%/104   
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/58  | Total:  2h 43m | Avg:  2m 48s | Max: 11m 02s | Hits:  90%/208   
🟩 cxx
  🟩 Clang9             Pass: 100%/2   | Total:  4m 58s | Avg:  2m 29s | Max:  3m 01s
  🟩 Clang10            Pass: 100%/2   | Total:  4m 42s | Avg:  2m 21s | Max:  2m 23s
  🟩 Clang11            Pass: 100%/4   | Total:  9m 39s | Avg:  2m 24s | Max:  2m 56s
  🟩 Clang12            Pass: 100%/4   | Total:  9m 26s | Avg:  2m 21s | Max:  2m 47s
  🟩 Clang13            Pass: 100%/4   | Total:  8m 23s | Avg:  2m 05s | Max:  2m 30s
  🟩 Clang14            Pass: 100%/6   | Total: 18m 21s | Avg:  3m 03s | Max:  4m 32s
  🟩 Clang15            Pass: 100%/2   | Total:  5m 29s | Avg:  2m 44s | Max:  2m 59s
  🟩 Clang16            Pass: 100%/4   | Total: 10m 48s | Avg:  2m 42s | Max:  3m 00s
  🟩 Clang17            Pass: 100%/2   | Total:  4m 52s | Avg:  2m 26s | Max:  2m 27s
  🟩 Clang18            Pass: 100%/4   | Total: 12m 42s | Avg:  3m 10s | Max:  4m 18s
  🟩 GCC9               Pass: 100%/2   | Total:  3m 38s | Avg:  1m 49s | Max:  1m 52s
  🟩 GCC10              Pass: 100%/4   | Total:  7m 55s | Avg:  1m 58s | Max:  2m 08s
  🟩 GCC11              Pass: 100%/4   | Total:  7m 46s | Avg:  1m 56s | Max:  2m 07s
  🟩 GCC12              Pass: 100%/9   | Total: 27m 15s | Avg:  3m 01s | Max:  4m 39s
  🟩 GCC13              Pass: 100%/3   | Total:  6m 13s | Avg:  2m 04s | Max:  2m 15s
  🟩 MSVC14.36          Pass: 100%/1   | Total: 11m 02s | Avg: 11m 02s | Max: 11m 02s | Hits:  90%/104   
  🟩 MSVC14.39          Pass: 100%/1   | Total: 10m 00s | Avg: 10m 00s | Max: 10m 00s | Hits:  90%/104   
🟩 cxx_family
  🟩 Clang              Pass: 100%/34  | Total:  1h 29m | Avg:  2m 37s | Max:  4m 32s
  🟩 GCC                Pass: 100%/22  | Total: 52m 47s | Avg:  2m 23s | Max:  4m 39s
  🟩 MSVC               Pass: 100%/2   | Total: 21m 02s | Avg: 10m 31s | Max: 11m 02s | Hits:  90%/208   
🟩 gpu
  🟩 v100               Pass: 100%/58  | Total:  2h 43m | Avg:  2m 48s | Max: 11m 02s | Hits:  90%/208   
🟩 jobs
  🟩 Build              Pass: 100%/50  | Total:  2h 08m | Avg:  2m 34s | Max: 11m 02s | Hits:  90%/208   
  🟩 Test               Pass: 100%/8   | Total: 34m 38s | Avg:  4m 19s | Max:  4m 39s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total:  1m 49s | Avg:  1m 49s | Max:  1m 49s
  🟩 90a                Pass: 100%/1   | Total:  2m 07s | Avg:  2m 07s | Max:  2m 07s
🟩 std
  🟩 17                 Pass: 100%/32  | Total:  1h 19m | Avg:  2m 29s | Max:  4m 39s
  🟩 20                 Pass: 100%/26  | Total:  1h 23m | Avg:  3m 12s | Max: 11m 02s | Hits:  90%/208

🟩 cccl: Pass: 100%/4 | Total: 16m 26s | Avg: 4m 06s | Max: 4m 37s

🟩 cpu
  🟩 amd64              Pass: 100%/4   | Total: 16m 26s | Avg:  4m 06s | Max:  4m 37s
🟩 ctk
  🟩 11.1               Pass: 100%/2   | Total:  7m 17s | Avg:  3m 38s | Max:  4m 01s
  🟩 12.6               Pass: 100%/2   | Total:  9m 09s | Avg:  4m 34s | Max:  4m 37s
🟩 cudacxx
  🟩 nvcc11.1           Pass: 100%/2   | Total:  7m 17s | Avg:  3m 38s | Max:  4m 01s
  🟩 nvcc12.6           Pass: 100%/2   | Total:  9m 09s | Avg:  4m 34s | Max:  4m 37s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/4   | Total: 16m 26s | Avg:  4m 06s | Max:  4m 37s
🟩 cxx
  🟩 Clang9             Pass: 100%/1   | Total:  4m 01s | Avg:  4m 01s | Max:  4m 01s
  🟩 Clang18            Pass: 100%/1   | Total:  4m 37s | Avg:  4m 37s | Max:  4m 37s
  🟩 GCC6               Pass: 100%/1   | Total:  3m 16s | Avg:  3m 16s | Max:  3m 16s
  🟩 GCC13              Pass: 100%/1   | Total:  4m 32s | Avg:  4m 32s | Max:  4m 32s
🟩 cxx_family
  🟩 Clang              Pass: 100%/2   | Total:  8m 38s | Avg:  4m 19s | Max:  4m 37s
  🟩 GCC                Pass: 100%/2   | Total:  7m 48s | Avg:  3m 54s | Max:  4m 32s
🟩 gpu
  🟩 v100               Pass: 100%/4   | Total: 16m 26s | Avg:  4m 06s | Max:  4m 37s
🟩 jobs
  🟩 Infra              Pass: 100%/4   | Total: 16m 26s | Avg:  4m 06s | Max:  4m 37s

👃 Inspect Changes

Modifications in project?

	Project
+/-	CCCL Infrastructure
	libcu++
	CUB
	Thrust
	CUDA Experimental
	pycuda
	CUDA C Core Library

Modifications in project or dependencies?

	Project
+/-	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	pycuda
+/-	CUDA C Core Library

🏃‍ Runner counts (total jobs: 437)

#	Runner
320	`linux-amd64-cpu16`
66	`linux-amd64-gpu-v100-latest-1`
28	`linux-arm64-cpu16`
23	`windows-amd64-cpu16`

That might conflict with the host standard library

…imental/__init__.py and fix bug in python/cuda_parallel/tests/test_reduce_api.py

github-actions · 2024-09-30T00:03:15Z

🟩 CI finished in 1h 15m: Pass: 100%/368 | Total: 1d 11h | Avg: 5m 42s | Max: 1h 06m | Hits: 99%/25663

🟩 cub: Pass: 100%/104 | Total: 11h 57m | Avg: 6m 54s | Max: 1h 06m | Hits: 99%/2908

🟩 cpu
  🟩 amd64              Pass: 100%/96  | Total: 11h 24m | Avg:  7m 07s | Max:  1h 06m | Hits:  99%/2908  
  🟩 arm64              Pass: 100%/8   | Total: 33m 03s | Avg:  4m 07s | Max:  5m 01s
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  1h 10m | Avg:  4m 40s | Max: 15m 38s | Hits:  99%/727   
  🟩 11.8               Pass: 100%/3   | Total: 14m 04s | Avg:  4m 41s | Max:  5m 05s
  🟩 12.6               Pass: 100%/86  | Total: 10h 33m | Avg:  7m 22s | Max:  1h 06m | Hits:  99%/2181  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total:  7m 42s | Avg:  3m 51s | Max:  4m 01s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  1h 10m | Avg:  4m 40s | Max: 15m 38s | Hits:  99%/727   
  🟩 nvcc11.8           Pass: 100%/3   | Total: 14m 04s | Avg:  4m 41s | Max:  5m 05s
  🟩 nvcc12.6           Pass: 100%/84  | Total: 10h 25m | Avg:  7m 27s | Max:  1h 06m | Hits:  99%/2181  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  7m 42s | Avg:  3m 51s | Max:  4m 01s
  🟩 nvcc               Pass: 100%/102 | Total: 11h 50m | Avg:  6m 57s | Max:  1h 06m | Hits:  99%/2908  
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total: 27m 55s | Avg:  4m 39s | Max:  5m 11s
  🟩 Clang10            Pass: 100%/3   | Total: 17m 08s | Avg:  5m 42s | Max:  5m 52s
  🟩 Clang11            Pass: 100%/4   | Total: 18m 06s | Avg:  4m 31s | Max:  4m 38s
  🟩 Clang12            Pass: 100%/4   | Total: 18m 14s | Avg:  4m 33s | Max:  4m 41s
  🟩 Clang13            Pass: 100%/4   | Total: 18m 13s | Avg:  4m 33s | Max:  4m 47s
  🟩 Clang14            Pass: 100%/4   | Total: 19m 00s | Avg:  4m 45s | Max:  4m 56s
  🟩 Clang15            Pass: 100%/4   | Total: 18m 46s | Avg:  4m 41s | Max:  5m 03s
  🟩 Clang16            Pass: 100%/4   | Total: 18m 02s | Avg:  4m 30s | Max:  4m 40s
  🟩 Clang17            Pass: 100%/4   | Total: 19m 24s | Avg:  4m 51s | Max:  5m 07s
  🟩 Clang18            Pass: 100%/9   | Total:  2h 04m | Avg: 13m 48s | Max:  1h 06m
  🟩 GCC6               Pass: 100%/2   | Total:  6m 54s | Avg:  3m 27s | Max:  3m 30s
  🟩 GCC7               Pass: 100%/6   | Total: 24m 05s | Avg:  4m 00s | Max:  4m 44s
  🟩 GCC8               Pass: 100%/6   | Total: 25m 20s | Avg:  4m 13s | Max:  4m 39s
  🟩 GCC9               Pass: 100%/6   | Total: 24m 50s | Avg:  4m 08s | Max:  4m 38s
  🟩 GCC10              Pass: 100%/4   | Total: 18m 37s | Avg:  4m 39s | Max:  4m 58s
  🟩 GCC11              Pass: 100%/7   | Total: 32m 56s | Avg:  4m 42s | Max:  5m 05s
  🟩 GCC12              Pass: 100%/4   | Total: 19m 00s | Avg:  4m 45s | Max:  4m 54s
  🟩 GCC13              Pass: 100%/16  | Total:  3h 13m | Avg: 12m 05s | Max: 41m 28s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 16m 27s | Avg:  5m 29s | Max:  5m 58s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 15m 38s | Avg: 15m 38s | Max: 15m 38s | Hits:  99%/727   
  🟩 MSVC14.29          Pass: 100%/2   | Total: 26m 35s | Avg: 13m 17s | Max: 14m 04s | Hits:  99%/1454  
  🟩 MSVC14.39          Pass: 100%/1   | Total: 14m 58s | Avg: 14m 58s | Max: 14m 58s | Hits:  99%/727   
🟩 cxx_family
  🟩 Clang              Pass: 100%/46  | Total:  4h 59m | Avg:  6m 30s | Max:  1h 06m
  🟩 GCC                Pass: 100%/51  | Total:  5h 45m | Avg:  6m 46s | Max: 41m 28s
  🟩 Intel              Pass: 100%/3   | Total: 16m 27s | Avg:  5m 29s | Max:  5m 58s
  🟩 MSVC               Pass: 100%/4   | Total: 57m 11s | Avg: 14m 17s | Max: 15m 38s | Hits:  99%/2908  
🟩 gpu
  🟩 v100               Pass: 100%/104 | Total: 11h 57m | Avg:  6m 54s | Max:  1h 06m | Hits:  99%/2908  
🟩 jobs
  🟩 Build              Pass: 100%/96  | Total:  8h 26m | Avg:  5m 16s | Max: 41m 28s | Hits:  99%/2908  
  🟩 DeviceLaunch       Pass: 100%/1   | Total: 17m 06s | Avg: 17m 06s | Max: 17m 06s
  🟩 GraphCapture       Pass: 100%/1   | Total: 14m 48s | Avg: 14m 48s | Max: 14m 48s
  🟩 HostLaunch         Pass: 100%/3   | Total:  1h 36m | Avg: 32m 16s | Max:  1h 06m
  🟩 TestGPU            Pass: 100%/3   | Total:  1h 22m | Avg: 27m 38s | Max: 32m 15s
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 14m 04s | Avg:  4m 41s | Max:  5m 05s
  🟩 90a                Pass: 100%/4   | Total: 14m 17s | Avg:  3m 34s | Max:  3m 46s
🟩 std
  🟩 11                 Pass: 100%/28  | Total:  2h 39m | Avg:  5m 42s | Max: 32m 15s
  🟩 14                 Pass: 100%/27  | Total:  2h 19m | Avg:  5m 10s | Max: 15m 38s | Hits:  99%/1454  
  🟩 17                 Pass: 100%/26  | Total:  2h 10m | Avg:  5m 00s | Max: 14m 04s | Hits:  99%/727   
  🟩 20                 Pass: 100%/23  | Total:  4h 48m | Avg: 12m 32s | Max:  1h 06m | Hits:  99%/727

🟩 libcudacxx: Pass: 100%/104 | Total: 10h 00m | Avg: 5m 46s | Max: 27m 37s | Hits: 99%/11383

🟩 cpu
  🟩 amd64              Pass: 100%/96  | Total:  9h 32m | Avg:  5m 57s | Max: 27m 37s | Hits:  99%/11383 
  🟩 arm64              Pass: 100%/8   | Total: 27m 57s | Avg:  3m 29s | Max:  3m 54s
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  1h 00m | Avg:  4m 03s | Max: 19m 48s | Hits:  99%/2648  
  🟩 11.8               Pass: 100%/3   | Total:  9m 25s | Avg:  3m 08s | Max:  3m 30s
  🟩 12.6               Pass: 100%/86  | Total:  8h 50m | Avg:  6m 09s | Max: 27m 37s | Hits:  99%/8735  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total: 39m 28s | Avg: 19m 44s | Max: 20m 00s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  1h 00m | Avg:  4m 03s | Max: 19m 48s | Hits:  99%/2648  
  🟩 nvcc11.8           Pass: 100%/3   | Total:  9m 25s | Avg:  3m 08s | Max:  3m 30s
  🟩 nvcc12.6           Pass: 100%/84  | Total:  8h 10m | Avg:  5m 50s | Max: 27m 37s | Hits:  99%/8735  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 39m 28s | Avg: 19m 44s | Max: 20m 00s
  🟩 nvcc               Pass: 100%/102 | Total:  9h 21m | Avg:  5m 30s | Max: 27m 37s | Hits:  99%/11383 
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total: 24m 27s | Avg:  4m 04s | Max:  5m 21s
  🟩 Clang10            Pass: 100%/3   | Total: 14m 35s | Avg:  4m 51s | Max:  5m 11s
  🟩 Clang11            Pass: 100%/4   | Total: 16m 26s | Avg:  4m 06s | Max:  4m 38s
  🟩 Clang12            Pass: 100%/4   | Total: 16m 51s | Avg:  4m 12s | Max:  4m 35s
  🟩 Clang13            Pass: 100%/4   | Total: 16m 30s | Avg:  4m 07s | Max:  4m 13s
  🟩 Clang14            Pass: 100%/4   | Total: 16m 49s | Avg:  4m 12s | Max:  4m 51s
  🟩 Clang15            Pass: 100%/4   | Total: 17m 30s | Avg:  4m 22s | Max:  5m 02s
  🟩 Clang16            Pass: 100%/4   | Total: 16m 44s | Avg:  4m 11s | Max:  4m 27s
  🟩 Clang17            Pass: 100%/4   | Total: 16m 48s | Avg:  4m 12s | Max:  4m 35s
  🟩 Clang18            Pass: 100%/8   | Total:  1h 17m | Avg:  9m 41s | Max: 20m 00s
  🟩 GCC6               Pass: 100%/2   | Total:  5m 17s | Avg:  2m 38s | Max:  2m 55s
  🟩 GCC7               Pass: 100%/6   | Total: 19m 12s | Avg:  3m 12s | Max:  4m 02s
  🟩 GCC8               Pass: 100%/6   | Total: 18m 49s | Avg:  3m 08s | Max:  3m 39s
  🟩 GCC9               Pass: 100%/6   | Total: 19m 34s | Avg:  3m 15s | Max:  3m 41s
  🟩 GCC10              Pass: 100%/4   | Total: 15m 11s | Avg:  3m 47s | Max:  4m 14s
  🟩 GCC11              Pass: 100%/7   | Total: 24m 55s | Avg:  3m 33s | Max:  4m 16s
  🟩 GCC12              Pass: 100%/4   | Total: 15m 50s | Avg:  3m 57s | Max:  4m 27s
  🟩 GCC13              Pass: 100%/17  | Total:  2h 46m | Avg:  9m 49s | Max: 27m 37s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 16m 06s | Avg:  5m 22s | Max:  6m 12s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 19m 48s | Avg: 19m 48s | Max: 19m 48s | Hits:  99%/2648  
  🟩 MSVC14.29          Pass: 100%/2   | Total: 30m 02s | Avg: 15m 01s | Max: 16m 48s | Hits:  99%/5658  
  🟩 MSVC14.39          Pass: 100%/1   | Total: 14m 44s | Avg: 14m 44s | Max: 14m 44s | Hits:  99%/3077  
🟩 cxx_family
  🟩 Clang              Pass: 100%/45  | Total:  3h 54m | Avg:  5m 12s | Max: 20m 00s
  🟩 GCC                Pass: 100%/52  | Total:  4h 45m | Avg:  5m 29s | Max: 27m 37s
  🟩 Intel              Pass: 100%/3   | Total: 16m 06s | Avg:  5m 22s | Max:  6m 12s
  🟩 MSVC               Pass: 100%/4   | Total:  1h 04m | Avg: 16m 08s | Max: 19m 48s | Hits:  99%/11383 
🟩 gpu
  🟩 v100               Pass: 100%/104 | Total: 10h 00m | Avg:  5m 46s | Max: 27m 37s | Hits:  99%/11383 
🟩 jobs
  🟩 Build              Pass: 100%/96  | Total:  7h 30m | Avg:  4m 41s | Max: 20m 00s | Hits:  99%/11383 
  🟩 NVRTC              Pass: 100%/4   | Total:  1h 38m | Avg: 24m 43s | Max: 27m 37s
  🟩 Test               Pass: 100%/3   | Total: 48m 54s | Avg: 16m 18s | Max: 18m 49s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  1m 56s | Avg:  1m 56s | Max:  1m 56s
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total:  9m 25s | Avg:  3m 08s | Max:  3m 30s
  🟩 90a                Pass: 100%/4   | Total: 15m 07s | Avg:  3m 46s | Max:  4m 18s
🟩 std
  🟩 11                 Pass: 100%/28  | Total:  2h 02m | Avg:  4m 23s | Max: 21m 14s
  🟩 14                 Pass: 100%/28  | Total:  2h 33m | Avg:  5m 28s | Max: 25m 55s | Hits:  99%/5397  
  🟩 17                 Pass: 100%/27  | Total:  2h 40m | Avg:  5m 56s | Max: 24m 07s | Hits:  99%/2909  
  🟩 20                 Pass: 100%/20  | Total:  2h 42m | Avg:  8m 07s | Max: 27m 37s | Hits:  99%/3077

🟩 thrust: Pass: 100%/103 | Total: 10h 11m | Avg: 5m 56s | Max: 22m 28s | Hits: 99%/11150

🟩 cpu
  🟩 amd64              Pass: 100%/95  | Total:  9h 36m | Avg:  6m 04s | Max: 22m 28s | Hits:  99%/11150 
  🟩 arm64              Pass: 100%/8   | Total: 34m 50s | Avg:  4m 21s | Max:  4m 54s
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  1h 17m | Avg:  5m 10s | Max: 20m 54s | Hits:  99%/2230  
  🟩 11.8               Pass: 100%/3   | Total: 14m 48s | Avg:  4m 56s | Max:  5m 41s
  🟩 12.6               Pass: 100%/85  | Total:  8h 38m | Avg:  6m 06s | Max: 22m 28s | Hits:  99%/8920  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total:  9m 37s | Avg:  4m 48s | Max:  5m 00s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  1h 17m | Avg:  5m 10s | Max: 20m 54s | Hits:  99%/2230  
  🟩 nvcc11.8           Pass: 100%/3   | Total: 14m 48s | Avg:  4m 56s | Max:  5m 41s
  🟩 nvcc12.6           Pass: 100%/83  | Total:  8h 29m | Avg:  6m 08s | Max: 22m 28s | Hits:  99%/8920  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  9m 37s | Avg:  4m 48s | Max:  5m 00s
  🟩 nvcc               Pass: 100%/101 | Total: 10h 01m | Avg:  5m 57s | Max: 22m 28s | Hits:  99%/11150 
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total: 30m 38s | Avg:  5m 06s | Max:  6m 01s
  🟩 Clang10            Pass: 100%/3   | Total: 17m 30s | Avg:  5m 50s | Max:  6m 01s
  🟩 Clang11            Pass: 100%/4   | Total: 19m 40s | Avg:  4m 55s | Max:  5m 14s
  🟩 Clang12            Pass: 100%/4   | Total: 19m 26s | Avg:  4m 51s | Max:  5m 22s
  🟩 Clang13            Pass: 100%/4   | Total: 20m 18s | Avg:  5m 04s | Max:  5m 22s
  🟩 Clang14            Pass: 100%/4   | Total: 19m 37s | Avg:  4m 54s | Max:  5m 00s
  🟩 Clang15            Pass: 100%/4   | Total: 19m 15s | Avg:  4m 48s | Max:  4m 58s
  🟩 Clang16            Pass: 100%/4   | Total: 20m 36s | Avg:  5m 09s | Max:  5m 36s
  🟩 Clang17            Pass: 100%/4   | Total: 20m 30s | Avg:  5m 07s | Max:  5m 33s
  🟩 Clang18            Pass: 100%/9   | Total: 56m 04s | Avg:  6m 13s | Max: 16m 41s
  🟩 GCC6               Pass: 100%/2   | Total:  7m 43s | Avg:  3m 51s | Max:  4m 13s
  🟩 GCC7               Pass: 100%/6   | Total: 24m 24s | Avg:  4m 04s | Max:  4m 46s
  🟩 GCC8               Pass: 100%/6   | Total: 26m 22s | Avg:  4m 23s | Max:  4m 49s
  🟩 GCC9               Pass: 100%/6   | Total: 26m 04s | Avg:  4m 20s | Max:  4m 50s
  🟩 GCC10              Pass: 100%/4   | Total: 20m 01s | Avg:  5m 00s | Max:  5m 35s
  🟩 GCC11              Pass: 100%/7   | Total: 34m 50s | Avg:  4m 58s | Max:  5m 41s
  🟩 GCC12              Pass: 100%/4   | Total: 20m 25s | Avg:  5m 06s | Max:  5m 44s
  🟩 GCC13              Pass: 100%/14  | Total:  1h 33m | Avg:  6m 39s | Max: 22m 28s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 18m 59s | Avg:  6m 19s | Max:  6m 37s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 20m 54s | Avg: 20m 54s | Max: 20m 54s | Hits:  99%/2230  
  🟩 MSVC14.29          Pass: 100%/2   | Total: 33m 15s | Avg: 16m 37s | Max: 16m 52s | Hits:  99%/4460  
  🟩 MSVC14.39          Pass: 100%/2   | Total: 41m 23s | Avg: 20m 41s | Max: 22m 06s | Hits:  99%/4460  
🟩 cxx_family
  🟩 Clang              Pass: 100%/46  | Total:  4h 03m | Avg:  5m 17s | Max: 16m 41s
  🟩 GCC                Pass: 100%/49  | Total:  4h 13m | Avg:  5m 09s | Max: 22m 28s
  🟩 Intel              Pass: 100%/3   | Total: 18m 59s | Avg:  6m 19s | Max:  6m 37s
  🟩 MSVC               Pass: 100%/5   | Total:  1h 35m | Avg: 19m 06s | Max: 22m 06s | Hits:  99%/11150 
🟩 gpu
  🟩 v100               Pass: 100%/103 | Total: 10h 11m | Avg:  5m 56s | Max: 22m 28s | Hits:  99%/11150 
🟩 jobs
  🟩 Build              Pass: 100%/96  | Total:  8h 36m | Avg:  5m 22s | Max: 20m 54s | Hits:  99%/8920  
  🟩 TestCPU            Pass: 100%/4   | Total: 44m 14s | Avg: 11m 03s | Max: 22m 06s | Hits:  99%/2230  
  🟩 TestGPU            Pass: 100%/3   | Total: 50m 23s | Avg: 16m 47s | Max: 22m 28s
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 14m 48s | Avg:  4m 56s | Max:  5m 41s
  🟩 90a                Pass: 100%/4   | Total: 16m 43s | Avg:  4m 10s | Max:  4m 47s
🟩 std
  🟩 11                 Pass: 100%/28  | Total:  2h 25m | Avg:  5m 11s | Max: 22m 28s
  🟩 14                 Pass: 100%/27  | Total:  2h 36m | Avg:  5m 48s | Max: 20m 54s | Hits:  99%/4460  
  🟩 17                 Pass: 100%/26  | Total:  2h 24m | Avg:  5m 32s | Max: 16m 52s | Hits:  99%/2230  
  🟩 20                 Pass: 100%/22  | Total:  2h 44m | Avg:  7m 29s | Max: 22m 06s | Hits:  99%/4460

🟩 cudax: Pass: 100%/52 | Total: 2h 19m | Avg: 2m 41s | Max: 10m 21s | Hits: 90%/222

🟩 cpu
  🟩 amd64              Pass: 100%/48  | Total:  2h 11m | Avg:  2m 44s | Max: 10m 21s | Hits:  90%/222   
  🟩 arm64              Pass: 100%/4   | Total:  7m 54s | Avg:  1m 58s | Max:  2m 16s
🟩 ctk
  🟩 12.0               Pass: 100%/19  | Total: 51m 40s | Avg:  2m 43s | Max:  9m 42s | Hits:  90%/111   
  🟩 12.6               Pass: 100%/33  | Total:  1h 27m | Avg:  2m 39s | Max: 10m 21s | Hits:  90%/111   
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/19  | Total: 51m 40s | Avg:  2m 43s | Max:  9m 42s | Hits:  90%/111   
  🟩 nvcc12.6           Pass: 100%/33  | Total:  1h 27m | Avg:  2m 39s | Max: 10m 21s | Hits:  90%/111   
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/52  | Total:  2h 19m | Avg:  2m 41s | Max: 10m 21s | Hits:  90%/222   
🟩 cxx
  🟩 Clang9             Pass: 100%/2   | Total:  4m 24s | Avg:  2m 12s | Max:  2m 13s
  🟩 Clang10            Pass: 100%/2   | Total:  4m 36s | Avg:  2m 18s | Max:  2m 20s
  🟩 Clang11            Pass: 100%/4   | Total:  8m 54s | Avg:  2m 13s | Max:  2m 24s
  🟩 Clang12            Pass: 100%/4   | Total:  9m 04s | Avg:  2m 16s | Max:  2m 23s
  🟩 Clang13            Pass: 100%/4   | Total:  9m 15s | Avg:  2m 18s | Max:  2m 26s
  🟩 Clang14            Pass: 100%/4   | Total: 10m 48s | Avg:  2m 42s | Max:  3m 58s
  🟩 Clang15            Pass: 100%/2   | Total:  4m 45s | Avg:  2m 22s | Max:  2m 31s
  🟩 Clang16            Pass: 100%/4   | Total:  8m 55s | Avg:  2m 13s | Max:  2m 27s
  🟩 Clang17            Pass: 100%/2   | Total:  4m 53s | Avg:  2m 26s | Max:  2m 29s
  🟩 Clang18            Pass: 100%/2   | Total:  6m 54s | Avg:  3m 27s | Max:  4m 34s
  🟩 GCC9               Pass: 100%/2   | Total:  4m 00s | Avg:  2m 00s | Max:  2m 02s
  🟩 GCC10              Pass: 100%/4   | Total:  8m 36s | Avg:  2m 09s | Max:  2m 19s
  🟩 GCC11              Pass: 100%/4   | Total:  8m 13s | Avg:  2m 03s | Max:  2m 18s
  🟩 GCC12              Pass: 100%/7   | Total: 20m 20s | Avg:  2m 54s | Max:  4m 02s
  🟩 GCC13              Pass: 100%/3   | Total:  5m 58s | Avg:  1m 59s | Max:  2m 14s
  🟩 MSVC14.36          Pass: 100%/1   | Total:  9m 42s | Avg:  9m 42s | Max:  9m 42s | Hits:  90%/111   
  🟩 MSVC14.39          Pass: 100%/1   | Total: 10m 21s | Avg: 10m 21s | Max: 10m 21s | Hits:  90%/111   
🟩 cxx_family
  🟩 Clang              Pass: 100%/30  | Total:  1h 12m | Avg:  2m 24s | Max:  4m 34s
  🟩 GCC                Pass: 100%/20  | Total: 47m 07s | Avg:  2m 21s | Max:  4m 02s
  🟩 MSVC               Pass: 100%/2   | Total: 20m 03s | Avg: 10m 01s | Max: 10m 21s | Hits:  90%/222   
🟩 gpu
  🟩 v100               Pass: 100%/52  | Total:  2h 19m | Avg:  2m 41s | Max: 10m 21s | Hits:  90%/222   
🟩 jobs
  🟩 Build              Pass: 100%/47  | Total:  1h 59m | Avg:  2m 32s | Max: 10m 21s | Hits:  90%/222   
  🟩 Test               Pass: 100%/5   | Total: 20m 17s | Avg:  4m 03s | Max:  4m 34s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total:  1m 58s | Avg:  1m 58s | Max:  1m 58s
  🟩 90a                Pass: 100%/1   | Total:  2m 14s | Avg:  2m 14s | Max:  2m 14s
🟩 std
  🟩 17                 Pass: 100%/28  | Total:  1h 05m | Avg:  2m 19s | Max:  4m 02s
  🟩 20                 Pass: 100%/24  | Total:  1h 14m | Avg:  3m 06s | Max: 10m 21s | Hits:  90%/222

🟩 cccl: Pass: 100%/4 | Total: 17m 29s | Avg: 4m 22s | Max: 4m 36s

🟩 cpu
  🟩 amd64              Pass: 100%/4   | Total: 17m 29s | Avg:  4m 22s | Max:  4m 36s
🟩 ctk
  🟩 11.1               Pass: 100%/2   | Total:  8m 38s | Avg:  4m 19s | Max:  4m 31s
  🟩 12.6               Pass: 100%/2   | Total:  8m 51s | Avg:  4m 25s | Max:  4m 36s
🟩 cudacxx
  🟩 nvcc11.1           Pass: 100%/2   | Total:  8m 38s | Avg:  4m 19s | Max:  4m 31s
  🟩 nvcc12.6           Pass: 100%/2   | Total:  8m 51s | Avg:  4m 25s | Max:  4m 36s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/4   | Total: 17m 29s | Avg:  4m 22s | Max:  4m 36s
🟩 cxx
  🟩 Clang9             Pass: 100%/1   | Total:  4m 31s | Avg:  4m 31s | Max:  4m 31s
  🟩 Clang18            Pass: 100%/1   | Total:  4m 36s | Avg:  4m 36s | Max:  4m 36s
  🟩 GCC6               Pass: 100%/1   | Total:  4m 07s | Avg:  4m 07s | Max:  4m 07s
  🟩 GCC13              Pass: 100%/1   | Total:  4m 15s | Avg:  4m 15s | Max:  4m 15s
🟩 cxx_family
  🟩 Clang              Pass: 100%/2   | Total:  9m 07s | Avg:  4m 33s | Max:  4m 36s
  🟩 GCC                Pass: 100%/2   | Total:  8m 22s | Avg:  4m 11s | Max:  4m 15s
🟩 gpu
  🟩 v100               Pass: 100%/4   | Total: 17m 29s | Avg:  4m 22s | Max:  4m 36s
🟩 jobs
  🟩 Infra              Pass: 100%/4   | Total: 17m 29s | Avg:  4m 22s | Max:  4m 36s

🟩 pycuda: Pass: 100%/1 | Total: 14m 52s | Avg: 14m 52s | Max: 14m 52s

🟩 cpu
  🟩 amd64              Pass: 100%/1   | Total: 14m 52s | Avg: 14m 52s | Max: 14m 52s
🟩 ctk
  🟩 12.5               Pass: 100%/1   | Total: 14m 52s | Avg: 14m 52s | Max: 14m 52s
🟩 cudacxx
  🟩 nvcc12.5           Pass: 100%/1   | Total: 14m 52s | Avg: 14m 52s | Max: 14m 52s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/1   | Total: 14m 52s | Avg: 14m 52s | Max: 14m 52s
🟩 cxx
  🟩 GCC13              Pass: 100%/1   | Total: 14m 52s | Avg: 14m 52s | Max: 14m 52s
🟩 cxx_family
  🟩 GCC                Pass: 100%/1   | Total: 14m 52s | Avg: 14m 52s | Max: 14m 52s
🟩 gpu
  🟩 v100               Pass: 100%/1   | Total: 14m 52s | Avg: 14m 52s | Max: 14m 52s
🟩 jobs
  🟩 Test               Pass: 100%/1   | Total: 14m 52s | Avg: 14m 52s | Max: 14m 52s

👃 Inspect Changes

Modifications in project?

	Project
+/-	CCCL Infrastructure
	libcu++
	CUB
	Thrust
	CUDA Experimental
	pycuda
	CUDA C Core Library

Modifications in project or dependencies?

	Project
+/-	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	pycuda
+/-	CUDA C Core Library

🏃‍ Runner counts (total jobs: 368)

#	Runner
297	`linux-amd64-cpu16`
28	`linux-amd64-gpu-v100-latest-1`
28	`linux-arm64-cpu16`
15	`windows-amd64-cpu16`

…tor (not entire arrays).

rwgk · 2024-09-30T19:14:59Z

Hi @gevtushenko, I think I addressed what we discussed this morning, although I'm not sure: is there anything else you want me to add to this PR?

github-actions · 2024-09-30T20:05:59Z

🟩 CI finished in 1h 00m: Pass: 100%/368 | Total: 1d 21h | Avg: 7m 23s | Max: 42m 53s | Hits: 81%/25679

🟩 cub: Pass: 100%/104 | Total: 10h 47m | Avg: 6m 13s | Max: 31m 09s | Hits: 99%/2908

🟩 cpu
  🟩 amd64              Pass: 100%/96  | Total: 10h 13m | Avg:  6m 23s | Max: 31m 09s | Hits:  99%/2908  
  🟩 arm64              Pass: 100%/8   | Total: 34m 20s | Avg:  4m 17s | Max:  5m 25s
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  1h 07m | Avg:  4m 30s | Max: 15m 02s | Hits:  99%/727   
  🟩 11.8               Pass: 100%/3   | Total: 14m 09s | Avg:  4m 43s | Max:  4m 58s
  🟩 12.6               Pass: 100%/86  | Total:  9h 25m | Avg:  6m 34s | Max: 31m 09s | Hits:  99%/2181  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total:  7m 53s | Avg:  3m 56s | Max:  4m 15s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  1h 07m | Avg:  4m 30s | Max: 15m 02s | Hits:  99%/727   
  🟩 nvcc11.8           Pass: 100%/3   | Total: 14m 09s | Avg:  4m 43s | Max:  4m 58s
  🟩 nvcc12.6           Pass: 100%/84  | Total:  9h 17m | Avg:  6m 38s | Max: 31m 09s | Hits:  99%/2181  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  7m 53s | Avg:  3m 56s | Max:  4m 15s
  🟩 nvcc               Pass: 100%/102 | Total: 10h 39m | Avg:  6m 16s | Max: 31m 09s | Hits:  99%/2908  
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total: 26m 49s | Avg:  4m 28s | Max:  5m 15s
  🟩 Clang10            Pass: 100%/3   | Total: 15m 44s | Avg:  5m 14s | Max:  5m 33s
  🟩 Clang11            Pass: 100%/4   | Total: 18m 40s | Avg:  4m 40s | Max:  5m 00s
  🟩 Clang12            Pass: 100%/4   | Total: 18m 15s | Avg:  4m 33s | Max:  4m 45s
  🟩 Clang13            Pass: 100%/4   | Total: 19m 24s | Avg:  4m 51s | Max:  5m 08s
  🟩 Clang14            Pass: 100%/4   | Total: 18m 21s | Avg:  4m 35s | Max:  4m 59s
  🟩 Clang15            Pass: 100%/4   | Total: 18m 25s | Avg:  4m 36s | Max:  4m 49s
  🟩 Clang16            Pass: 100%/4   | Total: 18m 53s | Avg:  4m 43s | Max:  5m 02s
  🟩 Clang17            Pass: 100%/4   | Total: 19m 36s | Avg:  4m 54s | Max:  5m 05s
  🟩 Clang18            Pass: 100%/9   | Total:  1h 16m | Avg:  8m 28s | Max: 25m 41s
  🟩 GCC6               Pass: 100%/2   | Total:  6m 55s | Avg:  3m 27s | Max:  3m 31s
  🟩 GCC7               Pass: 100%/6   | Total: 23m 50s | Avg:  3m 58s | Max:  4m 34s
  🟩 GCC8               Pass: 100%/6   | Total: 25m 31s | Avg:  4m 15s | Max:  5m 01s
  🟩 GCC9               Pass: 100%/6   | Total: 25m 01s | Avg:  4m 10s | Max:  4m 32s
  🟩 GCC10              Pass: 100%/4   | Total: 18m 19s | Avg:  4m 34s | Max:  5m 04s
  🟩 GCC11              Pass: 100%/7   | Total: 32m 37s | Avg:  4m 39s | Max:  4m 59s
  🟩 GCC12              Pass: 100%/4   | Total: 18m 20s | Avg:  4m 35s | Max:  4m 41s
  🟩 GCC13              Pass: 100%/16  | Total:  2h 57m | Avg: 11m 05s | Max: 31m 09s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 15m 54s | Avg:  5m 18s | Max:  5m 25s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 15m 02s | Avg: 15m 02s | Max: 15m 02s | Hits:  99%/727   
  🟩 MSVC14.29          Pass: 100%/2   | Total: 24m 50s | Avg: 12m 25s | Max: 12m 33s | Hits:  99%/1454  
  🟩 MSVC14.39          Pass: 100%/1   | Total: 13m 33s | Avg: 13m 33s | Max: 13m 33s | Hits:  99%/727   
🟩 cxx_family
  🟩 Clang              Pass: 100%/46  | Total:  4h 10m | Avg:  5m 26s | Max: 25m 41s
  🟩 GCC                Pass: 100%/51  | Total:  5h 27m | Avg:  6m 25s | Max: 31m 09s
  🟩 Intel              Pass: 100%/3   | Total: 15m 54s | Avg:  5m 18s | Max:  5m 25s
  🟩 MSVC               Pass: 100%/4   | Total: 53m 25s | Avg: 13m 21s | Max: 15m 02s | Hits:  99%/2908  
🟩 gpu
  🟩 v100               Pass: 100%/104 | Total: 10h 47m | Avg:  6m 13s | Max: 31m 09s | Hits:  99%/2908  
🟩 jobs
  🟩 Build              Pass: 100%/96  | Total:  7h 44m | Avg:  4m 50s | Max: 15m 02s | Hits:  99%/2908  
  🟩 DeviceLaunch       Pass: 100%/1   | Total: 21m 38s | Avg: 21m 38s | Max: 21m 38s
  🟩 GraphCapture       Pass: 100%/1   | Total: 15m 53s | Avg: 15m 53s | Max: 15m 53s
  🟩 HostLaunch         Pass: 100%/3   | Total:  1h 13m | Avg: 24m 24s | Max: 31m 09s
  🟩 TestGPU            Pass: 100%/3   | Total:  1h 12m | Avg: 24m 01s | Max: 25m 41s
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 14m 09s | Avg:  4m 43s | Max:  4m 58s
  🟩 90a                Pass: 100%/4   | Total: 14m 20s | Avg:  3m 35s | Max:  3m 40s
🟩 std
  🟩 11                 Pass: 100%/28  | Total:  2h 37m | Avg:  5m 37s | Max: 24m 33s
  🟩 14                 Pass: 100%/27  | Total:  2h 17m | Avg:  5m 05s | Max: 15m 02s | Hits:  99%/1454  
  🟩 17                 Pass: 100%/26  | Total:  2h 10m | Avg:  5m 00s | Max: 12m 33s | Hits:  99%/727   
  🟩 20                 Pass: 100%/23  | Total:  3h 42m | Avg:  9m 40s | Max: 31m 09s | Hits:  99%/727

🟩 libcudacxx: Pass: 100%/104 | Total: 21h 08m | Avg: 12m 11s | Max: 42m 53s | Hits: 58%/11399

🟩 cpu
  🟩 amd64              Pass: 100%/96  | Total: 19h 52m | Avg: 12m 25s | Max: 42m 53s | Hits:  58%/11399 
  🟩 arm64              Pass: 100%/8   | Total:  1h 16m | Avg:  9m 30s | Max: 25m 42s
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  2h 32m | Avg: 10m 10s | Max: 34m 52s | Hits:  46%/2652  
  🟩 11.8               Pass: 100%/3   | Total: 51m 41s | Avg: 17m 13s | Max: 26m 39s
  🟩 12.6               Pass: 100%/86  | Total: 17h 44m | Avg: 12m 22s | Max: 42m 53s | Hits:  61%/8747  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total: 36m 04s | Avg: 18m 02s | Max: 18m 49s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  2h 32m | Avg: 10m 10s | Max: 34m 52s | Hits:  46%/2652  
  🟩 nvcc11.8           Pass: 100%/3   | Total: 51m 41s | Avg: 17m 13s | Max: 26m 39s
  🟩 nvcc12.6           Pass: 100%/84  | Total: 17h 08m | Avg: 12m 14s | Max: 42m 53s | Hits:  61%/8747  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 36m 04s | Avg: 18m 02s | Max: 18m 49s
  🟩 nvcc               Pass: 100%/102 | Total: 20h 32m | Avg: 12m 04s | Max: 42m 53s | Hits:  58%/11399 
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total: 50m 32s | Avg:  8m 25s | Max: 22m 08s
  🟩 Clang10            Pass: 100%/3   | Total:  1h 09m | Avg: 23m 15s | Max: 28m 32s
  🟩 Clang11            Pass: 100%/4   | Total: 22m 06s | Avg:  5m 31s | Max:  7m 40s
  🟩 Clang12            Pass: 100%/4   | Total: 46m 18s | Avg: 11m 34s | Max: 17m 19s
  🟩 Clang13            Pass: 100%/4   | Total: 45m 50s | Avg: 11m 27s | Max: 24m 54s
  🟩 Clang14            Pass: 100%/4   | Total: 33m 52s | Avg:  8m 28s | Max: 17m 36s
  🟩 Clang15            Pass: 100%/4   | Total: 32m 31s | Avg:  8m 07s | Max: 12m 55s
  🟩 Clang16            Pass: 100%/4   | Total: 38m 13s | Avg:  9m 33s | Max: 16m 46s
  🟩 Clang17            Pass: 100%/4   | Total: 35m 37s | Avg:  8m 54s | Max: 12m 02s
  🟩 Clang18            Pass: 100%/8   | Total:  1h 43m | Avg: 12m 55s | Max: 27m 56s
  🟩 GCC6               Pass: 100%/2   | Total:  7m 39s | Avg:  3m 49s | Max:  4m 55s
  🟩 GCC7               Pass: 100%/6   | Total:  1h 04m | Avg: 10m 47s | Max: 24m 14s
  🟩 GCC8               Pass: 100%/6   | Total: 48m 52s | Avg:  8m 08s | Max: 21m 56s
  🟩 GCC9               Pass: 100%/6   | Total:  1h 22m | Avg: 13m 40s | Max: 24m 57s
  🟩 GCC10              Pass: 100%/4   | Total: 35m 50s | Avg:  8m 57s | Max: 16m 18s
  🟩 GCC11              Pass: 100%/7   | Total:  1h 51m | Avg: 15m 55s | Max: 26m 39s
  🟩 GCC12              Pass: 100%/4   | Total: 45m 10s | Avg: 11m 17s | Max: 27m 16s
  🟩 GCC13              Pass: 100%/17  | Total:  3h 14m | Avg: 11m 25s | Max: 25m 42s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total:  1h 13m | Avg: 24m 29s | Max: 29m 10s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 34m 52s | Avg: 34m 52s | Max: 34m 52s | Hits:  46%/2652  
  🟩 MSVC14.29          Pass: 100%/2   | Total: 48m 58s | Avg: 24m 29s | Max: 34m 33s | Hits:  72%/5666  
  🟩 MSVC14.39          Pass: 100%/1   | Total: 42m 53s | Avg: 42m 53s | Max: 42m 53s | Hits:  41%/3081  
🟩 cxx_family
  🟩 Clang              Pass: 100%/45  | Total:  7h 58m | Avg: 10m 37s | Max: 28m 32s
  🟩 GCC                Pass: 100%/52  | Total:  9h 50m | Avg: 11m 20s | Max: 27m 16s
  🟩 Intel              Pass: 100%/3   | Total:  1h 13m | Avg: 24m 29s | Max: 29m 10s
  🟩 MSVC               Pass: 100%/4   | Total:  2h 06m | Avg: 31m 40s | Max: 42m 53s | Hits:  58%/11399 
🟩 gpu
  🟩 v100               Pass: 100%/104 | Total: 21h 08m | Avg: 12m 11s | Max: 42m 53s | Hits:  58%/11399 
🟩 jobs
  🟩 Build              Pass: 100%/96  | Total: 18h 46m | Avg: 11m 43s | Max: 42m 53s | Hits:  58%/11399 
  🟩 NVRTC              Pass: 100%/4   | Total:  1h 20m | Avg: 20m 12s | Max: 23m 41s
  🟩 Test               Pass: 100%/3   | Total: 59m 08s | Avg: 19m 42s | Max: 27m 56s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  2m 08s | Avg:  2m 08s | Max:  2m 08s
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 51m 41s | Avg: 17m 13s | Max: 26m 39s
  🟩 90a                Pass: 100%/4   | Total: 15m 09s | Avg:  3m 47s | Max:  4m 06s
🟩 std
  🟩 11                 Pass: 100%/28  | Total:  5h 12m | Avg: 11m 09s | Max: 22m 08s
  🟩 14                 Pass: 100%/28  | Total:  4h 47m | Avg: 10m 16s | Max: 34m 52s | Hits:  45%/5405  
  🟩 17                 Pass: 100%/27  | Total:  5h 41m | Avg: 12m 38s | Max: 29m 10s | Hits:  99%/2913  
  🟩 20                 Pass: 100%/20  | Total:  5h 24m | Avg: 16m 14s | Max: 42m 53s | Hits:  41%/3081

🟩 thrust: Pass: 100%/103 | Total: 10h 29m | Avg: 6m 06s | Max: 34m 33s | Hits: 99%/11150

🟩 cpu
  🟩 amd64              Pass: 100%/95  | Total:  9h 53m | Avg:  6m 15s | Max: 34m 33s | Hits:  99%/11150 
  🟩 arm64              Pass: 100%/8   | Total: 35m 19s | Avg:  4m 24s | Max:  4m 47s
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  1h 13m | Avg:  4m 54s | Max: 19m 05s | Hits:  99%/2230  
  🟩 11.8               Pass: 100%/3   | Total: 15m 28s | Avg:  5m 09s | Max:  5m 31s
  🟩 12.6               Pass: 100%/85  | Total:  9h 00m | Avg:  6m 21s | Max: 34m 33s | Hits:  99%/8920  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total:  9m 12s | Avg:  4m 36s | Max:  4m 39s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  1h 13m | Avg:  4m 54s | Max: 19m 05s | Hits:  99%/2230  
  🟩 nvcc11.8           Pass: 100%/3   | Total: 15m 28s | Avg:  5m 09s | Max:  5m 31s
  🟩 nvcc12.6           Pass: 100%/83  | Total:  8h 50m | Avg:  6m 23s | Max: 34m 33s | Hits:  99%/8920  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  9m 12s | Avg:  4m 36s | Max:  4m 39s
  🟩 nvcc               Pass: 100%/101 | Total: 10h 20m | Avg:  6m 08s | Max: 34m 33s | Hits:  99%/11150 
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total: 28m 46s | Avg:  4m 47s | Max:  5m 46s
  🟩 Clang10            Pass: 100%/3   | Total: 17m 15s | Avg:  5m 45s | Max:  6m 02s
  🟩 Clang11            Pass: 100%/4   | Total: 18m 43s | Avg:  4m 40s | Max:  4m 56s
  🟩 Clang12            Pass: 100%/4   | Total: 19m 39s | Avg:  4m 54s | Max:  5m 22s
  🟩 Clang13            Pass: 100%/4   | Total: 18m 58s | Avg:  4m 44s | Max:  4m 58s
  🟩 Clang14            Pass: 100%/4   | Total: 19m 12s | Avg:  4m 48s | Max:  5m 07s
  🟩 Clang15            Pass: 100%/4   | Total: 19m 16s | Avg:  4m 49s | Max:  5m 02s
  🟩 Clang16            Pass: 100%/4   | Total: 19m 41s | Avg:  4m 55s | Max:  5m 25s
  🟩 Clang17            Pass: 100%/4   | Total: 19m 40s | Avg:  4m 55s | Max:  5m 06s
  🟩 Clang18            Pass: 100%/9   | Total: 56m 42s | Avg:  6m 18s | Max: 17m 01s
  🟩 GCC6               Pass: 100%/2   | Total:  7m 51s | Avg:  3m 55s | Max:  4m 21s
  🟩 GCC7               Pass: 100%/6   | Total: 25m 11s | Avg:  4m 11s | Max:  4m 51s
  🟩 GCC8               Pass: 100%/6   | Total: 25m 32s | Avg:  4m 15s | Max:  4m 37s
  🟩 GCC9               Pass: 100%/6   | Total: 26m 24s | Avg:  4m 24s | Max:  5m 28s
  🟩 GCC10              Pass: 100%/4   | Total: 19m 00s | Avg:  4m 45s | Max:  4m 56s
  🟩 GCC11              Pass: 100%/7   | Total:  1h 04m | Avg:  9m 17s | Max: 34m 33s
  🟩 GCC12              Pass: 100%/4   | Total: 20m 30s | Avg:  5m 07s | Max:  5m 28s
  🟩 GCC13              Pass: 100%/14  | Total:  1h 27m | Avg:  6m 16s | Max: 14m 14s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 18m 45s | Avg:  6m 15s | Max:  6m 56s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 19m 05s | Avg: 19m 05s | Max: 19m 05s | Hits:  99%/2230  
  🟩 MSVC14.29          Pass: 100%/2   | Total: 35m 44s | Avg: 17m 52s | Max: 18m 35s | Hits:  99%/4460  
  🟩 MSVC14.39          Pass: 100%/2   | Total: 40m 28s | Avg: 20m 14s | Max: 22m 26s | Hits:  99%/4460  
🟩 cxx_family
  🟩 Clang              Pass: 100%/46  | Total:  3h 57m | Avg:  5m 10s | Max: 17m 01s
  🟩 GCC                Pass: 100%/49  | Total:  4h 37m | Avg:  5m 39s | Max: 34m 33s
  🟩 Intel              Pass: 100%/3   | Total: 18m 45s | Avg:  6m 15s | Max:  6m 56s
  🟩 MSVC               Pass: 100%/5   | Total:  1h 35m | Avg: 19m 03s | Max: 22m 26s | Hits:  99%/11150 
🟩 gpu
  🟩 v100               Pass: 100%/103 | Total: 10h 29m | Avg:  6m 06s | Max: 34m 33s | Hits:  99%/11150 
🟩 jobs
  🟩 Build              Pass: 100%/96  | Total:  8h 59m | Avg:  5m 36s | Max: 34m 33s | Hits:  99%/8920  
  🟩 TestCPU            Pass: 100%/4   | Total: 45m 50s | Avg: 11m 27s | Max: 22m 26s | Hits:  99%/2230  
  🟩 TestGPU            Pass: 100%/3   | Total: 44m 13s | Avg: 14m 44s | Max: 17m 01s
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 15m 28s | Avg:  5m 09s | Max:  5m 31s
  🟩 90a                Pass: 100%/4   | Total: 16m 42s | Avg:  4m 10s | Max:  4m 26s
🟩 std
  🟩 11                 Pass: 100%/28  | Total:  2h 16m | Avg:  4m 53s | Max: 14m 14s
  🟩 14                 Pass: 100%/27  | Total:  3h 05m | Avg:  6m 51s | Max: 34m 33s | Hits:  99%/4460  
  🟩 17                 Pass: 100%/26  | Total:  2h 22m | Avg:  5m 28s | Max: 17m 09s | Hits:  99%/2230  
  🟩 20                 Pass: 100%/22  | Total:  2h 44m | Avg:  7m 29s | Max: 22m 26s | Hits:  99%/4460

🟩 cudax: Pass: 100%/52 | Total: 2h 19m | Avg: 2m 41s | Max: 10m 35s | Hits: 90%/222

🟩 cpu
  🟩 amd64              Pass: 100%/48  | Total:  2h 11m | Avg:  2m 44s | Max: 10m 35s | Hits:  90%/222   
  🟩 arm64              Pass: 100%/4   | Total:  7m 50s | Avg:  1m 57s | Max:  2m 07s
🟩 ctk
  🟩 12.0               Pass: 100%/19  | Total: 52m 15s | Avg:  2m 45s | Max: 10m 01s | Hits:  90%/111   
  🟩 12.6               Pass: 100%/33  | Total:  1h 27m | Avg:  2m 38s | Max: 10m 35s | Hits:  90%/111   
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/19  | Total: 52m 15s | Avg:  2m 45s | Max: 10m 01s | Hits:  90%/111   
  🟩 nvcc12.6           Pass: 100%/33  | Total:  1h 27m | Avg:  2m 38s | Max: 10m 35s | Hits:  90%/111   
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/52  | Total:  2h 19m | Avg:  2m 41s | Max: 10m 35s | Hits:  90%/222   
🟩 cxx
  🟩 Clang9             Pass: 100%/2   | Total:  4m 52s | Avg:  2m 26s | Max:  2m 38s
  🟩 Clang10            Pass: 100%/2   | Total:  4m 32s | Avg:  2m 16s | Max:  2m 18s
  🟩 Clang11            Pass: 100%/4   | Total:  9m 01s | Avg:  2m 15s | Max:  2m 26s
  🟩 Clang12            Pass: 100%/4   | Total:  9m 19s | Avg:  2m 19s | Max:  2m 34s
  🟩 Clang13            Pass: 100%/4   | Total:  9m 04s | Avg:  2m 16s | Max:  2m 21s
  🟩 Clang14            Pass: 100%/4   | Total: 10m 45s | Avg:  2m 41s | Max:  3m 50s
  🟩 Clang15            Pass: 100%/2   | Total:  4m 35s | Avg:  2m 17s | Max:  2m 19s
  🟩 Clang16            Pass: 100%/4   | Total:  8m 47s | Avg:  2m 11s | Max:  2m 21s
  🟩 Clang17            Pass: 100%/2   | Total:  4m 41s | Avg:  2m 20s | Max:  2m 29s
  🟩 Clang18            Pass: 100%/2   | Total:  6m 27s | Avg:  3m 13s | Max:  4m 11s
  🟩 GCC9               Pass: 100%/2   | Total:  4m 08s | Avg:  2m 04s | Max:  2m 10s
  🟩 GCC10              Pass: 100%/4   | Total:  8m 33s | Avg:  2m 08s | Max:  2m 14s
  🟩 GCC11              Pass: 100%/4   | Total:  8m 28s | Avg:  2m 07s | Max:  2m 13s
  🟩 GCC12              Pass: 100%/7   | Total: 20m 08s | Avg:  2m 52s | Max:  3m 57s
  🟩 GCC13              Pass: 100%/3   | Total:  5m 41s | Avg:  1m 53s | Max:  2m 02s
  🟩 MSVC14.36          Pass: 100%/1   | Total: 10m 01s | Avg: 10m 01s | Max: 10m 01s | Hits:  90%/111   
  🟩 MSVC14.39          Pass: 100%/1   | Total: 10m 35s | Avg: 10m 35s | Max: 10m 35s | Hits:  90%/111   
🟩 cxx_family
  🟩 Clang              Pass: 100%/30  | Total:  1h 12m | Avg:  2m 24s | Max:  4m 11s
  🟩 GCC                Pass: 100%/20  | Total: 46m 58s | Avg:  2m 20s | Max:  3m 57s
  🟩 MSVC               Pass: 100%/2   | Total: 20m 36s | Avg: 10m 18s | Max: 10m 35s | Hits:  90%/222   
🟩 gpu
  🟩 v100               Pass: 100%/52  | Total:  2h 19m | Avg:  2m 41s | Max: 10m 35s | Hits:  90%/222   
🟩 jobs
  🟩 Build              Pass: 100%/47  | Total:  2h 00m | Avg:  2m 33s | Max: 10m 35s | Hits:  90%/222   
  🟩 Test               Pass: 100%/5   | Total: 19m 35s | Avg:  3m 55s | Max:  4m 11s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total:  1m 57s | Avg:  1m 57s | Max:  1m 57s
  🟩 90a                Pass: 100%/1   | Total:  2m 02s | Avg:  2m 02s | Max:  2m 02s
🟩 std
  🟩 17                 Pass: 100%/28  | Total:  1h 04m | Avg:  2m 18s | Max:  3m 50s
  🟩 20                 Pass: 100%/24  | Total:  1h 14m | Avg:  3m 06s | Max: 10m 35s | Hits:  90%/222

🟩 cccl: Pass: 100%/4 | Total: 16m 50s | Avg: 4m 12s | Max: 4m 52s

🟩 cpu
  🟩 amd64              Pass: 100%/4   | Total: 16m 50s | Avg:  4m 12s | Max:  4m 52s
🟩 ctk
  🟩 11.1               Pass: 100%/2   | Total:  7m 27s | Avg:  3m 43s | Max:  4m 00s
  🟩 12.6               Pass: 100%/2   | Total:  9m 23s | Avg:  4m 41s | Max:  4m 52s
🟩 cudacxx
  🟩 nvcc11.1           Pass: 100%/2   | Total:  7m 27s | Avg:  3m 43s | Max:  4m 00s
  🟩 nvcc12.6           Pass: 100%/2   | Total:  9m 23s | Avg:  4m 41s | Max:  4m 52s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/4   | Total: 16m 50s | Avg:  4m 12s | Max:  4m 52s
🟩 cxx
  🟩 Clang9             Pass: 100%/1   | Total:  4m 00s | Avg:  4m 00s | Max:  4m 00s
  🟩 Clang18            Pass: 100%/1   | Total:  4m 52s | Avg:  4m 52s | Max:  4m 52s
  🟩 GCC6               Pass: 100%/1   | Total:  3m 27s | Avg:  3m 27s | Max:  3m 27s
  🟩 GCC13              Pass: 100%/1   | Total:  4m 31s | Avg:  4m 31s | Max:  4m 31s
🟩 cxx_family
  🟩 Clang              Pass: 100%/2   | Total:  8m 52s | Avg:  4m 26s | Max:  4m 52s
  🟩 GCC                Pass: 100%/2   | Total:  7m 58s | Avg:  3m 59s | Max:  4m 31s
🟩 gpu
  🟩 v100               Pass: 100%/4   | Total: 16m 50s | Avg:  4m 12s | Max:  4m 52s
🟩 jobs
  🟩 Infra              Pass: 100%/4   | Total: 16m 50s | Avg:  4m 12s | Max:  4m 52s

🟩 pycuda: Pass: 100%/1 | Total: 15m 39s | Avg: 15m 39s | Max: 15m 39s

🟩 cpu
  🟩 amd64              Pass: 100%/1   | Total: 15m 39s | Avg: 15m 39s | Max: 15m 39s
🟩 ctk
  🟩 12.5               Pass: 100%/1   | Total: 15m 39s | Avg: 15m 39s | Max: 15m 39s
🟩 cudacxx
  🟩 nvcc12.5           Pass: 100%/1   | Total: 15m 39s | Avg: 15m 39s | Max: 15m 39s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/1   | Total: 15m 39s | Avg: 15m 39s | Max: 15m 39s
🟩 cxx
  🟩 GCC13              Pass: 100%/1   | Total: 15m 39s | Avg: 15m 39s | Max: 15m 39s
🟩 cxx_family
  🟩 GCC                Pass: 100%/1   | Total: 15m 39s | Avg: 15m 39s | Max: 15m 39s
🟩 gpu
  🟩 v100               Pass: 100%/1   | Total: 15m 39s | Avg: 15m 39s | Max: 15m 39s
🟩 jobs
  🟩 Test               Pass: 100%/1   | Total: 15m 39s | Avg: 15m 39s | Max: 15m 39s

👃 Inspect Changes

Modifications in project?

	Project
+/-	CCCL Infrastructure
	libcu++
	CUB
	Thrust
	CUDA Experimental
	pycuda
	CUDA C Core Library

Modifications in project or dependencies?

	Project
+/-	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	pycuda
+/-	CUDA C Core Library

🏃‍ Runner counts (total jobs: 368)

#	Runner
297	`linux-amd64-cpu16`
28	`linux-amd64-gpu-v100-latest-1`
28	`linux-arm64-cpu16`
15	`windows-amd64-cpu16`

gevtushenko · 2024-10-02T22:20:45Z

python/cuda_parallel/tests/test_reduce_api.py

+# example-begin reduce-min
+def min_op(a, b):
+    return a if a < b else b
+# example-end reduce-min


important: the test_*_api files are used for documentation purposes. They illustrate usage of API. Sphinx essentially copy-pastes code between the example-begin reduce-min and example-begin reduce-min labels. Here's an example how it looked like. This cange makes it so that our reference API documentation only contains min_op definition. Let's revert this change.

Done. Thanks for the explanation!

I only kept some minor changes.

gevtushenko · 2024-10-02T22:22:35Z

python/cuda_parallel/tests/test_reduce_api.py

+def test_device_reduce_dtype_mismatch():
+    dtypes = [numpy.int32, numpy.int64]
+    h_inits = [numpy.array([], dt) for dt in dtypes]
+    h_inputs = [numpy.array([], dt) for dt in dtypes]
+    d_outputs = [cuda.device_array(1, dt) for dt in dtypes]
+    d_inputs = [cuda.to_device(h_inp) for h_inp in h_inputs]
+
+    reduce_into = cudax.reduce_into(d_inputs[0], d_outputs[0], min_op, h_inits[0])
+
+    for ix in range(3):
+        with pytest.raises(TypeError, match=r"dtype mismatch: __init__=int32, __call__=int64"):
+          reduce_into(None, d_inputs[int(ix == 0)], d_outputs[int(ix == 1)], h_inits[int(ix == 2)])


important: this file's purpose is testing code snippets in our docs. Let's put functionality tests into test_reduce.py.

leofang · 2024-10-02T22:37:38Z

Interesting, so this is akin to the builder/executor distinction in nvmath-python's stateful APIs, where a similar check also exists:
https://github.com/NVIDIA/nvmath-python/blob/7c485842d0f3300e03ec780056936503913910fe/nvmath/linalg/advanced/matmulmod.py#L1142
We might want to discuss soon how much alignment we want to have with nvmath-python.

…phinx documentation. Also fix existing typo.

… test_reduce.py

rwgk · 2024-10-03T23:11:13Z

I was looking for some way to assert that what's passed to __call__ is POINTER-vs-ITERATOR compatible with what was passed to __init__, but it seems to me that d_in, d_out are assumed to have POINTER type without any validation:

cccl/python/cuda_parallel/cuda/parallel/experimental/__init__.py

Lines 101 to 110 in 1cfe171

    
           def _device_array_to_pointer(array): 
        
               dtype = array.dtype 
        
               info = _type_to_info(dtype) 
        
               return _CCCLIterator(1, 1, _CCCLIteratorKindEnum.POINTER, _CCCLOp(), _CCCLOp(), info, array.device_ctypes_pointer.value) 
        
           def _host_array_to_value(array): 
        
               dtype = array.dtype 
        
               info = _type_to_info(dtype) 
        
               return _CCCLValue(info, array.ctypes.data_as(ctypes.c_void_p))

_CCCLIteratorKindEnum.POINTER is hard-wired there in line 104.

I figure I have to get into that code when I make _Reduce work for iterators. So I just left a TODO for now.

github-actions · 2024-10-04T00:23:00Z

🟩 CI finished in 1h 13m: Pass: 100%/370 | Total: 1d 15h | Avg: 6m 19s | Max: 35m 40s | Hits: 99%/25712

🟩 cub: Pass: 100%/104 | Total: 10h 46m | Avg: 6m 12s | Max: 30m 15s | Hits: 99%/2908

🟩 cpu
  🟩 amd64              Pass: 100%/96  | Total: 10h 13m | Avg:  6m 23s | Max: 30m 15s | Hits:  99%/2908  
  🟩 arm64              Pass: 100%/8   | Total: 32m 35s | Avg:  4m 04s | Max:  4m 15s
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  1h 09m | Avg:  4m 37s | Max: 15m 32s | Hits:  99%/727   
  🟩 11.8               Pass: 100%/3   | Total: 14m 00s | Avg:  4m 40s | Max:  4m 42s
  🟩 12.6               Pass: 100%/86  | Total:  9h 22m | Avg:  6m 32s | Max: 30m 15s | Hits:  99%/2181  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total:  7m 22s | Avg:  3m 41s | Max:  3m 48s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  1h 09m | Avg:  4m 37s | Max: 15m 32s | Hits:  99%/727   
  🟩 nvcc11.8           Pass: 100%/3   | Total: 14m 00s | Avg:  4m 40s | Max:  4m 42s
  🟩 nvcc12.6           Pass: 100%/84  | Total:  9h 15m | Avg:  6m 36s | Max: 30m 15s | Hits:  99%/2181  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  7m 22s | Avg:  3m 41s | Max:  3m 48s
  🟩 nvcc               Pass: 100%/102 | Total: 10h 38m | Avg:  6m 15s | Max: 30m 15s | Hits:  99%/2908  
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total: 28m 14s | Avg:  4m 42s | Max:  5m 30s
  🟩 Clang10            Pass: 100%/3   | Total: 16m 06s | Avg:  5m 22s | Max:  5m 46s
  🟩 Clang11            Pass: 100%/4   | Total: 18m 02s | Avg:  4m 30s | Max:  4m 51s
  🟩 Clang12            Pass: 100%/4   | Total: 18m 32s | Avg:  4m 38s | Max:  4m 54s
  🟩 Clang13            Pass: 100%/4   | Total: 18m 48s | Avg:  4m 42s | Max:  4m 54s
  🟩 Clang14            Pass: 100%/4   | Total: 20m 04s | Avg:  5m 01s | Max:  5m 30s
  🟩 Clang15            Pass: 100%/4   | Total: 19m 21s | Avg:  4m 50s | Max:  5m 17s
  🟩 Clang16            Pass: 100%/4   | Total: 17m 56s | Avg:  4m 29s | Max:  4m 37s
  🟩 Clang17            Pass: 100%/4   | Total: 18m 14s | Avg:  4m 33s | Max:  4m 40s
  🟩 Clang18            Pass: 100%/9   | Total:  1h 16m | Avg:  8m 31s | Max: 30m 15s
  🟩 GCC6               Pass: 100%/2   | Total:  7m 37s | Avg:  3m 48s | Max:  4m 06s
  🟩 GCC7               Pass: 100%/6   | Total: 24m 27s | Avg:  4m 04s | Max:  4m 33s
  🟩 GCC8               Pass: 100%/6   | Total: 24m 12s | Avg:  4m 02s | Max:  4m 32s
  🟩 GCC9               Pass: 100%/6   | Total: 25m 17s | Avg:  4m 12s | Max:  4m 52s
  🟩 GCC10              Pass: 100%/4   | Total: 18m 40s | Avg:  4m 40s | Max:  5m 00s
  🟩 GCC11              Pass: 100%/7   | Total: 32m 09s | Avg:  4m 35s | Max:  4m 46s
  🟩 GCC12              Pass: 100%/4   | Total: 19m 51s | Avg:  4m 57s | Max:  5m 17s
  🟩 GCC13              Pass: 100%/16  | Total:  2h 49m | Avg: 10m 34s | Max: 25m 26s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 16m 16s | Avg:  5m 25s | Max:  5m 39s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 15m 32s | Avg: 15m 32s | Max: 15m 32s | Hits:  99%/727   
  🟩 MSVC14.29          Pass: 100%/2   | Total: 26m 16s | Avg: 13m 08s | Max: 13m 26s | Hits:  99%/1454  
  🟩 MSVC14.39          Pass: 100%/1   | Total: 14m 47s | Avg: 14m 47s | Max: 14m 47s | Hits:  99%/727   
🟩 cxx_family
  🟩 Clang              Pass: 100%/46  | Total:  4h 12m | Avg:  5m 28s | Max: 30m 15s
  🟩 GCC                Pass: 100%/51  | Total:  5h 21m | Avg:  6m 18s | Max: 25m 26s
  🟩 Intel              Pass: 100%/3   | Total: 16m 16s | Avg:  5m 25s | Max:  5m 39s
  🟩 MSVC               Pass: 100%/4   | Total: 56m 35s | Avg: 14m 08s | Max: 15m 32s | Hits:  99%/2908  
🟩 gpu
  🟩 v100               Pass: 100%/104 | Total: 10h 46m | Avg:  6m 12s | Max: 30m 15s | Hits:  99%/2908  
🟩 jobs
  🟩 Build              Pass: 100%/96  | Total:  7h 49m | Avg:  4m 53s | Max: 15m 32s | Hits:  99%/2908  
  🟩 DeviceLaunch       Pass: 100%/1   | Total: 18m 36s | Avg: 18m 36s | Max: 18m 36s
  🟩 GraphCapture       Pass: 100%/1   | Total: 20m 45s | Avg: 20m 45s | Max: 20m 45s
  🟩 HostLaunch         Pass: 100%/3   | Total: 56m 28s | Avg: 18m 49s | Max: 19m 50s
  🟩 TestGPU            Pass: 100%/3   | Total:  1h 20m | Avg: 26m 55s | Max: 30m 15s
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 14m 00s | Avg:  4m 40s | Max:  4m 42s
  🟩 90a                Pass: 100%/4   | Total: 14m 42s | Avg:  3m 40s | Max:  3m 51s
🟩 std
  🟩 11                 Pass: 100%/28  | Total:  2h 38m | Avg:  5m 39s | Max: 25m 05s
  🟩 14                 Pass: 100%/27  | Total:  2h 20m | Avg:  5m 13s | Max: 15m 32s | Hits:  99%/1454  
  🟩 17                 Pass: 100%/26  | Total:  2h 06m | Avg:  4m 52s | Max: 13m 26s | Hits:  99%/727   
  🟩 20                 Pass: 100%/23  | Total:  3h 40m | Avg:  9m 34s | Max: 30m 15s | Hits:  99%/727

🟩 libcudacxx: Pass: 100%/104 | Total: 14h 18m | Avg: 8m 15s | Max: 26m 37s | Hits: 99%/11438

🟩 cpu
  🟩 amd64              Pass: 100%/96  | Total: 13h 50m | Avg:  8m 38s | Max: 26m 37s | Hits:  99%/11438 
  🟩 arm64              Pass: 100%/8   | Total: 27m 48s | Avg:  3m 28s | Max:  3m 46s
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  1h 08m | Avg:  4m 32s | Max: 18m 41s | Hits:  99%/2661  
  🟩 11.8               Pass: 100%/3   | Total: 39m 49s | Avg: 13m 16s | Max: 19m 29s
  🟩 12.6               Pass: 100%/86  | Total: 12h 30m | Avg:  8m 43s | Max: 26m 37s | Hits:  99%/8777  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total: 35m 25s | Avg: 17m 42s | Max: 18m 34s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  1h 08m | Avg:  4m 32s | Max: 18m 41s | Hits:  99%/2661  
  🟩 nvcc11.8           Pass: 100%/3   | Total: 39m 49s | Avg: 13m 16s | Max: 19m 29s
  🟩 nvcc12.6           Pass: 100%/84  | Total: 11h 54m | Avg:  8m 30s | Max: 26m 37s | Hits:  99%/8777  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 35m 25s | Avg: 17m 42s | Max: 18m 34s
  🟩 nvcc               Pass: 100%/102 | Total: 13h 42m | Avg:  8m 03s | Max: 26m 37s | Hits:  99%/11438 
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total: 43m 54s | Avg:  7m 19s | Max: 24m 46s
  🟩 Clang10            Pass: 100%/3   | Total: 35m 40s | Avg: 11m 53s | Max: 25m 19s
  🟩 Clang11            Pass: 100%/4   | Total: 37m 28s | Avg:  9m 22s | Max: 24m 39s
  🟩 Clang12            Pass: 100%/4   | Total: 16m 29s | Avg:  4m 07s | Max:  4m 36s
  🟩 Clang13            Pass: 100%/4   | Total: 53m 24s | Avg: 13m 21s | Max: 25m 48s
  🟩 Clang14            Pass: 100%/4   | Total: 16m 29s | Avg:  4m 07s | Max:  4m 28s
  🟩 Clang15            Pass: 100%/4   | Total: 35m 02s | Avg:  8m 45s | Max: 21m 47s
  🟩 Clang16            Pass: 100%/4   | Total: 32m 40s | Avg:  8m 10s | Max: 19m 51s
  🟩 Clang17            Pass: 100%/4   | Total: 22m 45s | Avg:  5m 41s | Max:  9m 43s
  🟩 Clang18            Pass: 100%/8   | Total:  1h 20m | Avg: 10m 00s | Max: 25m 31s
  🟩 GCC6               Pass: 100%/2   | Total:  6m 09s | Avg:  3m 04s | Max:  3m 27s
  🟩 GCC7               Pass: 100%/6   | Total: 31m 00s | Avg:  5m 10s | Max: 14m 58s
  🟩 GCC8               Pass: 100%/6   | Total: 33m 45s | Avg:  5m 37s | Max: 11m 15s
  🟩 GCC9               Pass: 100%/6   | Total: 20m 51s | Avg:  3m 28s | Max:  4m 14s
  🟩 GCC10              Pass: 100%/4   | Total: 28m 25s | Avg:  7m 06s | Max: 17m 16s
  🟩 GCC11              Pass: 100%/7   | Total:  1h 13m | Avg: 10m 33s | Max: 19m 29s
  🟩 GCC12              Pass: 100%/4   | Total: 21m 12s | Avg:  5m 18s | Max:  9m 24s
  🟩 GCC13              Pass: 100%/17  | Total:  3h 00m | Avg: 10m 36s | Max: 26m 37s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 22m 22s | Avg:  7m 27s | Max: 11m 22s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 18m 41s | Avg: 18m 41s | Max: 18m 41s | Hits:  99%/2661  
  🟩 MSVC14.29          Pass: 100%/2   | Total: 31m 23s | Avg: 15m 41s | Max: 16m 11s | Hits:  99%/5686  
  🟩 MSVC14.39          Pass: 100%/1   | Total: 16m 06s | Avg: 16m 06s | Max: 16m 06s | Hits:  99%/3091  
🟩 cxx_family
  🟩 Clang              Pass: 100%/45  | Total:  6h 13m | Avg:  8m 18s | Max: 25m 48s
  🟩 GCC                Pass: 100%/52  | Total:  6h 35m | Avg:  7m 36s | Max: 26m 37s
  🟩 Intel              Pass: 100%/3   | Total: 22m 22s | Avg:  7m 27s | Max: 11m 22s
  🟩 MSVC               Pass: 100%/4   | Total:  1h 06m | Avg: 16m 32s | Max: 18m 41s | Hits:  99%/11438 
🟩 gpu
  🟩 v100               Pass: 100%/104 | Total: 14h 18m | Avg:  8m 15s | Max: 26m 37s | Hits:  99%/11438 
🟩 jobs
  🟩 Build              Pass: 100%/96  | Total: 11h 28m | Avg:  7m 10s | Max: 25m 48s | Hits:  99%/11438 
  🟩 NVRTC              Pass: 100%/4   | Total:  1h 39m | Avg: 24m 47s | Max: 26m 37s
  🟩 Test               Pass: 100%/3   | Total:  1h 08m | Avg: 22m 44s | Max: 25m 31s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  2m 11s | Avg:  2m 11s | Max:  2m 11s
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 39m 49s | Avg: 13m 16s | Max: 19m 29s
  🟩 90a                Pass: 100%/4   | Total: 15m 29s | Avg:  3m 52s | Max:  4m 12s
🟩 std
  🟩 11                 Pass: 100%/28  | Total:  2h 59m | Avg:  6m 24s | Max: 25m 37s
  🟩 14                 Pass: 100%/28  | Total:  4h 18m | Avg:  9m 13s | Max: 25m 19s | Hits:  99%/5424  
  🟩 17                 Pass: 100%/27  | Total:  3h 40m | Avg:  8m 11s | Max: 26m 37s | Hits:  99%/2923  
  🟩 20                 Pass: 100%/20  | Total:  3h 17m | Avg:  9m 52s | Max: 25m 31s | Hits:  99%/3091

🟩 thrust: Pass: 100%/103 | Total: 10h 53m | Avg: 6m 20s | Max: 35m 40s | Hits: 99%/11150

🟩 cpu
  🟩 amd64              Pass: 100%/95  | Total: 10h 18m | Avg:  6m 30s | Max: 35m 40s | Hits:  99%/11150 
  🟩 arm64              Pass: 100%/8   | Total: 35m 03s | Avg:  4m 22s | Max:  4m 55s
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  1h 16m | Avg:  5m 06s | Max: 20m 03s | Hits:  99%/2230  
  🟩 11.8               Pass: 100%/3   | Total: 14m 50s | Avg:  4m 56s | Max:  5m 33s
  🟩 12.6               Pass: 100%/85  | Total:  9h 22m | Avg:  6m 37s | Max: 35m 40s | Hits:  99%/8920  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total:  9m 22s | Avg:  4m 41s | Max:  4m 43s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  1h 16m | Avg:  5m 06s | Max: 20m 03s | Hits:  99%/2230  
  🟩 nvcc11.8           Pass: 100%/3   | Total: 14m 50s | Avg:  4m 56s | Max:  5m 33s
  🟩 nvcc12.6           Pass: 100%/83  | Total:  9h 13m | Avg:  6m 39s | Max: 35m 40s | Hits:  99%/8920  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  9m 22s | Avg:  4m 41s | Max:  4m 43s
  🟩 nvcc               Pass: 100%/101 | Total: 10h 44m | Avg:  6m 22s | Max: 35m 40s | Hits:  99%/11150 
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total: 30m 25s | Avg:  5m 04s | Max:  6m 16s
  🟩 Clang10            Pass: 100%/3   | Total: 18m 18s | Avg:  6m 06s | Max:  6m 07s
  🟩 Clang11            Pass: 100%/4   | Total: 19m 22s | Avg:  4m 50s | Max:  5m 01s
  🟩 Clang12            Pass: 100%/4   | Total: 18m 52s | Avg:  4m 43s | Max:  4m 53s
  🟩 Clang13            Pass: 100%/4   | Total: 19m 36s | Avg:  4m 54s | Max:  5m 08s
  🟩 Clang14            Pass: 100%/4   | Total: 18m 54s | Avg:  4m 43s | Max:  4m 59s
  🟩 Clang15            Pass: 100%/4   | Total: 20m 24s | Avg:  5m 06s | Max:  5m 33s
  🟩 Clang16            Pass: 100%/4   | Total: 20m 14s | Avg:  5m 03s | Max:  5m 26s
  🟩 Clang17            Pass: 100%/4   | Total: 18m 59s | Avg:  4m 44s | Max:  4m 55s
  🟩 Clang18            Pass: 100%/9   | Total:  1h 06m | Avg:  7m 26s | Max: 27m 25s
  🟩 GCC6               Pass: 100%/2   | Total:  7m 47s | Avg:  3m 53s | Max:  4m 14s
  🟩 GCC7               Pass: 100%/6   | Total: 25m 00s | Avg:  4m 10s | Max:  4m 41s
  🟩 GCC8               Pass: 100%/6   | Total: 26m 15s | Avg:  4m 22s | Max:  4m 54s
  🟩 GCC9               Pass: 100%/6   | Total: 27m 03s | Avg:  4m 30s | Max:  5m 19s
  🟩 GCC10              Pass: 100%/4   | Total: 19m 27s | Avg:  4m 51s | Max:  5m 16s
  🟩 GCC11              Pass: 100%/7   | Total: 34m 16s | Avg:  4m 53s | Max:  5m 33s
  🟩 GCC12              Pass: 100%/4   | Total: 20m 55s | Avg:  5m 13s | Max:  5m 20s
  🟩 GCC13              Pass: 100%/14  | Total:  2h 01m | Avg:  8m 41s | Max: 35m 40s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 18m 25s | Avg:  6m 08s | Max:  6m 52s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 20m 03s | Avg: 20m 03s | Max: 20m 03s | Hits:  99%/2230  
  🟩 MSVC14.29          Pass: 100%/2   | Total: 35m 24s | Avg: 17m 42s | Max: 18m 30s | Hits:  99%/4460  
  🟩 MSVC14.39          Pass: 100%/2   | Total: 45m 40s | Avg: 22m 50s | Max: 26m 33s | Hits:  99%/4460  
🟩 cxx_family
  🟩 Clang              Pass: 100%/46  | Total:  4h 12m | Avg:  5m 28s | Max: 27m 25s
  🟩 GCC                Pass: 100%/49  | Total:  4h 42m | Avg:  5m 45s | Max: 35m 40s
  🟩 Intel              Pass: 100%/3   | Total: 18m 25s | Avg:  6m 08s | Max:  6m 52s
  🟩 MSVC               Pass: 100%/5   | Total:  1h 41m | Avg: 20m 13s | Max: 26m 33s | Hits:  99%/11150 
🟩 gpu
  🟩 v100               Pass: 100%/103 | Total: 10h 53m | Avg:  6m 20s | Max: 35m 40s | Hits:  99%/11150 
🟩 jobs
  🟩 Build              Pass: 100%/96  | Total:  8h 35m | Avg:  5m 22s | Max: 20m 03s | Hits:  99%/8920  
  🟩 TestCPU            Pass: 100%/4   | Total:  1h 17m | Avg: 19m 28s | Max: 35m 40s | Hits:  99%/2230  
  🟩 TestGPU            Pass: 100%/3   | Total:  1h 00m | Avg: 20m 13s | Max: 27m 25s
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 14m 50s | Avg:  4m 56s | Max:  5m 33s
  🟩 90a                Pass: 100%/4   | Total: 16m 31s | Avg:  4m 07s | Max:  4m 29s
🟩 std
  🟩 11                 Pass: 100%/28  | Total:  2h 52m | Avg:  6m 09s | Max: 35m 40s
  🟩 14                 Pass: 100%/27  | Total:  2h 36m | Avg:  5m 47s | Max: 20m 03s | Hits:  99%/4460  
  🟩 17                 Pass: 100%/26  | Total:  2h 25m | Avg:  5m 34s | Max: 18m 30s | Hits:  99%/2230  
  🟩 20                 Pass: 100%/22  | Total:  3h 00m | Avg:  8m 11s | Max: 27m 25s | Hits:  99%/4460

🟩 cudax: Pass: 100%/52 | Total: 2h 22m | Avg: 2m 44s | Max: 10m 11s | Hits: 91%/216

🟩 cpu
  🟩 amd64              Pass: 100%/48  | Total:  2h 15m | Avg:  2m 48s | Max: 10m 11s | Hits:  91%/216   
  🟩 arm64              Pass: 100%/4   | Total:  7m 12s | Avg:  1m 48s | Max:  1m 59s
🟩 ctk
  🟩 12.0               Pass: 100%/19  | Total: 54m 14s | Avg:  2m 51s | Max: 10m 11s | Hits:  91%/108   
  🟩 12.6               Pass: 100%/33  | Total:  1h 27m | Avg:  2m 39s | Max:  9m 33s | Hits:  91%/108   
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/19  | Total: 54m 14s | Avg:  2m 51s | Max: 10m 11s | Hits:  91%/108   
  🟩 nvcc12.6           Pass: 100%/33  | Total:  1h 27m | Avg:  2m 39s | Max:  9m 33s | Hits:  91%/108   
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/52  | Total:  2h 22m | Avg:  2m 44s | Max: 10m 11s | Hits:  91%/216   
🟩 cxx
  🟩 Clang9             Pass: 100%/2   | Total:  4m 59s | Avg:  2m 29s | Max:  2m 35s
  🟩 Clang10            Pass: 100%/2   | Total:  4m 36s | Avg:  2m 18s | Max:  2m 32s
  🟩 Clang11            Pass: 100%/4   | Total:  8m 59s | Avg:  2m 14s | Max:  2m 22s
  🟩 Clang12            Pass: 100%/4   | Total:  9m 12s | Avg:  2m 18s | Max:  2m 30s
  🟩 Clang13            Pass: 100%/4   | Total:  9m 48s | Avg:  2m 27s | Max:  2m 36s
  🟩 Clang14            Pass: 100%/4   | Total: 11m 14s | Avg:  2m 48s | Max:  4m 13s
  🟩 Clang15            Pass: 100%/2   | Total:  4m 39s | Avg:  2m 19s | Max:  2m 25s
  🟩 Clang16            Pass: 100%/4   | Total:  8m 41s | Avg:  2m 10s | Max:  2m 26s
  🟩 Clang17            Pass: 100%/2   | Total:  5m 07s | Avg:  2m 33s | Max:  2m 45s
  🟩 Clang18            Pass: 100%/2   | Total:  7m 08s | Avg:  3m 34s | Max:  4m 42s
  🟩 GCC9               Pass: 100%/2   | Total:  4m 09s | Avg:  2m 04s | Max:  2m 07s
  🟩 GCC10              Pass: 100%/4   | Total:  8m 48s | Avg:  2m 12s | Max:  2m 15s
  🟩 GCC11              Pass: 100%/4   | Total:  8m 20s | Avg:  2m 05s | Max:  2m 14s
  🟩 GCC12              Pass: 100%/7   | Total: 21m 21s | Avg:  3m 03s | Max:  4m 29s
  🟩 GCC13              Pass: 100%/3   | Total:  5m 27s | Avg:  1m 49s | Max:  2m 05s
  🟩 MSVC14.36          Pass: 100%/1   | Total: 10m 11s | Avg: 10m 11s | Max: 10m 11s | Hits:  91%/108   
  🟩 MSVC14.39          Pass: 100%/1   | Total:  9m 33s | Avg:  9m 33s | Max:  9m 33s | Hits:  91%/108   
🟩 cxx_family
  🟩 Clang              Pass: 100%/30  | Total:  1h 14m | Avg:  2m 28s | Max:  4m 42s
  🟩 GCC                Pass: 100%/20  | Total: 48m 05s | Avg:  2m 24s | Max:  4m 29s
  🟩 MSVC               Pass: 100%/2   | Total: 19m 44s | Avg:  9m 52s | Max: 10m 11s | Hits:  91%/216   
🟩 gpu
  🟩 v100               Pass: 100%/52  | Total:  2h 22m | Avg:  2m 44s | Max: 10m 11s | Hits:  91%/216   
🟩 jobs
  🟩 Build              Pass: 100%/47  | Total:  2h 00m | Avg:  2m 34s | Max: 10m 11s | Hits:  91%/216   
  🟩 Test               Pass: 100%/5   | Total: 21m 31s | Avg:  4m 18s | Max:  4m 42s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total:  2m 02s | Avg:  2m 02s | Max:  2m 02s
  🟩 90a                Pass: 100%/1   | Total:  2m 05s | Avg:  2m 05s | Max:  2m 05s
🟩 std
  🟩 17                 Pass: 100%/28  | Total:  1h 06m | Avg:  2m 22s | Max:  4m 14s
  🟩 20                 Pass: 100%/24  | Total:  1h 15m | Avg:  3m 09s | Max: 10m 11s | Hits:  91%/216

🟩 cccl: Pass: 100%/6 | Total: 26m 24s | Avg: 4m 24s | Max: 4m 49s

🟩 cpu
  🟩 amd64              Pass: 100%/6   | Total: 26m 24s | Avg:  4m 24s | Max:  4m 49s
🟩 ctk
  🟩 11.1               Pass: 100%/2   | Total:  7m 55s | Avg:  3m 57s | Max:  4m 02s
  🟩 12.0               Pass: 100%/2   | Total:  9m 15s | Avg:  4m 37s | Max:  4m 43s
  🟩 12.6               Pass: 100%/2   | Total:  9m 14s | Avg:  4m 37s | Max:  4m 49s
🟩 cudacxx
  🟩 nvcc11.1           Pass: 100%/2   | Total:  7m 55s | Avg:  3m 57s | Max:  4m 02s
  🟩 nvcc12.0           Pass: 100%/2   | Total:  9m 15s | Avg:  4m 37s | Max:  4m 43s
  🟩 nvcc12.6           Pass: 100%/2   | Total:  9m 14s | Avg:  4m 37s | Max:  4m 49s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/6   | Total: 26m 24s | Avg:  4m 24s | Max:  4m 49s
🟩 cxx
  🟩 Clang9             Pass: 100%/1   | Total:  4m 02s | Avg:  4m 02s | Max:  4m 02s
  🟩 Clang14            Pass: 100%/1   | Total:  4m 43s | Avg:  4m 43s | Max:  4m 43s
  🟩 Clang18            Pass: 100%/1   | Total:  4m 49s | Avg:  4m 49s | Max:  4m 49s
  🟩 GCC6               Pass: 100%/1   | Total:  3m 53s | Avg:  3m 53s | Max:  3m 53s
  🟩 GCC12              Pass: 100%/1   | Total:  4m 32s | Avg:  4m 32s | Max:  4m 32s
  🟩 GCC13              Pass: 100%/1   | Total:  4m 25s | Avg:  4m 25s | Max:  4m 25s
🟩 cxx_family
  🟩 Clang              Pass: 100%/3   | Total: 13m 34s | Avg:  4m 31s | Max:  4m 49s
  🟩 GCC                Pass: 100%/3   | Total: 12m 50s | Avg:  4m 16s | Max:  4m 32s
🟩 gpu
  🟩 v100               Pass: 100%/6   | Total: 26m 24s | Avg:  4m 24s | Max:  4m 49s
🟩 jobs
  🟩 Infra              Pass: 100%/6   | Total: 26m 24s | Avg:  4m 24s | Max:  4m 49s

🟩 pycuda: Pass: 100%/1 | Total: 15m 26s | Avg: 15m 26s | Max: 15m 26s

🟩 cpu
  🟩 amd64              Pass: 100%/1   | Total: 15m 26s | Avg: 15m 26s | Max: 15m 26s
🟩 ctk
  🟩 12.5               Pass: 100%/1   | Total: 15m 26s | Avg: 15m 26s | Max: 15m 26s
🟩 cudacxx
  🟩 nvcc12.5           Pass: 100%/1   | Total: 15m 26s | Avg: 15m 26s | Max: 15m 26s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/1   | Total: 15m 26s | Avg: 15m 26s | Max: 15m 26s
🟩 cxx
  🟩 GCC13              Pass: 100%/1   | Total: 15m 26s | Avg: 15m 26s | Max: 15m 26s
🟩 cxx_family
  🟩 GCC                Pass: 100%/1   | Total: 15m 26s | Avg: 15m 26s | Max: 15m 26s
🟩 gpu
  🟩 v100               Pass: 100%/1   | Total: 15m 26s | Avg: 15m 26s | Max: 15m 26s
🟩 jobs
  🟩 Test               Pass: 100%/1   | Total: 15m 26s | Avg: 15m 26s | Max: 15m 26s

👃 Inspect Changes

Modifications in project?

	Project
+/-	CCCL Infrastructure
	libcu++
	CUB
	Thrust
	CUDA Experimental
	pycuda
	CUDA C Core Library

Modifications in project or dependencies?

	Project
+/-	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	pycuda
+/-	CUDA C Core Library

🏃‍ Runner counts (total jobs: 370)

#	Runner
297	`linux-amd64-cpu16`
30	`linux-amd64-gpu-v100-latest-1`
28	`linux-arm64-cpu16`
15	`windows-amd64-cpu16`

Brute force experiment: Which tests fail after adding an assert False?

1375779

rwgk and others added 7 commits September 19, 2024 09:49

Merge branch 'main' into cuda_parallel_type_matching

012494a

Merge branch 'main' into cuda_parallel_type_matching

a6b9b8d

Do not include our own string.h file (NVIDIA#2444)

d955d17

That might conflict with the host standard library

Merge branch 'main' of https://github.com/NVIDIA/cccl

6ff4ff3

Merge branch 'main' of https://github.com/NVIDIA/cccl

0069666

Merge branch 'main' into cuda_parallel_type_matching

365f55a

Add _dtype_validation() in python/cuda_parallel/cuda/parallel/exper…

55fb992

…imental/__init__.py and fix bug in python/cuda_parallel/tests/test_reduce_api.py

rwgk added 4 commits September 30, 2024 11:52

Add test_device_reduce_dtype_mismatch(). Capture dtypes only in c…

035970c

…tor (not entire arrays).

Undo change in .gitignore

f8485b9

Merge branch 'main' of https://github.com/NVIDIA/cccl

4bc44b4

Merge branch 'main' into cuda_parallel_type_matching

ec18cd0

rwgk changed the title ~~[WIP][FEA]: Validate cuda.parallel type matching in build and execution~~ [FEA]: Validate cuda.parallel type matching in build and execution Sep 30, 2024

rwgk marked this pull request as ready for review September 30, 2024 19:13

rwgk requested a review from a team as a code owner September 30, 2024 19:13

rwgk requested review from fbusato and gevtushenko September 30, 2024 19:13

gevtushenko requested changes Oct 2, 2024

View reviewed changes

rwgk added 5 commits October 3, 2024 15:18

Merge branch 'main' of https://github.com/NVIDIA/cccl

6977ac1

Merge branch 'main' into cuda_parallel_type_matching

4425781

Move min_op() back into test_device_reduce_success() to unbreak s…

fd33c95

…phinx documentation. Also fix existing typo.

Move test_device_reduce_dtype_mismatch() from test_reduce_api.py to…

f4c6d83

… test_reduce.py

Add TODO POINTER vs ITERATOR

063e467

gevtushenko approved these changes Oct 4, 2024

View reviewed changes

gevtushenko merged commit e8d57c3 into NVIDIA:main Oct 4, 2024

rwgk deleted the cuda_parallel_type_matching branch October 4, 2024 17:19

leofang mentioned this pull request Feb 10, 2025

cuda.parallel: Minor perf improvements #3718

Merged

2 tasks

Conversation

rwgk commented Sep 18, 2024 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Description

Checklist

Uh oh!

github-actions bot commented Sep 19, 2024

🟨 cub: Pass: 93%/136 | Total: 23h 20m | Avg: 10m 17s | Max: 1h 27m | Hits: 99%/4362

🟥 pycuda: Pass: 0%/1 | Total: 12m 44s | Avg: 12m 44s | Max: 12m 44s

🟩 thrust: Pass: 100%/122 | Total: 14h 15m | Avg: 7m 00s | Max: 38m 31s | Hits: 99%/20070

🟩 libcudacxx: Pass: 100%/116 | Total: 19h 43m | Avg: 10m 12s | Max: 36m 32s | Hits: 99%/17005

🟩 cudax: Pass: 100%/58 | Total: 2h 43m | Avg: 2m 48s | Max: 11m 02s | Hits: 90%/208

🟩 cccl: Pass: 100%/4 | Total: 16m 26s | Avg: 4m 06s | Max: 4m 37s

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 437)

Uh oh!

github-actions bot commented Sep 30, 2024

🟩 cub: Pass: 100%/104 | Total: 11h 57m | Avg: 6m 54s | Max: 1h 06m | Hits: 99%/2908

🟩 libcudacxx: Pass: 100%/104 | Total: 10h 00m | Avg: 5m 46s | Max: 27m 37s | Hits: 99%/11383

🟩 thrust: Pass: 100%/103 | Total: 10h 11m | Avg: 5m 56s | Max: 22m 28s | Hits: 99%/11150

🟩 cudax: Pass: 100%/52 | Total: 2h 19m | Avg: 2m 41s | Max: 10m 21s | Hits: 90%/222

🟩 cccl: Pass: 100%/4 | Total: 17m 29s | Avg: 4m 22s | Max: 4m 36s

🟩 pycuda: Pass: 100%/1 | Total: 14m 52s | Avg: 14m 52s | Max: 14m 52s

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 368)

Uh oh!

rwgk commented Sep 30, 2024

Uh oh!

github-actions bot commented Sep 30, 2024

🟩 cub: Pass: 100%/104 | Total: 10h 47m | Avg: 6m 13s | Max: 31m 09s | Hits: 99%/2908

🟩 libcudacxx: Pass: 100%/104 | Total: 21h 08m | Avg: 12m 11s | Max: 42m 53s | Hits: 58%/11399

🟩 thrust: Pass: 100%/103 | Total: 10h 29m | Avg: 6m 06s | Max: 34m 33s | Hits: 99%/11150

🟩 cudax: Pass: 100%/52 | Total: 2h 19m | Avg: 2m 41s | Max: 10m 35s | Hits: 90%/222

🟩 cccl: Pass: 100%/4 | Total: 16m 50s | Avg: 4m 12s | Max: 4m 52s

🟩 pycuda: Pass: 100%/1 | Total: 15m 39s | Avg: 15m 39s | Max: 15m 39s

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 368)

Uh oh!

gevtushenko Oct 2, 2024

Choose a reason for hiding this comment

Uh oh!

rwgk Oct 3, 2024

Choose a reason for hiding this comment

Uh oh!

gevtushenko Oct 2, 2024

Choose a reason for hiding this comment

Uh oh!

rwgk Oct 3, 2024

Choose a reason for hiding this comment

Uh oh!

leofang commented Oct 2, 2024

Uh oh!

rwgk commented Oct 3, 2024

Uh oh!

github-actions bot commented Oct 4, 2024

🟩 cub: Pass: 100%/104 | Total: 10h 46m | Avg: 6m 12s | Max: 30m 15s | Hits: 99%/2908

🟩 libcudacxx: Pass: 100%/104 | Total: 14h 18m | Avg: 8m 15s | Max: 26m 37s | Hits: 99%/11438

🟩 thrust: Pass: 100%/103 | Total: 10h 53m | Avg: 6m 20s | Max: 35m 40s | Hits: 99%/11150

🟩 cudax: Pass: 100%/52 | Total: 2h 22m | Avg: 2m 44s | Max: 10m 11s | Hits: 91%/216

🟩 cccl: Pass: 100%/6 | Total: 26m 24s | Avg: 4m 24s | Max: 4m 49s

🟩 pycuda: Pass: 100%/1 | Total: 15m 26s | Avg: 15m 26s | Max: 15m 26s

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 370)

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

4 participants

rwgk commented Sep 18, 2024 •

edited

Loading