Add `thrust::universal_host_pinned_vector` #2653

bernhardmgruber · 2024-10-29T18:57:38Z

We have all the pieces in Thrust to provide a vector backed by pinned host memory. Only a few aliases were missing. Furthermore, the unit tests were already covering a vector with pinned memory.

This PR adds the missing aliases and extends a few tests. The main new alias is thrust::universal_host_pinned_vector<T> which uses CUDA pinned host memory (cudaMallocHost), and the native memory resource on other systems (as dictated by the existing universal_host_pinned_memory_resource on each system).

Fixes: #2485

bernhardmgruber · 2024-10-29T18:59:04Z

libcudacxx/examples/concurrent_hash_table.cu

-// TODO: This should be upstreamed and then removed.
-namespace thrust
-{
-
-using universal_raw_memory_resource =
-  thrust::system::cuda::detail::cuda_memory_resource<thrust::system::cuda::detail::cudaMallocManaged, cudaFree, void*>;
-
-template <typename T>
-using universal_allocator = thrust::mr::stateless_resource_allocator<T, universal_raw_memory_resource>;
-
-template <typename T>
-using universal_vector = thrust::device_vector<T, universal_allocator<T>>;
-
-} // namespace thrust
-


This is a drive-by fix, since this functionality has been upstreamed into Thrust IIUC.

bernhardmgruber · 2024-10-29T18:59:31Z

thrust/testing/unittest/testframework.h

-    VTEST<thrust::device_vector<                                                                                        \
-      int,                                                                                                              \
-      thrust::mr::stateless_resource_allocator<int, thrust::universal_host_pinned_memory_resource>>>();                 \


Here, our unit tests already cover cost pinned memory.

bernhardmgruber · 2024-10-30T10:45:41Z

thrust/thrust/system/cpp/memory_resource.h

 using universal_memory_resource = detail::universal_native_resource;
+// FIXME(bgruber): comment below is wrong or alias should be to universal_memory_resource
 /*! An alias for \p cpp::universal_memory_resource. */
 using universal_host_pinned_memory_resource = detail::native_resource;


We have these aliases in each system. IMO, universal_host_pinned_memory_resource should be an alias to universal_memory_resource except for the CUDA system. This caused a test to fail because the pointer type of universal_host_pinned_memory_resource is a native pointer and a not a universial_ptr<T>. I commented out that test for now. Fixing this is technically a breaking change.

If we want to be conservative, we should postpone fixing those aliases to the next major release.

Tracking here: #2659

github-actions · 2024-10-30T12:27:20Z

🟨 CI finished in 1h 39m: Pass: 92%/394 | Total: 4d 14h | Avg: 16m 51s | Max: 1h 08m | Hits: 66%/25781

🟨 thrust: Pass: 71%/109 | Total: 1d 11h | Avg: 19m 44s | Max: 1h 08m | Hits: 65%/13165

🔍 cpu: amd64 🔍
  🔍 amd64              Pass:  69%/101 | Total:  1d 08h | Avg: 19m 32s | Max:  1h 08m | Hits:  65%/13165 
  🟩 arm64              Pass: 100%/8   | Total:  2h 57m | Avg: 22m 10s | Max: 35m 06s
🔍 cudacxx_family: nvcc 🔍
  🟩 ClangCUDA          Pass: 100%/4   | Total: 45m 40s | Avg: 11m 25s | Max: 12m 57s
  🔍 nvcc               Pass:  70%/105 | Total:  1d 11h | Avg: 20m 03s | Max:  1h 08m | Hits:  65%/13165 
🔍 cxx_family: GCC 🔍
  🟩 Clang              Pass: 100%/48  | Total: 16h 56m | Avg: 21m 11s | Max: 37m 37s
  🔍 GCC                Pass:  36%/49  | Total:  8h 18m | Avg: 10m 10s | Max: 35m 06s
  🟩 Intel              Pass: 100%/3   | Total:  2h 12m | Avg: 44m 01s | Max: 45m 47s
  🟩 MSVC               Pass: 100%/5   | Total:  4h 12m | Avg: 50m 26s | Max:  1h 00m | Hits:  65%/13165 
  🟩 NVHPC              Pass: 100%/4   | Total:  4h 11m | Avg:  1h 02m | Max:  1h 08m
🔍 jobs: Build 🔍
  🔍 Build              Pass:  69%/102 | Total:  1d 10h | Avg: 20m 15s | Max:  1h 08m | Hits:  57%/10532 
  🟩 TestCPU            Pass: 100%/4   | Total: 42m 20s | Avg: 10m 35s | Max: 20m 26s | Hits:  99%/2633  
  🟩 TestGPU            Pass: 100%/3   | Total: 41m 52s | Avg: 13m 57s | Max: 15m 08s
🚨 sm: 60;70;80;90 🚨
  🔥 60;70;80;90        Pass:   0%/3   | Total: 16m 20s | Avg:  5m 26s | Max:  6m 07s
  🟩 90a                Pass: 100%/4   | Total:  1h 23m | Avg: 20m 58s | Max: 23m 10s
🟨 ctk
  🟨 11.1               Pass:  26%/15  | Total:  3h 11m | Avg: 12m 46s | Max: 58m 51s | Hits:  57%/2633  
  🟥 11.8               Pass:   0%/3   | Total: 16m 20s | Avg:  5m 26s | Max:  6m 07s
  🟩 12.5               Pass: 100%/4   | Total:  4h 11m | Avg:  1h 02m | Max:  1h 08m
  🟨 12.6               Pass:  80%/87  | Total:  1d 04h | Avg: 19m 26s | Max:  1h 00m | Hits:  67%/10532 
🟨 cudacxx
  🟩 ClangCUDA18        Pass: 100%/4   | Total: 45m 40s | Avg: 11m 25s | Max: 12m 57s
  🟨 nvcc11.1           Pass:  26%/15  | Total:  3h 11m | Avg: 12m 46s | Max: 58m 51s | Hits:  57%/2633  
  🟥 nvcc11.8           Pass:   0%/3   | Total: 16m 20s | Avg:  5m 26s | Max:  6m 07s
  🟩 nvcc12.5           Pass: 100%/4   | Total:  4h 11m | Avg:  1h 02m | Max:  1h 08m
  🟨 nvcc12.6           Pass:  79%/83  | Total:  1d 03h | Avg: 19m 49s | Max:  1h 00m | Hits:  67%/10532 
🟨 cxx
  🟩 Clang9             Pass: 100%/6   | Total:  3h 02m | Avg: 30m 22s | Max: 33m 37s
  🟩 Clang10            Pass: 100%/3   | Total:  1h 36m | Avg: 32m 18s | Max: 34m 53s
  🟩 Clang11            Pass: 100%/4   | Total:  2h 17m | Avg: 34m 24s | Max: 37m 02s
  🟩 Clang12            Pass: 100%/4   | Total:  2h 13m | Avg: 33m 26s | Max: 37m 37s
  🟩 Clang13            Pass: 100%/4   | Total:  2h 14m | Avg: 33m 32s | Max: 36m 43s
  🟩 Clang14            Pass: 100%/4   | Total: 48m 46s | Avg: 12m 11s | Max: 13m 03s
  🟩 Clang15            Pass: 100%/4   | Total: 52m 08s | Avg: 13m 02s | Max: 14m 22s
  🟩 Clang16            Pass: 100%/4   | Total: 50m 09s | Avg: 12m 32s | Max: 13m 59s
  🟩 Clang17            Pass: 100%/4   | Total: 52m 08s | Avg: 13m 02s | Max: 14m 59s
  🟩 Clang18            Pass: 100%/11  | Total:  2h 09m | Avg: 11m 43s | Max: 15m 15s
  🟥 GCC6               Pass:   0%/2   | Total:  7m 44s | Avg:  3m 52s | Max:  4m 22s
  🟥 GCC7               Pass:   0%/6   | Total: 26m 14s | Avg:  4m 22s | Max:  4m 47s
  🟥 GCC8               Pass:   0%/6   | Total: 24m 10s | Avg:  4m 01s | Max:  4m 30s
  🟥 GCC9               Pass:   0%/6   | Total: 25m 46s | Avg:  4m 17s | Max:  4m 59s
  🟥 GCC10              Pass:   0%/4   | Total: 17m 03s | Avg:  4m 15s | Max:  4m 39s
  🟥 GCC11              Pass:   0%/7   | Total: 31m 04s | Avg:  4m 26s | Max:  6m 07s
  🟩 GCC12              Pass: 100%/4   | Total: 55m 33s | Avg: 13m 53s | Max: 16m 33s
  🟩 GCC13              Pass: 100%/14  | Total:  5h 10m | Avg: 22m 11s | Max: 35m 06s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total:  2h 12m | Avg: 44m 01s | Max: 45m 47s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 58m 51s | Avg: 58m 51s | Max: 58m 51s | Hits:  57%/2633  
  🟩 MSVC14.29          Pass: 100%/2   | Total:  1h 52m | Avg: 56m 09s | Max: 56m 50s | Hits:  57%/5266  
  🟩 MSVC14.39          Pass: 100%/2   | Total:  1h 21m | Avg: 40m 32s | Max:  1h 00m | Hits:  78%/5266  
  🟩 NVHPC24.7          Pass: 100%/4   | Total:  4h 11m | Avg:  1h 02m | Max:  1h 08m
🟨 gpu
  🟨 v100               Pass:  71%/109 | Total:  1d 11h | Avg: 19m 44s | Max:  1h 08m | Hits:  65%/13165 
🟨 std
  🟨 11                 Pass:  66%/30  | Total:  7h 43m | Avg: 15m 26s | Max: 55m 14s
  🟨 14                 Pass:  65%/29  | Total: 10h 15m | Avg: 21m 13s | Max:  1h 01m | Hits:  57%/5266  
  🟨 17                 Pass:  66%/27  | Total:  9h 27m | Avg: 21m 01s | Max:  1h 06m | Hits:  57%/2633  
  🟨 20                 Pass:  91%/23  | Total:  8h 25m | Avg: 21m 57s | Max:  1h 08m | Hits:  78%/5266

🟩 libcudacxx: Pass: 100%/118 | Total: 1d 00h | Avg: 12m 26s | Max: 43m 31s | Hits: 67%/9468

🟩 cpu
  🟩 amd64              Pass: 100%/110 | Total: 22h 27m | Avg: 12m 14s | Max: 43m 31s | Hits:  67%/9468  
  🟩 arm64              Pass: 100%/8   | Total:  2h 00m | Avg: 15m 01s | Max: 26m 06s
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  2h 32m | Avg: 10m 11s | Max: 31m 03s | Hits:  34%/2174  
  🟩 11.8               Pass: 100%/3   | Total: 53m 45s | Avg: 17m 55s | Max: 28m 13s
  🟩 12.5               Pass: 100%/4   | Total:  1h 59m | Avg: 29m 55s | Max: 43m 31s
  🟩 12.6               Pass: 100%/96  | Total: 19h 01m | Avg: 11m 53s | Max: 36m 13s | Hits:  77%/7294  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/12  | Total:  2h 26m | Avg: 12m 10s | Max: 19m 27s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  2h 32m | Avg: 10m 11s | Max: 31m 03s | Hits:  34%/2174  
  🟩 nvcc11.8           Pass: 100%/3   | Total: 53m 45s | Avg: 17m 55s | Max: 28m 13s
  🟩 nvcc12.5           Pass: 100%/4   | Total:  1h 59m | Avg: 29m 55s | Max: 43m 31s
  🟩 nvcc12.6           Pass: 100%/84  | Total: 16h 35m | Avg: 11m 50s | Max: 36m 13s | Hits:  77%/7294  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/12  | Total:  2h 26m | Avg: 12m 10s | Max: 19m 27s
  🟩 nvcc               Pass: 100%/106 | Total: 22h 01m | Avg: 12m 27s | Max: 43m 31s | Hits:  67%/9468  
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total: 45m 58s | Avg:  7m 39s | Max: 22m 48s
  🟩 Clang10            Pass: 100%/3   | Total: 16m 21s | Avg:  5m 27s | Max:  5m 46s
  🟩 Clang11            Pass: 100%/4   | Total: 55m 23s | Avg: 13m 50s | Max: 28m 45s
  🟩 Clang12            Pass: 100%/4   | Total: 51m 52s | Avg: 12m 58s | Max: 23m 43s
  🟩 Clang13            Pass: 100%/4   | Total: 32m 53s | Avg:  8m 13s | Max: 17m 48s
  🟩 Clang14            Pass: 100%/4   | Total: 55m 23s | Avg: 13m 50s | Max: 27m 50s
  🟩 Clang15            Pass: 100%/4   | Total: 33m 41s | Avg:  8m 25s | Max: 18m 16s
  🟩 Clang16            Pass: 100%/4   | Total:  1h 00m | Avg: 15m 05s | Max: 30m 46s
  🟩 Clang17            Pass: 100%/4   | Total: 18m 36s | Avg:  4m 39s | Max:  4m 49s
  🟩 Clang18            Pass: 100%/18  | Total:  3h 37m | Avg: 12m 05s | Max: 29m 58s
  🟩 GCC6               Pass: 100%/2   | Total:  6m 15s | Avg:  3m 07s | Max:  3m 08s
  🟩 GCC7               Pass: 100%/6   | Total: 57m 03s | Avg:  9m 30s | Max: 23m 39s
  🟩 GCC8               Pass: 100%/6   | Total: 58m 40s | Avg:  9m 46s | Max: 23m 37s
  🟩 GCC9               Pass: 100%/6   | Total:  1h 00m | Avg: 10m 01s | Max: 22m 51s
  🟩 GCC10              Pass: 100%/4   | Total: 32m 36s | Avg:  8m 09s | Max: 18m 40s
  🟩 GCC11              Pass: 100%/7   | Total:  1h 11m | Avg: 10m 09s | Max: 28m 13s
  🟩 GCC12              Pass: 100%/4   | Total: 58m 07s | Avg: 14m 31s | Max: 25m 39s
  🟩 GCC13              Pass: 100%/17  | Total:  4h 01m | Avg: 14m 12s | Max: 33m 59s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total:  1h 29m | Avg: 29m 54s | Max: 36m 13s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 31m 03s | Avg: 31m 03s | Max: 31m 03s | Hits:  34%/2174  
  🟩 MSVC14.29          Pass: 100%/2   | Total: 41m 33s | Avg: 20m 46s | Max: 29m 51s | Hits:  65%/4709  
  🟩 MSVC14.39          Pass: 100%/1   | Total: 11m 47s | Avg: 11m 47s | Max: 11m 47s | Hits:  98%/2585  
  🟩 NVHPC24.7          Pass: 100%/4   | Total:  1h 59m | Avg: 29m 55s | Max: 43m 31s
🟩 cxx_family
  🟩 Clang              Pass: 100%/55  | Total:  9h 48m | Avg: 10m 41s | Max: 30m 46s
  🟩 GCC                Pass: 100%/52  | Total:  9h 45m | Avg: 11m 15s | Max: 33m 59s
  🟩 Intel              Pass: 100%/3   | Total:  1h 29m | Avg: 29m 54s | Max: 36m 13s
  🟩 MSVC               Pass: 100%/4   | Total:  1h 24m | Avg: 21m 05s | Max: 31m 03s | Hits:  67%/9468  
  🟩 NVHPC              Pass: 100%/4   | Total:  1h 59m | Avg: 29m 55s | Max: 43m 31s
🟩 gpu
  🟩 v100               Pass: 100%/118 | Total:  1d 00h | Avg: 12m 26s | Max: 43m 31s | Hits:  67%/9468  
🟩 jobs
  🟩 Build              Pass: 100%/110 | Total: 21h 45m | Avg: 11m 51s | Max: 43m 31s | Hits:  67%/9468  
  🟩 NVRTC              Pass: 100%/4   | Total:  1h 40m | Avg: 25m 03s | Max: 33m 59s
  🟩 Test               Pass: 100%/3   | Total: 59m 50s | Avg: 19m 56s | Max: 29m 58s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  2m 29s | Avg:  2m 29s | Max:  2m 29s
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 53m 45s | Avg: 17m 55s | Max: 28m 13s
  🟩 90                 Pass: 100%/4   | Total: 41m 57s | Avg: 10m 29s | Max: 12m 26s
  🟩 90a                Pass: 100%/8   | Total: 59m 06s | Avg:  7m 23s | Max: 12m 19s
🟩 std
  🟩 11                 Pass: 100%/32  | Total:  5h 56m | Avg: 11m 09s | Max: 26m 31s
  🟩 14                 Pass: 100%/32  | Total:  6h 42m | Avg: 12m 33s | Max: 31m 03s | Hits:  32%/4450  
  🟩 17                 Pass: 100%/30  | Total:  6h 11m | Avg: 12m 22s | Max: 39m 32s | Hits:  97%/2433  
  🟩 20                 Pass: 100%/23  | Total:  5h 34m | Avg: 14m 33s | Max: 43m 31s | Hits:  98%/2585

🟩 cub: Pass: 100%/110 | Total: 1d 20h | Avg: 24m 32s | Max: 1h 06m | Hits: 65%/2924

🟩 cpu
  🟩 amd64              Pass: 100%/102 | Total:  1d 16h | Avg: 24m 06s | Max:  1h 06m | Hits:  65%/2924  
  🟩 arm64              Pass: 100%/8   | Total:  3h 59m | Avg: 29m 59s | Max: 57m 05s
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  4h 22m | Avg: 17m 28s | Max: 49m 36s | Hits:  65%/731   
  🟩 11.8               Pass: 100%/3   | Total: 15m 05s | Avg:  5m 01s | Max:  5m 14s
  🟩 12.5               Pass: 100%/4   | Total:  4h 17m | Avg:  1h 04m | Max:  1h 06m
  🟩 12.6               Pass: 100%/88  | Total:  1d 12h | Avg: 24m 36s | Max:  1h 01m | Hits:  65%/2193  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/4   | Total: 16m 35s | Avg:  4m 08s | Max:  5m 00s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  4h 22m | Avg: 17m 28s | Max: 49m 36s | Hits:  65%/731   
  🟩 nvcc11.8           Pass: 100%/3   | Total: 15m 05s | Avg:  5m 01s | Max:  5m 14s
  🟩 nvcc12.5           Pass: 100%/4   | Total:  4h 17m | Avg:  1h 04m | Max:  1h 06m
  🟩 nvcc12.6           Pass: 100%/84  | Total:  1d 11h | Avg: 25m 34s | Max:  1h 01m | Hits:  65%/2193  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/4   | Total: 16m 35s | Avg:  4m 08s | Max:  5m 00s
  🟩 nvcc               Pass: 100%/106 | Total:  1d 20h | Avg: 25m 18s | Max:  1h 06m | Hits:  65%/2924  
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total:  4h 43m | Avg: 47m 11s | Max: 51m 45s
  🟩 Clang10            Pass: 100%/3   | Total:  2h 36m | Avg: 52m 10s | Max: 52m 57s
  🟩 Clang11            Pass: 100%/4   | Total:  3h 22m | Avg: 50m 41s | Max: 51m 51s
  🟩 Clang12            Pass: 100%/4   | Total:  3h 23m | Avg: 50m 54s | Max: 52m 35s
  🟩 Clang13            Pass: 100%/4   | Total:  3h 27m | Avg: 51m 50s | Max: 55m 35s
  🟩 Clang14            Pass: 100%/4   | Total: 20m 59s | Avg:  5m 14s | Max:  5m 28s
  🟩 Clang15            Pass: 100%/4   | Total: 21m 53s | Avg:  5m 28s | Max:  6m 16s
  🟩 Clang16            Pass: 100%/4   | Total: 22m 24s | Avg:  5m 36s | Max:  5m 51s
  🟩 Clang17            Pass: 100%/4   | Total: 22m 16s | Avg:  5m 34s | Max:  5m 51s
  🟩 Clang18            Pass: 100%/11  | Total:  1h 54m | Avg: 10m 27s | Max: 50m 44s
  🟩 GCC6               Pass: 100%/2   | Total:  7m 42s | Avg:  3m 51s | Max:  3m 51s
  🟩 GCC7               Pass: 100%/6   | Total:  1h 06m | Avg: 11m 05s | Max: 42m 26s
  🟩 GCC8               Pass: 100%/6   | Total: 28m 44s | Avg:  4m 47s | Max:  5m 44s
  🟩 GCC9               Pass: 100%/6   | Total: 28m 36s | Avg:  4m 46s | Max:  6m 02s
  🟩 GCC10              Pass: 100%/4   | Total: 20m 38s | Avg:  5m 09s | Max:  5m 32s
  🟩 GCC11              Pass: 100%/7   | Total: 37m 51s | Avg:  5m 24s | Max:  6m 16s
  🟩 GCC12              Pass: 100%/4   | Total: 22m 41s | Avg:  5m 40s | Max:  5m 56s
  🟩 GCC13              Pass: 100%/16  | Total:  9h 40m | Avg: 36m 18s | Max: 57m 05s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total:  2h 49m | Avg: 56m 21s | Max: 57m 06s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 49m 36s | Avg: 49m 36s | Max: 49m 36s | Hits:  65%/731   
  🟩 MSVC14.29          Pass: 100%/2   | Total:  1h 56m | Avg: 58m 25s | Max:  1h 01m | Hits:  65%/1462  
  🟩 MSVC14.39          Pass: 100%/1   | Total: 56m 57s | Avg: 56m 57s | Max: 56m 57s | Hits:  65%/731   
  🟩 NVHPC24.7          Pass: 100%/4   | Total:  4h 17m | Avg:  1h 04m | Max:  1h 06m
🟩 cxx_family
  🟩 Clang              Pass: 100%/48  | Total: 20h 55m | Avg: 26m 09s | Max: 55m 35s
  🟩 GCC                Pass: 100%/51  | Total: 13h 13m | Avg: 15m 33s | Max: 57m 05s
  🟩 Intel              Pass: 100%/3   | Total:  2h 49m | Avg: 56m 21s | Max: 57m 06s
  🟩 MSVC               Pass: 100%/4   | Total:  3h 43m | Avg: 55m 50s | Max:  1h 01m | Hits:  65%/2924  
  🟩 NVHPC              Pass: 100%/4   | Total:  4h 17m | Avg:  1h 04m | Max:  1h 06m
🟩 gpu
  🟩 v100               Pass: 100%/110 | Total:  1d 20h | Avg: 24m 32s | Max:  1h 06m | Hits:  65%/2924  
🟩 jobs
  🟩 Build              Pass: 100%/102 | Total:  1d 16h | Avg: 24m 06s | Max:  1h 06m | Hits:  65%/2924  
  🟩 DeviceLaunch       Pass: 100%/1   | Total: 31m 52s | Avg: 31m 52s | Max: 31m 52s
  🟩 GraphCapture       Pass: 100%/1   | Total: 19m 19s | Avg: 19m 19s | Max: 19m 19s
  🟩 HostLaunch         Pass: 100%/3   | Total:  1h 16m | Avg: 25m 38s | Max: 29m 35s
  🟩 TestGPU            Pass: 100%/3   | Total:  1h 52m | Avg: 37m 25s | Max: 50m 44s
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 15m 05s | Avg:  5m 01s | Max:  5m 14s
  🟩 90a                Pass: 100%/4   | Total:  1h 29m | Avg: 22m 21s | Max: 23m 23s
🟩 std
  🟩 11                 Pass: 100%/30  | Total: 11h 39m | Avg: 23m 19s | Max:  1h 05m
  🟩 14                 Pass: 100%/29  | Total: 12h 12m | Avg: 25m 14s | Max:  1h 05m | Hits:  65%/1462  
  🟩 17                 Pass: 100%/27  | Total: 10h 41m | Avg: 23m 45s | Max:  1h 06m | Hits:  65%/731   
  🟩 20                 Pass: 100%/24  | Total: 10h 25m | Avg: 26m 04s | Max: 59m 48s | Hits:  65%/731

🟩 cudax: Pass: 100%/54 | Total: 4h 57m | Avg: 5m 31s | Max: 23m 31s | Hits: 88%/224

🟩 cpu
  🟩 amd64              Pass: 100%/50  | Total:  4h 44m | Avg:  5m 41s | Max: 23m 31s | Hits:  88%/224   
  🟩 arm64              Pass: 100%/4   | Total: 13m 27s | Avg:  3m 21s | Max:  3m 34s
🟩 ctk
  🟩 12.0               Pass: 100%/19  | Total:  1h 43m | Avg:  5m 28s | Max: 23m 06s | Hits:  89%/112   
  🟩 12.5               Pass: 100%/2   | Total: 13m 03s | Avg:  6m 31s | Max:  6m 34s
  🟩 12.6               Pass: 100%/33  | Total:  3h 00m | Avg:  5m 29s | Max: 23m 31s | Hits:  87%/112   
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/19  | Total:  1h 43m | Avg:  5m 28s | Max: 23m 06s | Hits:  89%/112   
  🟩 nvcc12.5           Pass: 100%/2   | Total: 13m 03s | Avg:  6m 31s | Max:  6m 34s
  🟩 nvcc12.6           Pass: 100%/33  | Total:  3h 00m | Avg:  5m 29s | Max: 23m 31s | Hits:  87%/112   
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/54  | Total:  4h 57m | Avg:  5m 31s | Max: 23m 31s | Hits:  88%/224   
🟩 cxx
  🟩 Clang9             Pass: 100%/2   | Total:  7m 39s | Avg:  3m 49s | Max:  4m 30s
  🟩 Clang10            Pass: 100%/2   | Total:  8m 53s | Avg:  4m 26s | Max:  4m 44s
  🟩 Clang11            Pass: 100%/4   | Total: 15m 11s | Avg:  3m 47s | Max:  4m 16s
  🟩 Clang12            Pass: 100%/4   | Total: 16m 24s | Avg:  4m 06s | Max:  4m 27s
  🟩 Clang13            Pass: 100%/4   | Total: 14m 39s | Avg:  3m 39s | Max:  4m 16s
  🟩 Clang14            Pass: 100%/4   | Total: 29m 34s | Avg:  7m 23s | Max: 18m 20s
  🟩 Clang15            Pass: 100%/2   | Total:  7m 33s | Avg:  3m 46s | Max:  4m 09s
  🟩 Clang16            Pass: 100%/4   | Total: 13m 58s | Avg:  3m 29s | Max:  3m 47s
  🟩 Clang17            Pass: 100%/2   | Total:  7m 39s | Avg:  3m 49s | Max:  3m 54s
  🟩 Clang18            Pass: 100%/2   | Total: 27m 24s | Avg: 13m 42s | Max: 23m 31s
  🟩 GCC9               Pass: 100%/2   | Total:  7m 21s | Avg:  3m 40s | Max:  3m 43s
  🟩 GCC10              Pass: 100%/4   | Total: 14m 19s | Avg:  3m 34s | Max:  4m 08s
  🟩 GCC11              Pass: 100%/4   | Total: 13m 36s | Avg:  3m 24s | Max:  3m 54s
  🟩 GCC12              Pass: 100%/7   | Total:  1h 15m | Avg: 10m 49s | Max: 23m 06s
  🟩 GCC13              Pass: 100%/3   | Total: 10m 45s | Avg:  3m 35s | Max:  3m 49s
  🟩 MSVC14.36          Pass: 100%/1   | Total:  6m 50s | Avg:  6m 50s | Max:  6m 50s | Hits:  89%/112   
  🟩 MSVC14.39          Pass: 100%/1   | Total:  7m 25s | Avg:  7m 25s | Max:  7m 25s | Hits:  87%/112   
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 13m 03s | Avg:  6m 31s | Max:  6m 34s
🟩 cxx_family
  🟩 Clang              Pass: 100%/30  | Total:  2h 28m | Avg:  4m 57s | Max: 23m 31s
  🟩 GCC                Pass: 100%/20  | Total:  2h 01m | Avg:  6m 05s | Max: 23m 06s
  🟩 MSVC               Pass: 100%/2   | Total: 14m 15s | Avg:  7m 07s | Max:  7m 25s | Hits:  88%/224   
  🟩 NVHPC              Pass: 100%/2   | Total: 13m 03s | Avg:  6m 31s | Max:  6m 34s
🟩 gpu
  🟩 v100               Pass: 100%/54  | Total:  4h 57m | Avg:  5m 31s | Max: 23m 31s | Hits:  88%/224   
🟩 jobs
  🟩 Build              Pass: 100%/49  | Total:  3h 15m | Avg:  3m 58s | Max:  7m 25s | Hits:  88%/224   
  🟩 Test               Pass: 100%/5   | Total:  1h 42m | Avg: 20m 34s | Max: 23m 31s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total:  3m 10s | Avg:  3m 10s | Max:  3m 10s
  🟩 90a                Pass: 100%/1   | Total:  3m 49s | Avg:  3m 49s | Max:  3m 49s
🟩 std
  🟩 17                 Pass: 100%/29  | Total:  2h 24m | Avg:  4m 58s | Max: 23m 06s
  🟩 20                 Pass: 100%/25  | Total:  2h 33m | Avg:  6m 08s | Max: 23m 31s | Hits:  88%/224

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 10m 17s | Avg: 5m 08s | Max: 8m 12s

🟩 cpu
  🟩 amd64              Pass: 100%/2   | Total: 10m 17s | Avg:  5m 08s | Max:  8m 12s
🟩 ctk
  🟩 12.6               Pass: 100%/2   | Total: 10m 17s | Avg:  5m 08s | Max:  8m 12s
🟩 cudacxx
  🟩 nvcc12.6           Pass: 100%/2   | Total: 10m 17s | Avg:  5m 08s | Max:  8m 12s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/2   | Total: 10m 17s | Avg:  5m 08s | Max:  8m 12s
🟩 cxx
  🟩 GCC13              Pass: 100%/2   | Total: 10m 17s | Avg:  5m 08s | Max:  8m 12s
🟩 cxx_family
  🟩 GCC                Pass: 100%/2   | Total: 10m 17s | Avg:  5m 08s | Max:  8m 12s
🟩 gpu
  🟩 v100               Pass: 100%/2   | Total: 10m 17s | Avg:  5m 08s | Max:  8m 12s
🟩 jobs
  🟩 Build              Pass: 100%/1   | Total:  2m 05s | Avg:  2m 05s | Max:  2m 05s
  🟩 Test               Pass: 100%/1   | Total:  8m 12s | Avg:  8m 12s | Max:  8m 12s

🟩 python: Pass: 100%/1 | Total: 15m 12s | Avg: 15m 12s | Max: 15m 12s

🟩 cpu
  🟩 amd64              Pass: 100%/1   | Total: 15m 12s | Avg: 15m 12s | Max: 15m 12s
🟩 ctk
  🟩 12.6               Pass: 100%/1   | Total: 15m 12s | Avg: 15m 12s | Max: 15m 12s
🟩 cudacxx
  🟩 nvcc12.6           Pass: 100%/1   | Total: 15m 12s | Avg: 15m 12s | Max: 15m 12s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/1   | Total: 15m 12s | Avg: 15m 12s | Max: 15m 12s
🟩 cxx
  🟩 GCC13              Pass: 100%/1   | Total: 15m 12s | Avg: 15m 12s | Max: 15m 12s
🟩 cxx_family
  🟩 GCC                Pass: 100%/1   | Total: 15m 12s | Avg: 15m 12s | Max: 15m 12s
🟩 gpu
  🟩 v100               Pass: 100%/1   | Total: 15m 12s | Avg: 15m 12s | Max: 15m 12s
🟩 jobs
  🟩 Test               Pass: 100%/1   | Total: 15m 12s | Avg: 15m 12s | Max: 15m 12s

👃 Inspect Changes

Modifications in project?

	Project
	CCCL Infrastructure
+/-	libcu++
	CUB
+/-	Thrust
	CUDA Experimental
	python
	CCCL C Parallel Library
	Catch2Helper

Modifications in project or dependencies?

	Project
	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	python
+/-	CCCL C Parallel Library
+/-	Catch2Helper

🏃‍ Runner counts (total jobs: 394)

#	Runner
326	`linux-amd64-cpu16`
28	`linux-arm64-cpu16`
25	`linux-amd64-gpu-v100-latest-1`
15	`windows-amd64-cpu16`

Fixes: NVIDIA#2485

github-actions · 2024-10-30T16:52:48Z

🟩 CI finished in 1h 31m: Pass: 100%/394 | Total: 3d 12h | Avg: 12m 50s | Max: 1h 12m | Hits: 60%/25793

🟩 libcudacxx: Pass: 100%/118 | Total: 1d 00h | Avg: 12m 12s | Max: 43m 01s | Hits: 50%/9480

🟩 cpu
  🟩 amd64              Pass: 100%/110 | Total: 22h 59m | Avg: 12m 32s | Max: 43m 01s | Hits:  50%/9480  
  🟩 arm64              Pass: 100%/8   | Total:  1h 00m | Avg:  7m 32s | Max: 18m 19s
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  1h 52m | Avg:  7m 28s | Max: 34m 54s | Hits:  34%/2176  
  🟩 11.8               Pass: 100%/3   | Total:  1h 18m | Avg: 26m 18s | Max: 31m 08s
  🟩 12.5               Pass: 100%/4   | Total:  1h 36m | Avg: 24m 11s | Max: 43m 01s
  🟩 12.6               Pass: 100%/96  | Total: 19h 12m | Avg: 12m 00s | Max: 40m 13s | Hits:  55%/7304  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/12  | Total:  2h 33m | Avg: 12m 45s | Max: 21m 49s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  1h 52m | Avg:  7m 28s | Max: 34m 54s | Hits:  34%/2176  
  🟩 nvcc11.8           Pass: 100%/3   | Total:  1h 18m | Avg: 26m 18s | Max: 31m 08s
  🟩 nvcc12.5           Pass: 100%/4   | Total:  1h 36m | Avg: 24m 11s | Max: 43m 01s
  🟩 nvcc12.6           Pass: 100%/84  | Total: 16h 39m | Avg: 11m 53s | Max: 40m 13s | Hits:  55%/7304  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/12  | Total:  2h 33m | Avg: 12m 45s | Max: 21m 49s
  🟩 nvcc               Pass: 100%/106 | Total: 21h 26m | Avg: 12m 08s | Max: 43m 01s | Hits:  50%/9480  
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total: 51m 51s | Avg:  8m 38s | Max: 29m 54s
  🟩 Clang10            Pass: 100%/3   | Total: 41m 48s | Avg: 13m 56s | Max: 29m 19s
  🟩 Clang11            Pass: 100%/4   | Total:  1h 07m | Avg: 16m 49s | Max: 28m 56s
  🟩 Clang12            Pass: 100%/4   | Total: 20m 49s | Avg:  5m 12s | Max:  5m 39s
  🟩 Clang13            Pass: 100%/4   | Total: 23m 09s | Avg:  5m 47s | Max:  6m 34s
  🟩 Clang14            Pass: 100%/4   | Total:  1h 19m | Avg: 19m 57s | Max: 28m 59s
  🟩 Clang15            Pass: 100%/4   | Total: 58m 10s | Avg: 14m 32s | Max: 28m 01s
  🟩 Clang16            Pass: 100%/4   | Total: 20m 50s | Avg:  5m 12s | Max:  5m 50s
  🟩 Clang17            Pass: 100%/4   | Total: 21m 30s | Avg:  5m 22s | Max:  5m 48s
  🟩 Clang18            Pass: 100%/18  | Total:  3h 17m | Avg: 10m 59s | Max: 21m 49s
  🟩 GCC6               Pass: 100%/2   | Total:  7m 08s | Avg:  3m 34s | Max:  3m 47s
  🟩 GCC7               Pass: 100%/6   | Total: 42m 10s | Avg:  7m 01s | Max: 24m 48s
  🟩 GCC8               Pass: 100%/6   | Total: 21m 24s | Avg:  3m 34s | Max:  4m 21s
  🟩 GCC9               Pass: 100%/6   | Total:  1h 14m | Avg: 12m 29s | Max: 24m 21s
  🟩 GCC10              Pass: 100%/4   | Total: 32m 42s | Avg:  8m 10s | Max: 20m 03s
  🟩 GCC11              Pass: 100%/7   | Total:  1h 59m | Avg: 17m 06s | Max: 31m 08s
  🟩 GCC12              Pass: 100%/4   | Total: 29m 27s | Avg:  7m 21s | Max: 15m 45s
  🟩 GCC13              Pass: 100%/17  | Total:  3h 46m | Avg: 13m 20s | Max: 33m 50s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total:  1h 28m | Avg: 29m 38s | Max: 35m 35s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 34m 54s | Avg: 34m 54s | Max: 34m 54s | Hits:  34%/2176  
  🟩 MSVC14.29          Pass: 100%/2   | Total:  1h 10m | Avg: 35m 12s | Max: 40m 13s | Hits:  31%/4715  
  🟩 MSVC14.39          Pass: 100%/1   | Total: 11m 53s | Avg: 11m 53s | Max: 11m 53s | Hits:  98%/2589  
  🟩 NVHPC24.7          Pass: 100%/4   | Total:  1h 36m | Avg: 24m 11s | Max: 43m 01s
🟩 cxx_family
  🟩 Clang              Pass: 100%/55  | Total:  9h 42m | Avg: 10m 35s | Max: 29m 54s
  🟩 GCC                Pass: 100%/52  | Total:  9h 14m | Avg: 10m 39s | Max: 33m 50s
  🟩 Intel              Pass: 100%/3   | Total:  1h 28m | Avg: 29m 38s | Max: 35m 35s
  🟩 MSVC               Pass: 100%/4   | Total:  1h 57m | Avg: 29m 18s | Max: 40m 13s | Hits:  50%/9480  
  🟩 NVHPC              Pass: 100%/4   | Total:  1h 36m | Avg: 24m 11s | Max: 43m 01s
🟩 gpu
  🟩 v100               Pass: 100%/118 | Total:  1d 00h | Avg: 12m 12s | Max: 43m 01s | Hits:  50%/9480  
🟩 jobs
  🟩 Build              Pass: 100%/110 | Total: 20h 58m | Avg: 11m 26s | Max: 43m 01s | Hits:  50%/9480  
  🟩 NVRTC              Pass: 100%/4   | Total:  2h 00m | Avg: 30m 03s | Max: 33m 50s
  🟩 Test               Pass: 100%/3   | Total: 59m 30s | Avg: 19m 50s | Max: 22m 00s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  2m 12s | Avg:  2m 12s | Max:  2m 12s
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total:  1h 18m | Avg: 26m 18s | Max: 31m 08s
  🟩 90                 Pass: 100%/4   | Total: 43m 50s | Avg: 10m 57s | Max: 12m 45s
  🟩 90a                Pass: 100%/8   | Total:  1h 00m | Avg:  7m 30s | Max: 13m 27s
🟩 std
  🟩 11                 Pass: 100%/32  | Total:  4h 36m | Avg:  8m 37s | Max: 28m 34s
  🟩 14                 Pass: 100%/32  | Total:  6h 51m | Avg: 12m 51s | Max: 35m 52s | Hits:  33%/4455  
  🟩 17                 Pass: 100%/30  | Total:  7h 14m | Avg: 14m 28s | Max: 40m 13s | Hits:  30%/2436  
  🟩 20                 Pass: 100%/23  | Total:  5h 16m | Avg: 13m 44s | Max: 43m 01s | Hits:  98%/2589

🟩 cub: Pass: 100%/110 | Total: 21h 39m | Avg: 11m 49s | Max: 1h 04m | Hits: 65%/2924

🟩 cpu
  🟩 amd64              Pass: 100%/102 | Total: 20h 57m | Avg: 12m 19s | Max:  1h 04m | Hits:  65%/2924  
  🟩 arm64              Pass: 100%/8   | Total: 42m 52s | Avg:  5m 21s | Max:  5m 47s
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  1h 56m | Avg:  7m 46s | Max: 53m 56s | Hits:  65%/731   
  🟩 11.8               Pass: 100%/3   | Total: 15m 26s | Avg:  5m 08s | Max:  5m 11s
  🟩 12.5               Pass: 100%/4   | Total:  4h 00m | Avg:  1h 00m | Max:  1h 04m
  🟩 12.6               Pass: 100%/88  | Total: 15h 27m | Avg: 10m 32s | Max:  1h 04m | Hits:  65%/2193  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/4   | Total: 17m 26s | Avg:  4m 21s | Max:  4m 28s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  1h 56m | Avg:  7m 46s | Max: 53m 56s | Hits:  65%/731   
  🟩 nvcc11.8           Pass: 100%/3   | Total: 15m 26s | Avg:  5m 08s | Max:  5m 11s
  🟩 nvcc12.5           Pass: 100%/4   | Total:  4h 00m | Avg:  1h 00m | Max:  1h 04m
  🟩 nvcc12.6           Pass: 100%/84  | Total: 15h 09m | Avg: 10m 49s | Max:  1h 04m | Hits:  65%/2193  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/4   | Total: 17m 26s | Avg:  4m 21s | Max:  4m 28s
  🟩 nvcc               Pass: 100%/106 | Total: 21h 22m | Avg: 12m 05s | Max:  1h 04m | Hits:  65%/2924  
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total: 33m 01s | Avg:  5m 30s | Max:  7m 01s
  🟩 Clang10            Pass: 100%/3   | Total: 18m 40s | Avg:  6m 13s | Max:  6m 32s
  🟩 Clang11            Pass: 100%/4   | Total: 21m 38s | Avg:  5m 24s | Max:  6m 06s
  🟩 Clang12            Pass: 100%/4   | Total: 21m 25s | Avg:  5m 21s | Max:  5m 43s
  🟩 Clang13            Pass: 100%/4   | Total: 22m 45s | Avg:  5m 41s | Max:  6m 38s
  🟩 Clang14            Pass: 100%/4   | Total: 21m 03s | Avg:  5m 15s | Max:  5m 33s
  🟩 Clang15            Pass: 100%/4   | Total: 22m 36s | Avg:  5m 39s | Max:  6m 17s
  🟩 Clang16            Pass: 100%/4   | Total: 23m 18s | Avg:  5m 49s | Max:  6m 22s
  🟩 Clang17            Pass: 100%/4   | Total: 21m 59s | Avg:  5m 29s | Max:  5m 42s
  🟩 Clang18            Pass: 100%/11  | Total:  1h 39m | Avg:  9m 02s | Max: 34m 46s
  🟩 GCC6               Pass: 100%/2   | Total:  8m 15s | Avg:  4m 07s | Max:  4m 10s
  🟩 GCC7               Pass: 100%/6   | Total: 28m 37s | Avg:  4m 46s | Max:  5m 18s
  🟩 GCC8               Pass: 100%/6   | Total: 30m 11s | Avg:  5m 01s | Max:  5m 38s
  🟩 GCC9               Pass: 100%/6   | Total: 30m 19s | Avg:  5m 03s | Max:  5m 57s
  🟩 GCC10              Pass: 100%/4   | Total: 21m 25s | Avg:  5m 21s | Max:  5m 43s
  🟩 GCC11              Pass: 100%/7   | Total: 38m 00s | Avg:  5m 25s | Max:  6m 06s
  🟩 GCC12              Pass: 100%/4   | Total: 22m 04s | Avg:  5m 31s | Max:  5m 48s
  🟩 GCC13              Pass: 100%/16  | Total:  3h 01m | Avg: 11m 21s | Max: 28m 07s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total:  2h 42m | Avg: 54m 18s | Max: 58m 23s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 53m 56s | Avg: 53m 56s | Max: 53m 56s | Hits:  65%/731   
  🟩 MSVC14.29          Pass: 100%/2   | Total:  1h 52m | Avg: 56m 01s | Max: 57m 17s | Hits:  65%/1462  
  🟩 MSVC14.39          Pass: 100%/1   | Total:  1h 04m | Avg:  1h 04m | Max:  1h 04m | Hits:  65%/731   
  🟩 NVHPC24.7          Pass: 100%/4   | Total:  4h 00m | Avg:  1h 00m | Max:  1h 04m
🟩 cxx_family
  🟩 Clang              Pass: 100%/48  | Total:  5h 05m | Avg:  6m 22s | Max: 34m 46s
  🟩 GCC                Pass: 100%/51  | Total:  6h 00m | Avg:  7m 04s | Max: 28m 07s
  🟩 Intel              Pass: 100%/3   | Total:  2h 42m | Avg: 54m 18s | Max: 58m 23s
  🟩 MSVC               Pass: 100%/4   | Total:  3h 50m | Avg: 57m 30s | Max:  1h 04m | Hits:  65%/2924  
  🟩 NVHPC              Pass: 100%/4   | Total:  4h 00m | Avg:  1h 00m | Max:  1h 04m
🟩 gpu
  🟩 v100               Pass: 100%/110 | Total: 21h 39m | Avg: 11m 49s | Max:  1h 04m | Hits:  65%/2924  
🟩 jobs
  🟩 Build              Pass: 100%/102 | Total: 18h 34m | Avg: 10m 55s | Max:  1h 04m | Hits:  65%/2924  
  🟩 DeviceLaunch       Pass: 100%/1   | Total: 21m 28s | Avg: 21m 28s | Max: 21m 28s
  🟩 GraphCapture       Pass: 100%/1   | Total: 17m 11s | Avg: 17m 11s | Max: 17m 11s
  🟩 HostLaunch         Pass: 100%/3   | Total: 58m 38s | Avg: 19m 32s | Max: 20m 48s
  🟩 TestGPU            Pass: 100%/3   | Total:  1h 27m | Avg: 29m 18s | Max: 34m 46s
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 15m 26s | Avg:  5m 08s | Max:  5m 11s
  🟩 90a                Pass: 100%/4   | Total: 18m 34s | Avg:  4m 38s | Max:  5m 01s
🟩 std
  🟩 11                 Pass: 100%/30  | Total:  4h 41m | Avg:  9m 23s | Max: 56m 29s
  🟩 14                 Pass: 100%/29  | Total:  5h 56m | Avg: 12m 17s | Max:  1h 04m | Hits:  65%/1462  
  🟩 17                 Pass: 100%/27  | Total:  5h 03m | Avg: 11m 14s | Max: 58m 23s | Hits:  65%/731   
  🟩 20                 Pass: 100%/24  | Total:  5h 58m | Avg: 14m 55s | Max:  1h 04m | Hits:  65%/731

🟩 thrust: Pass: 100%/109 | Total: 1d 09h | Avg: 18m 19s | Max: 1h 12m | Hits: 65%/13165

🟩 cpu
  🟩 amd64              Pass: 100%/101 | Total:  1d 08h | Avg: 19m 21s | Max:  1h 12m | Hits:  65%/13165 
  🟩 arm64              Pass: 100%/8   | Total: 41m 14s | Avg:  5m 09s | Max:  5m 37s
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  6h 42m | Avg: 26m 50s | Max:  1h 08m | Hits:  57%/2633  
  🟩 11.8               Pass: 100%/3   | Total:  1h 41m | Avg: 33m 51s | Max: 37m 28s
  🟩 12.5               Pass: 100%/4   | Total:  4h 24m | Avg:  1h 06m | Max:  1h 12m
  🟩 12.6               Pass: 100%/87  | Total: 20h 27m | Avg: 14m 06s | Max:  1h 07m | Hits:  67%/10532 
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/4   | Total: 21m 13s | Avg:  5m 18s | Max:  5m 33s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  6h 42m | Avg: 26m 50s | Max:  1h 08m | Hits:  57%/2633  
  🟩 nvcc11.8           Pass: 100%/3   | Total:  1h 41m | Avg: 33m 51s | Max: 37m 28s
  🟩 nvcc12.5           Pass: 100%/4   | Total:  4h 24m | Avg:  1h 06m | Max:  1h 12m
  🟩 nvcc12.6           Pass: 100%/83  | Total: 20h 06m | Avg: 14m 32s | Max:  1h 07m | Hits:  67%/10532 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/4   | Total: 21m 13s | Avg:  5m 18s | Max:  5m 33s
  🟩 nvcc               Pass: 100%/105 | Total:  1d 08h | Avg: 18m 48s | Max:  1h 12m | Hits:  65%/13165 
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total: 33m 34s | Avg:  5m 35s | Max:  7m 02s
  🟩 Clang10            Pass: 100%/3   | Total: 19m 42s | Avg:  6m 34s | Max:  7m 31s
  🟩 Clang11            Pass: 100%/4   | Total: 22m 06s | Avg:  5m 31s | Max:  5m 59s
  🟩 Clang12            Pass: 100%/4   | Total: 21m 18s | Avg:  5m 19s | Max:  5m 37s
  🟩 Clang13            Pass: 100%/4   | Total: 21m 29s | Avg:  5m 22s | Max:  6m 09s
  🟩 Clang14            Pass: 100%/4   | Total: 21m 48s | Avg:  5m 27s | Max:  5m 52s
  🟩 Clang15            Pass: 100%/4   | Total: 21m 38s | Avg:  5m 24s | Max:  5m 40s
  🟩 Clang16            Pass: 100%/4   | Total: 22m 13s | Avg:  5m 33s | Max:  6m 02s
  🟩 Clang17            Pass: 100%/4   | Total: 21m 26s | Avg:  5m 21s | Max:  5m 53s
  🟩 Clang18            Pass: 100%/11  | Total:  1h 19m | Avg:  7m 12s | Max: 25m 55s
  🟩 GCC6               Pass: 100%/2   | Total: 52m 04s | Avg: 26m 02s | Max: 29m 30s
  🟩 GCC7               Pass: 100%/6   | Total:  2h 29m | Avg: 24m 51s | Max: 33m 10s
  🟩 GCC8               Pass: 100%/6   | Total:  2h 53m | Avg: 28m 54s | Max: 33m 35s
  🟩 GCC9               Pass: 100%/6   | Total:  3h 04m | Avg: 30m 45s | Max: 35m 18s
  🟩 GCC10              Pass: 100%/4   | Total:  2h 03m | Avg: 30m 45s | Max: 33m 27s
  🟩 GCC11              Pass: 100%/7   | Total:  3h 49m | Avg: 32m 44s | Max: 37m 28s
  🟩 GCC12              Pass: 100%/4   | Total: 24m 04s | Avg:  6m 01s | Max:  6m 27s
  🟩 GCC13              Pass: 100%/14  | Total:  1h 35m | Avg:  6m 50s | Max: 16m 12s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total:  2h 19m | Avg: 46m 20s | Max: 50m 52s
  🟩 MSVC14.16          Pass: 100%/1   | Total:  1h 08m | Avg:  1h 08m | Max:  1h 08m | Hits:  57%/2633  
  🟩 MSVC14.29          Pass: 100%/2   | Total:  2h 05m | Avg:  1h 02m | Max:  1h 07m | Hits:  57%/5266  
  🟩 MSVC14.39          Pass: 100%/2   | Total:  1h 22m | Avg: 41m 20s | Max:  1h 01m | Hits:  78%/5266  
  🟩 NVHPC24.7          Pass: 100%/4   | Total:  4h 24m | Avg:  1h 06m | Max:  1h 12m
🟩 cxx_family
  🟩 Clang              Pass: 100%/48  | Total:  4h 44m | Avg:  5m 55s | Max: 25m 55s
  🟩 GCC                Pass: 100%/49  | Total: 17h 11m | Avg: 21m 02s | Max: 37m 28s
  🟩 Intel              Pass: 100%/3   | Total:  2h 19m | Avg: 46m 20s | Max: 50m 52s
  🟩 MSVC               Pass: 100%/5   | Total:  4h 36m | Avg: 55m 23s | Max:  1h 08m | Hits:  65%/13165 
  🟩 NVHPC              Pass: 100%/4   | Total:  4h 24m | Avg:  1h 06m | Max:  1h 12m
🟩 gpu
  🟩 v100               Pass: 100%/109 | Total:  1d 09h | Avg: 18m 19s | Max:  1h 12m | Hits:  65%/13165 
🟩 jobs
  🟩 Build              Pass: 100%/102 | Total:  1d 07h | Avg: 18m 36s | Max:  1h 12m | Hits:  57%/10532 
  🟩 TestCPU            Pass: 100%/4   | Total: 43m 02s | Avg: 10m 45s | Max: 20m 55s | Hits:  99%/2633  
  🟩 TestGPU            Pass: 100%/3   | Total: 54m 57s | Avg: 18m 19s | Max: 25m 55s
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total:  1h 41m | Avg: 33m 51s | Max: 37m 28s
  🟩 90a                Pass: 100%/4   | Total: 19m 41s | Avg:  4m 55s | Max:  5m 23s
🟩 std
  🟩 11                 Pass: 100%/30  | Total:  7h 28m | Avg: 14m 57s | Max: 55m 03s
  🟩 14                 Pass: 100%/29  | Total: 10h 47m | Avg: 22m 19s | Max:  1h 08m | Hits:  57%/5266  
  🟩 17                 Pass: 100%/27  | Total:  9h 10m | Avg: 20m 23s | Max:  1h 12m | Hits:  57%/2633  
  🟩 20                 Pass: 100%/23  | Total:  5h 50m | Avg: 15m 13s | Max:  1h 08m | Hits:  78%/5266

🟩 cudax: Pass: 100%/54 | Total: 4h 57m | Avg: 5m 30s | Max: 21m 13s | Hits: 87%/224

🟩 cpu
  🟩 amd64              Pass: 100%/50  | Total:  4h 42m | Avg:  5m 38s | Max: 21m 13s | Hits:  87%/224   
  🟩 arm64              Pass: 100%/4   | Total: 15m 15s | Avg:  3m 48s | Max:  4m 07s
🟩 ctk
  🟩 12.0               Pass: 100%/19  | Total:  1h 42m | Avg:  5m 23s | Max: 21m 13s | Hits:  87%/112   
  🟩 12.5               Pass: 100%/2   | Total: 14m 35s | Avg:  7m 17s | Max:  7m 20s
  🟩 12.6               Pass: 100%/33  | Total:  3h 00m | Avg:  5m 28s | Max: 20m 55s | Hits:  87%/112   
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/19  | Total:  1h 42m | Avg:  5m 23s | Max: 21m 13s | Hits:  87%/112   
  🟩 nvcc12.5           Pass: 100%/2   | Total: 14m 35s | Avg:  7m 17s | Max:  7m 20s
  🟩 nvcc12.6           Pass: 100%/33  | Total:  3h 00m | Avg:  5m 28s | Max: 20m 55s | Hits:  87%/112   
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/54  | Total:  4h 57m | Avg:  5m 30s | Max: 21m 13s | Hits:  87%/224   
🟩 cxx
  🟩 Clang9             Pass: 100%/2   | Total:  8m 03s | Avg:  4m 01s | Max:  4m 10s
  🟩 Clang10            Pass: 100%/2   | Total:  8m 33s | Avg:  4m 16s | Max:  4m 33s
  🟩 Clang11            Pass: 100%/4   | Total: 15m 10s | Avg:  3m 47s | Max:  4m 06s
  🟩 Clang12            Pass: 100%/4   | Total: 14m 45s | Avg:  3m 41s | Max:  4m 00s
  🟩 Clang13            Pass: 100%/4   | Total: 13m 49s | Avg:  3m 27s | Max:  3m 43s
  🟩 Clang14            Pass: 100%/4   | Total: 30m 29s | Avg:  7m 37s | Max: 19m 02s
  🟩 Clang15            Pass: 100%/2   | Total:  8m 30s | Avg:  4m 15s | Max:  4m 32s
  🟩 Clang16            Pass: 100%/4   | Total: 16m 26s | Avg:  4m 06s | Max:  4m 36s
  🟩 Clang17            Pass: 100%/2   | Total:  8m 46s | Avg:  4m 23s | Max:  4m 25s
  🟩 Clang18            Pass: 100%/2   | Total: 20m 14s | Avg: 10m 07s | Max: 16m 28s
  🟩 GCC9               Pass: 100%/2   | Total:  7m 29s | Avg:  3m 44s | Max:  4m 18s
  🟩 GCC10              Pass: 100%/4   | Total: 16m 00s | Avg:  4m 00s | Max:  4m 53s
  🟩 GCC11              Pass: 100%/4   | Total: 14m 40s | Avg:  3m 40s | Max:  3m 48s
  🟩 GCC12              Pass: 100%/7   | Total:  1h 13m | Avg: 10m 31s | Max: 21m 13s
  🟩 GCC13              Pass: 100%/3   | Total: 10m 59s | Avg:  3m 39s | Max:  4m 07s
  🟩 MSVC14.36          Pass: 100%/1   | Total:  7m 32s | Avg:  7m 32s | Max:  7m 32s | Hits:  87%/112   
  🟩 MSVC14.39          Pass: 100%/1   | Total:  7m 58s | Avg:  7m 58s | Max:  7m 58s | Hits:  87%/112   
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 14m 35s | Avg:  7m 17s | Max:  7m 20s
🟩 cxx_family
  🟩 Clang              Pass: 100%/30  | Total:  2h 24m | Avg:  4m 49s | Max: 19m 02s
  🟩 GCC                Pass: 100%/20  | Total:  2h 02m | Avg:  6m 08s | Max: 21m 13s
  🟩 MSVC               Pass: 100%/2   | Total: 15m 30s | Avg:  7m 45s | Max:  7m 58s | Hits:  87%/224   
  🟩 NVHPC              Pass: 100%/2   | Total: 14m 35s | Avg:  7m 17s | Max:  7m 20s
🟩 gpu
  🟩 v100               Pass: 100%/54  | Total:  4h 57m | Avg:  5m 30s | Max: 21m 13s | Hits:  87%/224   
🟩 jobs
  🟩 Build              Pass: 100%/49  | Total:  3h 21m | Avg:  4m 06s | Max:  7m 58s | Hits:  87%/224   
  🟩 Test               Pass: 100%/5   | Total:  1h 36m | Avg: 19m 12s | Max: 21m 13s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total:  3m 00s | Avg:  3m 00s | Max:  3m 00s
  🟩 90a                Pass: 100%/1   | Total:  3m 10s | Avg:  3m 10s | Max:  3m 10s
🟩 std
  🟩 17                 Pass: 100%/29  | Total:  2h 28m | Avg:  5m 06s | Max: 21m 13s
  🟩 20                 Pass: 100%/25  | Total:  2h 29m | Avg:  5m 58s | Max: 19m 02s | Hits:  87%/224

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 10m 50s | Avg: 5m 25s | Max: 8m 47s

🟩 cpu
  🟩 amd64              Pass: 100%/2   | Total: 10m 50s | Avg:  5m 25s | Max:  8m 47s
🟩 ctk
  🟩 12.6               Pass: 100%/2   | Total: 10m 50s | Avg:  5m 25s | Max:  8m 47s
🟩 cudacxx
  🟩 nvcc12.6           Pass: 100%/2   | Total: 10m 50s | Avg:  5m 25s | Max:  8m 47s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/2   | Total: 10m 50s | Avg:  5m 25s | Max:  8m 47s
🟩 cxx
  🟩 GCC13              Pass: 100%/2   | Total: 10m 50s | Avg:  5m 25s | Max:  8m 47s
🟩 cxx_family
  🟩 GCC                Pass: 100%/2   | Total: 10m 50s | Avg:  5m 25s | Max:  8m 47s
🟩 gpu
  🟩 v100               Pass: 100%/2   | Total: 10m 50s | Avg:  5m 25s | Max:  8m 47s
🟩 jobs
  🟩 Build              Pass: 100%/1   | Total:  2m 03s | Avg:  2m 03s | Max:  2m 03s
  🟩 Test               Pass: 100%/1   | Total:  8m 47s | Avg:  8m 47s | Max:  8m 47s

🟩 python: Pass: 100%/1 | Total: 15m 41s | Avg: 15m 41s | Max: 15m 41s

🟩 cpu
  🟩 amd64              Pass: 100%/1   | Total: 15m 41s | Avg: 15m 41s | Max: 15m 41s
🟩 ctk
  🟩 12.6               Pass: 100%/1   | Total: 15m 41s | Avg: 15m 41s | Max: 15m 41s
🟩 cudacxx
  🟩 nvcc12.6           Pass: 100%/1   | Total: 15m 41s | Avg: 15m 41s | Max: 15m 41s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/1   | Total: 15m 41s | Avg: 15m 41s | Max: 15m 41s
🟩 cxx
  🟩 GCC13              Pass: 100%/1   | Total: 15m 41s | Avg: 15m 41s | Max: 15m 41s
🟩 cxx_family
  🟩 GCC                Pass: 100%/1   | Total: 15m 41s | Avg: 15m 41s | Max: 15m 41s
🟩 gpu
  🟩 v100               Pass: 100%/1   | Total: 15m 41s | Avg: 15m 41s | Max: 15m 41s
🟩 jobs
  🟩 Test               Pass: 100%/1   | Total: 15m 41s | Avg: 15m 41s | Max: 15m 41s

👃 Inspect Changes

Modifications in project?

	Project
	CCCL Infrastructure
+/-	libcu++
	CUB
+/-	Thrust
	CUDA Experimental
	python
	CCCL C Parallel Library
	Catch2Helper

Modifications in project or dependencies?

	Project
	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	python
+/-	CCCL C Parallel Library
+/-	Catch2Helper

🏃‍ Runner counts (total jobs: 394)

#	Runner
326	`linux-amd64-cpu16`
28	`linux-arm64-cpu16`
25	`linux-amd64-gpu-v100-latest-1`
15	`windows-amd64-cpu16`

Fixes: NVIDIA#2485

Error snippets: /root/cccl/libcudacxx/examples/concurrent_hash_table.cu(28): error: namespace "thrust" has no member "universal_raw_memory_resource" typename MemoryResource = thrust::universal_raw_memory_resource> ^ and: /root/cccl/libcudacxx/examples/concurrent_hash_table.cu(188): error: namespace "thrust" has no member "universal_allocator" auto freq = thrust::allocate_unique<table>(thrust::universal_allocator<table>{}, 8); ^ This issue is introduced in PR NVIDIA#2653 and commit d893269.

bernhardmgruber requested review from a team as code owners October 29, 2024 18:57

bernhardmgruber requested review from wmaxey and elstehle October 29, 2024 18:57

bernhardmgruber added the thrust For all items related to Thrust. label Oct 29, 2024

bernhardmgruber commented Oct 29, 2024

View reviewed changes

miscco approved these changes Oct 30, 2024

View reviewed changes

bernhardmgruber force-pushed the host_pinned_vector branch 2 times, most recently from 1ce4a2e to e9c32c6 Compare October 30, 2024 10:41

bernhardmgruber commented Oct 30, 2024

View reviewed changes

This was referenced Oct 30, 2024

Thrust universal_host_pinned_memory_resource's pointer type should probably be a universal_ptr #2659

Closed

[EPIC] Breaking changes for CCCL 3.0 #101

Open

Add thrust::universal_host_pinned_vector

02905b3

Fixes: NVIDIA#2485

bernhardmgruber force-pushed the host_pinned_vector branch from e9c32c6 to 02905b3 Compare October 30, 2024 15:19

bernhardmgruber merged commit d893269 into NVIDIA:main Oct 30, 2024
407 checks passed

bernhardmgruber deleted the host_pinned_vector branch October 30, 2024 17:07

fbusato pushed a commit to fbusato/cccl that referenced this pull request Nov 5, 2024

Add thrust::universal_host_pinned_vector (NVIDIA#2653)

e1b2e85

Fixes: NVIDIA#2485

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Add `thrust::universal_host_pinned_vector` #2653

Add `thrust::universal_host_pinned_vector` #2653

bernhardmgruber commented Oct 29, 2024

bernhardmgruber Oct 29, 2024

bernhardmgruber Oct 29, 2024

bernhardmgruber Oct 30, 2024

bernhardmgruber Oct 30, 2024

github-actions bot commented Oct 30, 2024

🟨 thrust: Pass: 71%/109 | Total: 1d 11h | Avg: 19m 44s | Max: 1h 08m | Hits: 65%/13165

🟩 libcudacxx: Pass: 100%/118 | Total: 1d 00h | Avg: 12m 26s | Max: 43m 31s | Hits: 67%/9468

🟩 cub: Pass: 100%/110 | Total: 1d 20h | Avg: 24m 32s | Max: 1h 06m | Hits: 65%/2924

🟩 cudax: Pass: 100%/54 | Total: 4h 57m | Avg: 5m 31s | Max: 23m 31s | Hits: 88%/224

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 10m 17s | Avg: 5m 08s | Max: 8m 12s

🟩 python: Pass: 100%/1 | Total: 15m 12s | Avg: 15m 12s | Max: 15m 12s

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 394)

github-actions bot commented Oct 30, 2024

🟩 libcudacxx: Pass: 100%/118 | Total: 1d 00h | Avg: 12m 12s | Max: 43m 01s | Hits: 50%/9480

🟩 cub: Pass: 100%/110 | Total: 21h 39m | Avg: 11m 49s | Max: 1h 04m | Hits: 65%/2924

🟩 thrust: Pass: 100%/109 | Total: 1d 09h | Avg: 18m 19s | Max: 1h 12m | Hits: 65%/13165

🟩 cudax: Pass: 100%/54 | Total: 4h 57m | Avg: 5m 30s | Max: 21m 13s | Hits: 87%/224

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 10m 50s | Avg: 5m 25s | Max: 8m 47s

🟩 python: Pass: 100%/1 | Total: 15m 41s | Avg: 15m 41s | Max: 15m 41s

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 394)

Add thrust::universal_host_pinned_vector #2653

Add thrust::universal_host_pinned_vector #2653

Conversation

bernhardmgruber commented Oct 29, 2024

bernhardmgruber Oct 29, 2024

Choose a reason for hiding this comment

bernhardmgruber Oct 29, 2024

Choose a reason for hiding this comment

bernhardmgruber Oct 30, 2024

Choose a reason for hiding this comment

bernhardmgruber Oct 30, 2024

Choose a reason for hiding this comment

github-actions bot commented Oct 30, 2024

🟨 thrust: Pass: 71%/109 | Total: 1d 11h | Avg: 19m 44s | Max: 1h 08m | Hits: 65%/13165

🟩 libcudacxx: Pass: 100%/118 | Total: 1d 00h | Avg: 12m 26s | Max: 43m 31s | Hits: 67%/9468

🟩 cub: Pass: 100%/110 | Total: 1d 20h | Avg: 24m 32s | Max: 1h 06m | Hits: 65%/2924

🟩 cudax: Pass: 100%/54 | Total: 4h 57m | Avg: 5m 31s | Max: 23m 31s | Hits: 88%/224

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 10m 17s | Avg: 5m 08s | Max: 8m 12s

🟩 python: Pass: 100%/1 | Total: 15m 12s | Avg: 15m 12s | Max: 15m 12s

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 394)

github-actions bot commented Oct 30, 2024

🟩 libcudacxx: Pass: 100%/118 | Total: 1d 00h | Avg: 12m 12s | Max: 43m 01s | Hits: 50%/9480

🟩 cub: Pass: 100%/110 | Total: 21h 39m | Avg: 11m 49s | Max: 1h 04m | Hits: 65%/2924

🟩 thrust: Pass: 100%/109 | Total: 1d 09h | Avg: 18m 19s | Max: 1h 12m | Hits: 65%/13165

🟩 cudax: Pass: 100%/54 | Total: 4h 57m | Avg: 5m 30s | Max: 21m 13s | Hits: 87%/224

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 10m 50s | Avg: 5m 25s | Max: 8m 47s

🟩 python: Pass: 100%/1 | Total: 15m 41s | Avg: 15m 41s | Max: 15m 41s

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 394)

Add `thrust::universal_host_pinned_vector` #2653

Add `thrust::universal_host_pinned_vector` #2653