ggml-cuda : add TQ2_0 kernels, for ternary inference on GPU #18222

Run time

Learn about OS pricing on GitHub Actions

Job	Run time
macOS-latest-cmake-arm64	12m 30s
macOS-latest-cmake-x64	5m 34s
ubuntu-22-cmake-vulkan	12m 26s
ubuntu-latest-cmake	3m 25s
ubuntu-latest-cmake-rpc	2m 22s
ubuntu-latest-cmake-sanitizer (ADDRESS, Debug)	2m 47s
ubuntu-latest-cmake-sanitizer (ADDRESS, Release)	2m 47s
ubuntu-latest-cmake-sanitizer (THREAD, Debug)	5m 3s
ubuntu-latest-cmake-sanitizer (THREAD, Release)	3m 49s
ubuntu-latest-cmake-sanitizer (UNDEFINED, Debug)	2m 59s
ubuntu-latest-cmake-sanitizer (UNDEFINED, Release)	2m 46s
android-build	8m 4s
ios-xcode-build	2m 6s
macOS-latest-cmake	12m 7s
macOS-latest-cmake-ios	2m 59s
macOS-latest-cmake-tvos	2m 18s
macOS-latest-swift (generic/platform=macOS)	2m 13s
ubuntu-22-cmake-hip	19m 38s
macOS-latest-swift (generic/platform=iOS)	3m 40s
ubuntu-22-cmake-musa	12m 26s
ubuntu-22-cmake-sycl	4m 53s
macOS-latest-swift (generic/platform=tvOS)	3m 14s
ubuntu-22-cmake-sycl-fp16	4m 42s
ubuntu-latest-cmake-cuda	12m 7s
windows-2019-cmake-cuda (12.4, cuda)	41m 54s
windows-2019-cmake-cuda (11.7, cuda)	37m 29s
windows-latest-cmake (noavx-x64, -DGGML_NATIVE=OFF -DLLAMA_BUILD_SERVER=ON -DGGML_RPC=ON -DGGML_A...	4m 44s
windows-latest-cmake (avx2-x64, -DGGML_NATIVE=OFF -DLLAMA_BUILD_SERVER=ON -DGGML_RPC=ON)	5m 11s
windows-latest-cmake-hip	30m 2s
windows-latest-cmake (avx-x64, -DGGML_NATIVE=OFF -DLLAMA_BUILD_SERVER=ON -DGGML_RPC=ON -DGGML_AVX...	4m 40s
windows-latest-cmake (avx512-x64, -DGGML_NATIVE=OFF -DLLAMA_BUILD_SERVER=ON -DGGML_RPC=ON -DGGML_...	6m 47s
windows-latest-cmake-sycl	13m 48s
windows-latest-cmake (openblas-x64, -DGGML_NATIVE=OFF -DLLAMA_BUILD_SERVER=ON -DGGML_RPC=ON -DGGM...	5m 47s
windows-latest-cmake (kompute-x64, -DGGML_NATIVE=OFF -DLLAMA_BUILD_SERVER=ON -DGGML_RPC=ON -DGGML...	6m 9s
windows-msys2 (UCRT64, ucrt-x86_64, Release)	5m 6s
windows-latest-cmake (vulkan-x64, -DGGML_NATIVE=OFF -DLLAMA_BUILD_SERVER=ON -DGGML_RPC=ON -DGGML_...	5m 52s
windows-msys2 (CLANG64, clang-x86_64, Release)	4m 49s
windows-latest-cmake (llvm-arm64, -G "Ninja Multi-Config" -D CMAKE_TOOLCHAIN_FILE=cmake/arm64-win...	2m 58s
windows-latest-cmake (msvc-arm64, -G "Ninja Multi-Config" -D CMAKE_TOOLCHAIN_FILE=cmake/arm64-win...	2m 53s
windows-latest-cmake (llvm-arm64-opencl-adreno, -G "Ninja Multi-Config" -D CMAKE_TOOLCHAIN_FILE=c...	3m 51s
windows-latest-cmake-hip-release	0s
release	0s
	5h 28m 55s

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

ggml-cuda : add TQ2_0 kernels, for ternary inference on GPU #18222

Usage

ggml-cuda : add TQ2_0 kernels, for ternary inference on GPU #18222

Jobs

Run details

Run time