- Дискретное косинусное преобразование на CUDA. Быстрое двумерное ДКП на GPU. Быстрое косинусное преобразование. Двумерное обратное косинусное преобразование. CUDA DCT. SUPER FAST DCT.

бенчмарки Fastvideo SDKДвумерное дискретное косинусное преобразование на CUDA

Задача по реализации двумерного дискретного косинусного преобразования является составной частью алгоритмов, связанных с быстрым сжатием и шумоподавлением при обработке изображений. Программное обеспечение для CPU делает такие вычисления довольно медленно даже при оптимальной многопоточной реализации, поэтому для решения этой задачи мы использовали видеокарты NVIDIA с технологией CUDA. Мы сделали параллельную и оптимизированную реализацию алгоритма ДКП, что позволило получить очень высокое быстродействие.

Конфигурация компьютера и ОС

  • Для тестирования программного обеспечения использовалась такая конфигурация компьютера: ASUS P6T Deluxe V2, Core i7-4770 3.6 GHz, DDR-III 8 GB
  • Видеокарты для вычислений: GeForce GTX 980
  • Операционная система Windows-7, 32-бит, CUDA 6.5

дискретное косинусное преобразование на CUDAРезультаты тестирования алгоритма быстрого двумерного ДКП на видеокарте NVIDIA GeForce GTX 980

Мы получили следующие результаты для времени выполнения алгоритма ДКП для монохромного 8-битного или цветного 24-битного изображения с разрешением 3840 х 2160 (4К), где время загрузки изображений и выгрузки результатов не включено в представленные данные (преобразование RGB->YCbCr, разбиение на блоки 8х8 и прореживание включены в алгоритм дискретного косинусного преобразования):

  • 8-битное серое изображение - 160 мкс
  • 24-битное изображение, формат 4:2:0 - 340 мкс
  • 24-битное изображение, формат 4:2:2 - 380 мкс
  • 24-битное изображение, формат 4:4:4 - 470 мкс

Форма для отправки запроса

Эта форма сохраняет имя и адрес электронной почты.