NVIDIA CUDA Toolkit for Mac v10.2.93

2024-03-28發(fā)布者:zhangliang大?。?/span> 下載:0

文件大小:

軟件介紹

NVIDIA CUDA Toolkit for Mac是Mac平臺上一款提供了創(chuàng)建高性能的GPU加速應(yīng)用程序的開發(fā)環(huán)境。借助CUDA Toolkit,您可以在GPU加速的嵌入式系統(tǒng),臺式機(jī)工作站,企業(yè)數(shù)據(jù)中心,基于云的平臺和HPC超級計算機(jī)上開發(fā),優(yōu)化和部署應(yīng)用程序。該工具包包括GPU加速庫,調(diào)試和優(yōu)化工具,C / C ++編譯器以及用于部署應(yīng)用程序的運(yùn)行時庫。

GPU加速的CUDA庫支持跨多個領(lǐng)域的加速插入,例如線性代數(shù),圖像和視頻處理,深度學(xué)習(xí)和圖形分析。為了開發(fā)自定義算法,可以將可用的集成與常用的語言和數(shù)字包以及發(fā)布良好的開發(fā)API結(jié)合使用。您的CUDA應(yīng)用程序可以部署在本地和云中GPU實例上可用的所有NVIDIA GPU系列中。利用內(nèi)置的功能在多GPU配置之間分配計算,科學(xué)家和研究人員可以開發(fā)從單個GPU工作站擴(kuò)展到具有數(shù)千個GPU的云安裝的應(yīng)用程序。

NVIDIA CUDA Toolkit for Mac功能特點(diǎn):
GPU時間戳:開始時間戳
方法:GPU方法名稱。這是內(nèi)存副本的“ memcpy *”或GPU內(nèi)核的名稱。內(nèi)存副本的后綴描述了內(nèi)存?zhèn)鬏數(shù)念愋?,例如?memcpyDToHasync”表示從設(shè)備內(nèi)存到主機(jī)內(nèi)存的異步傳輸
GPU時間:這是該方法在GPU上的執(zhí)行時間
CPU時間:啟動該方法所需的GPU時間和CPU開銷之和。在驅(qū)動程序生成的數(shù)據(jù)級別,CPU時間只是啟動非阻塞方法的CPU開銷;對于阻塞方法,它是GPU時間和CPU開銷的總和。默認(rèn)情況下,所有內(nèi)核啟動都是非阻塞的。但是,如果啟用了探查器計數(shù)器,則內(nèi)核啟動將被阻止。不同流中的異步內(nèi)存復(fù)制請求是非阻塞的
流ID:流的標(biāo)識號
僅適用于內(nèi)核方法的列
占用率:占用率是每個多處理器的活動扭曲數(shù)與最大活動扭曲數(shù)之比。
探查器計數(shù)器:請參閱探查器計數(shù)器部分以獲取支持的計數(shù)器列表
網(wǎng)格大?。貉豖,Y和Z維度的網(wǎng)格中的塊數(shù)在單列中顯示為[num_blocks_X num_blocks_Y num_blocks_Z]
塊大?。貉豖,Y和Z維度的塊中的線程數(shù)在單列中顯示為[num_threads_X num_threads_Y num_threads_Z]
dyn smem每塊:每塊動態(tài)共享內(nèi)存大?。ㄒ宰止?jié)為單位)
每塊sta smem:每塊的靜態(tài)共享內(nèi)存大小(以字節(jié)為單位)
每個線程的reg:每個線程的寄存器數(shù)
僅用于記憶復(fù)制方法的列
mem傳輸大?。簝?nèi)存?zhèn)鬏敶笮。ㄒ宰止?jié)為單位)
主機(jī)內(nèi)存?zhèn)鬏旑愋停褐付▋?nèi)存?zhèn)鬏斒褂谩翱煞猪摗边€是“頁面鎖定”內(nèi)存

軟件截圖

查看安裝過程

image.png

發(fā)表評論(共0條評論)
請自覺遵守互聯(lián)網(wǎng)相關(guān)政策法規(guī),評論內(nèi)容只代表網(wǎng)友觀點(diǎn),發(fā)表審核后顯示!

版權(quán)聲明:

1 本站所有資源(含游戲)均是軟件作者、開發(fā)商投稿,任何涉及商業(yè)盈利目的均不得使用,否則產(chǎn)生的一切后果將由您自己承擔(dān)!

2 本站將不對任何資源負(fù)法律責(zé)任,所有資源請在下載后24小時內(nèi)刪除。

3 若有關(guān)在線投稿、無法下載等問題,請與本站客服人員聯(lián)系。

4 如侵犯了您的版權(quán)、商標(biāo)等,請立刻聯(lián)系我們并具體說明情況后,本站將盡快處理刪除,聯(lián)系QQ:2499894784

返回頂部