从DeepSeek看大模型软硬件优化

阅读 138 格式 pdf 大小 6.27 MB 共17页2025-02-26 15:38:37发布于浙江
从DeepSeek看大模型软硬件优化戴国浩上海交通大学副教授无问芯穹联合创始人缘起后训练~8页模型架构~5页系统架构~11页预训练Liu,Aixin,etal."Deepseek-v3technicalreport."arXiv~7页preprintarXiv:2412.19437(2024).GuohaoDai@ShanghaiJiaoTongUniversityPage2评价——DeepSeek论文GuohaoDai@ShanghaiJiaoTongUniversity什么是CUDA?什么是PTX?🤔Page3PTX和CUDA是什么TritonLanguageTritonIRTritonGPUIRLinalgLLVMIRCPUs、加速器SYCLPTXHSAIntelNVIDIAAMDPage4https://developer.download.nvidia.com/compute/cuda/docs/CUDA_Architecture_Overview.pdfGuohaoDai@ShanghaiJiaoTongUniversity优化方向Ø底层优化•算法、模型、硬件确定,优化软件•例子:通信优化、内存优化Ø协同优化•同时优化算法、模型、软件、...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

发表评论取消回复

参与评论可获取积分奖励  
嘿牛投研
结合工作实务分享各行业优质研报,一起洞见研报里的趋势、机会和热点。

文档

66456

收藏

13

店铺

企业店铺
广告位不存在!
确认删除?
VIP会员服务
限时9折优惠