首页 > 专栏 > 土法炼钢兴趣小组的博客 土法炼钢兴趣小组的博客 共 147 条资讯 【大模型基础设施工程】02:GPU 计算入门——SM、Tensor Core、HBM、NVLink 【大模型基础设施工程】04:互联与网络——NVLink、InfiniBand、RoCE 与国产替代 【大模型基础设施工程】03:CUDA 生态——cuBLAS、cuDNN、NCCL、Triton、CUTLASS 【大模型基础设施工程】17:RAG 工程全景 【大模型基础设施工程】05:训练全景:Pre-train、SFT、RLHF、DPO、蒸馏 【大模型基础设施工程】19:Agent 框架工程 【大模型基础设施工程】10:Checkpoint 与故障容忍 【大模型基础设施工程】09:RLHF 与对齐流水线 【大模型基础设施工程】14:量化工程 —— INT8 / FP8 / FP4 / AWQ / GPTQ 【大模型基础设施工程】11:推理引擎基础 算术编码与 ANS:超越 Huffman 【GPU 算子工程】全景:算子工程在 AI 计算栈的位置 GPU 高性能算子工程 【GPU 算子工程】内存层次:global / L2 / shared / register 的带宽与延迟 【GPU 算子工程】GPU 执行模型:SM、warp、线程层次与 occupancy 【GPU 算子工程】写第一个 CUDA kernel:索引、同步与启动配置 【GPU 算子工程】访存优化:合并访问、bank conflict 与对齐 【GPU 算子工程】Occupancy 与延迟隐藏:寄存器、shared memory 的取舍 【GPU 算子工程】Roofline 模型:判断算子是 compute-bound 还是 memory-bound 【GPU 算子工程】Reduction 与 Scan:warp shuffle、block 级与 grid 级归约 « 上一页123456…8下一页 » 相关分类 #!/slash/note #UNTAG (B)(F)uzzing on my world (Hi)story (IN)SECURE Magazine Notification (gdb) break *0x972 - 带鱼博客 BeltfishBlog - ./kwaa.dev .NET Blog .Trash /home/rook1e 00's Adventure 0kami's Blog 0x41414141 in ?? () 0x7f Blog 0xRick Owned Root ! 0xd00's blog 1 Byte 1A23 Blog 1A23 Studio 1Link.Fun 1stwebdesigner 251 2BAB 的工程博客 2ch中文网 360 CERT 360 Netlab Blog - Network Securi 38号车评中心 3o米的微博 404 Media