uiemUI - 简书

发简信

uiemUI

2
关注
4
粉丝
47
文章
13782

字数
18

收获喜欢
3

总资产

IP属地：上海

加油11dd23

旷视分布式、旷视video、滴滴depth、京东可信vision面经（均offer）
旷视分布式一面 transformer加速 O(n2) O(nlogn) all reduce, ring all reduce batchnorm conv+batchn...

306 2 3
MegEngine_Bot

深度学习算子优化-FFT
作者：严健文 | 旷视 MegEngine 架构师背景在数字信号和数字图像领域，对频域的研究是一个重要分支。我们日常“加工”的图像都是像素级，被称为是图像的空域数据。空...

299 0 1
MegEngine_Bot

利用共享内存实现比NCCL更快的集合通信
作者：曹彬 | 旷视 MegEngine 架构师简介从 2080Ti 这一代显卡开始，所有的民用游戏卡都取消了 P2P copy，导致训练速度显著的变慢。针对这种情况下的...

608 0 1
托尼是塔克

滴滴云A100 40G 性能测试 V100陪练！
眼看游戏卡RTX3080 发售在即，我终于等到了滴滴云（感谢）A100的测试机会。因为新卡比较紧张，一直在排队中，直到昨天才拿了半张A100...今天终于上手了单张40G的A...

1705 0 1
JeffreyLi

GCC内联汇编基础
原文作者 Sandeep.S英文原文 [https://www.ibiblio.org/gferg/ldp/GCC-Inline-Assembly-HOWTO.html] 本...

39970 8 41
桂糊涂

译：GCC内联汇编入门
原文： GCC-Inline-Assembly-HOWTO 1. 简介（Introduction.） 1.1 Copyright and License. Copyright...

4526 1 5
uiemUI

NVIDIA GPU SIMT Models
参考博客1[https://developer.nvidia.com/blog/inside-volta/] 参考博客2[https://developer.nvidia.c...

252 0 1
uiemUI

字节跳动日常实习二面凉经
面试岗位：机器学习训练框架实习生周日投的日常实习，周二HR 打电话约了时间，约到周四面试。周四下午四点面试：技术面：首先是自我介绍。然后是问项目，我主要说了用Tenso...

3025 0 1
羽翼深蓝_2387

CUDA入门了解
姓名：王一帆学号：20011110225 转载自https://bbs.csdn.net/topics/390798229 【嵌牛导读】对CUDA入门知识进行简单介绍【...

552 0 1