NoNNus - 简书

发简信

NoNNus

1
关注
24
粉丝
38
文章
27622

字数
24

收获喜欢
3

总资产

IP属地：浙江

NoNNus

Winograd 快速卷积算法原理
Winograd [1][#fn1]于1980 年提出了有限脉冲响应（finite impulse response，FIR）滤波的最小滤波算法最小滤波算法[2][#fn2]...

2080 0 1
NoNNus

ONNX算子：Softplus
Softplus算子获取一个输入数据（张量）并生成一个输出数据（张量），并将Softplus函数应用于张量元素。特性 Softplus可以看作是ReLu的平滑（与ReLU函...

1031 0 1

NoNNus

[TIPS] 实时查看NVIDIA GPU的设备使用情况
如果需要在程序中实时获取nvidia gpu的设备使用率，比如pwr、sm、pclk等信息，可以借用int system(const char *command) [1][#...

1719 0 0
NoNNus

[译文] 为什么GEMM是深度学习的核心 | Why GEMM is at the heart of deep learning
原文：Why GEMM is at the heart of deep learning[https://petewarden.com/2015/04/20/why-gemm...

4699 0 2
NoNNus

[论文笔记] IOS: Inter-Operator Scheduler for CNN Acceleration
IOS: Inter-Operator Scheduler for CNN AccelerationProceedings of the 4 th MLSys Confere...

586 0 1
NoNNus

207. 课程表
题目链接：https://leetcode-cn.com/problems/course-schedule/[https://leetcode-cn.com/problems...

173 0 0
NoNNus

1129. 颜色交替的最短路径
题目链接： https://leetcode-cn.com/problems/shortest-path-with-alternating-colors/[https://l...

182 0 0

NoNNus

ONNX算子：Pad
Pad[1][#fn1] 输入： data 需要填充的张量。 pads 整数张量，表示在待填充张量每个轴的开头和结尾需要添加或删除（如果为负）的填充元素的数量。 mode 填...

3946 0 0
NoNNus

centos7 使用新版的gcc7 - Developer Toolset 7
现在建议，安装gcc8了：https://www.jianshu.com/p/924a510c9e21 centos7自带的gcc和gdb版本都太老了，学习的时候可能会需要使...

云石畅想
17768 2 6
NoNNus

CUDNN入坑指南（0）卷积算法实现类型
cuDNN目前提供以下几种卷积算法的实现方式[1][#fn1] CUDNN_CONVOLUTION_FWD_ALGO_IMPLICIT_GEMM 该实现方式将卷积隐式转换成矩...

1551 0 0
NoNNus

[GCC入坑指南] -fomit-frame-pointer 和 -fno-omit-frame-pointer 编译标识
GCC编译器提供了 -fomit-frame-pointer 和 -fno-omt-frame-pointer 两个相对的编译选项。 GCC手册[1][#fn1]里对 -fo...

8683 0 4
NoNNus

TensorRT8 使用手记（6）性能统计
使用TensorRT进行模型转换及部署主要涉及以下几个性能指标： Throughput 吞吐量单位：qps, QPS, Queries Per Second 表示每秒能够相...

2440 0 0

NoNNus

深度学习编译器入坑指北（Q5）模型量化-PTQ与QAT
训练后量化 Post Training Quantization (PTQ)[1][#fn1] 从预训练模型开始，并使用量化数据集对其进行量化量化数据用来对模型进行量化，其...

3725 0 0
NoNNus

TensorRT8 使用手记（1）模型测试 Conv+BN+Relu 结构融合
在主流卷积神经网络模型中Conv+BN+Relu是一种常见的模型结构。在模型推理和训练中，BN层往往与其他层合并，以减少计算量。模型解析 node_of_325 [TRT]...

8979 0 5
NoNNus

TensorRT8 使用手记（3）维度表示
在TensorRT8中，对张量的维度表示数据结构略有修改。主要是新增了Dims32，原本的Dims现在仅是Dims32的别称。同时废弃了DimsCHW和DimsNCHW[1]...

1146 0 0
NoNNus

TensorRT8 使用手记（2）noexcept 关键字的使用
noexcept 关键字在TensorRT8中，关于API的修改中非常的一点是所有 API 都添加了 noexcept关键字。该关键字告诉编译器，函数中不会发生异常，这有利...

1001 0 0
NoNNus

TensorRT8 使用手记（0）开始
NVIDIA 正式发布TensorRT 8，宣称该软件将语言查询推理时间缩短了一半，使开发者能够从云端到边缘构建全球最佳性能的搜索引擎、广告推荐和聊天机器人。 TensorR...

854 0 0

NoNNus

ONNX算子：ArgMax 和 ArgMin
ONNX协议 ArgMax Computes the indices of the max elements of the input tensor's element al...

1735 0 0
NoNNus

详解 YUV 格式（I420/YUV420/NV12/NV12/YUV422）
详解 YUV 格式（I420/YUV420/NV12/NV12/YUV422） YUV （Y'CbCr）是一种像素格式，常见于视频编码与静态图像。与 RGB 格式（红-绿-蓝...

划水型派大星
20021 0 12
NoNNus

YUV模型：YUV420P和YUV420SP
YUV模型是根据一个亮度(Y分量)和两个色度(UV分量)来定义颜色空间，常见的YUV格式有YUY2、YUYV、YVYU、UYVY、AYUV、Y41P、Y411、Y211、IF...

11989 0 4

个人介绍

大争之世，前路坎坷