Deeplearning4j - 入门视频

DeepLearning4J（DL4J）是一套基于Java语言的神经网络工具包，可以构建、定型和部署神经网络。DL4J与Hadoop和Spark集成，支持分布式CPU和GPU，为商业环境（而非研究工具目的）所设计。Skymind是DL4J的商业支持机构。

Deeplearning4j拥有先进的技术，以即插即用为目标，通过更多预设的使用，避免多余的配置，让非企业也能够进行快速的原型制作。DL4J同时可以规模化定制。DL4J遵循Apache 2.0许可协议，一切以其为基础的衍生作品均属于衍生作品的作者。

因为Deeplearning4j的资料较少，而且并无国内的视频资料。

因此个人录制了一套Deeplearning4j的入门级视频，目前视频上传在 Bilibili，无广告大家看起来也方便：

所有代码示例均放置在github上面，地址为：https://github.com/sjsdfg/dl4j-tutorials

希望各位如果觉得可以，可以为我的项目点一个star。

本视频并不会讲授很深的东西，主要目的还是为大家熟悉一些框架的基本操作以及官方文档如何阅读。实现一个更加平滑入门的一个目的

强化学习 RL4j

参考资料：

简书文章：https://www.jianshu.com/p/4d7f23395e92
gitee代码：https://gitee.com/re6g3y/DL4J-with-LIBGDX

小车寻路

dl4j概览

调参

lesson1 nd4j基础操作

参考资料：

lesson2 简易线性回归

参考资料：

lesson3 简易数据分类

参考资料：

lesson4 Minst手写数字分类

参考资料：

lesson5 模型保存与读取

参考资料：

lesson6 Minst手写数字模型改进-CNN

参考资料：

在使用 GPU 加速之前请务必确认一下几点：

电脑是否为 英伟达 GPU，即 GTX 系列，使用 AMD 显卡无法使用 GPU 加速
电脑是否安装了 cuda ，如果安装了 cuda 请确认安装的 cuda 版本和你 pom 中引入的 nd4j.backend 版本是否对应
电脑安装 cuda 之后请确保你的 IDE 已经感知到环境变量的变化，在 IDE 中的 terminal 使用 nvcc -V 命令查看。如不确定直接重启电脑即可

以下为 GPU 安装和使用教程：

如想确定 DeepLearning4j 已经支持的 cuda 和 cudnn 的配套版本，请打开如下链接：

Using Deeplearning4j with cuDNN ：搜索 CUDA Version 字眼

lesson7 RNN循环神经网络

参考资料

理解LSTM网络：https://www.jianshu.com/p/9dc9f41f0b29
循环网络和LSTM教程：https://deeplearning4j.org/cn/recurrentnetwork
DL4J中的循环网络：https://deeplearning4j.org/cn/usingrnns
DeepLearning4j: LSTM Network Example

ObjectDetection 目标检测

参考资料：

DeepLearning4j-使用Java训练YOLO模型
Java构建汽车无人驾驶：汽车目标检测
基于深度学习的目标检测技术演进：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD
【中文】Yolo v1全面深度解读目标检测论文
【中文】Mask R-CNN 深度解读与源码解析目标检测物体检测 RCNN object detection 语义分割
目标检测自定义数据集：https://pan.baidu.com/s/1u5yYv5SmK_vgd1zq1PsteQ
<div align="center"> <img src="https://upload-images.jianshu.io/upload_images/2137832-f04063fbdfdaab6e.jpg?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240" /> </div>

tensorflow 导入tf模型

参考资料：

https://blog.csdn.net/u011669700/article/details/80025161

baidudianshi 百度点石比赛 baseline demo

参考资料：

比赛地址：http://dianshi.baidu.com/dianshi/pc/competition/22/rule
防止比赛结束，数据寻回链接：https://pan.baidu.com/s/1_M0yPejFTvxDFOn4780OPA
Baseline 0.83 得分模型：https://pan.baidu.com/s/1i-v02HnMPQwjtm32fPp67A （已经保存 Updater 信息，可用于增量训练）
内存管理官方文档：https://deeplearning4j.org/docs/latest/deeplearning4j-config-memory
迁移学习官方文档：https://deeplearning4j.org/docs/latest/deeplearning4j-nn-transfer-learning
迁移学习推荐阅读博客：https://blog.csdn.net/wangongxi/article/details/75127131
早停法训练模型官方文档：https://deeplearning4j.org/docs/latest/deeplearning4j-nn-early-stopping
百度点石-“探寻地球密码”天宫数据利用大赛.md
百度点石-“探寻地球密码”天宫数据利用大赛.pdf

模型训练早停法

1. 创建 ModelSaver

用于在模型训练过程中，指定最好模型保存的位置：

InMemoryModelSaver：用于保存到内存中
LocalFileModelSaver：用于保存到本地目录中，只能保存 MultiLayerNetwork 类型的网络结果
LocalFileGraphSaver：用于保存到本地目录中，只能保存 ComputationGraph 类型的网络结果

2. 配置早停法训练配置项

epochTerminationConditions：训练结束条件
evaluateEveryNEpochs：训练多少个epoch 来进行一次模型评估
scoreCalculator：模型评估分数的计算者
- org.deeplearning4j.earlystopping.scorecalc.RegressionScoreCalculator 用于回归的分数计算
- ClassificationScoreCalculator 用于分类任务的分数计算
modelSaver：模型的存储位置
iterationTerminationConditions：在每一次迭代的时候用于控制

3. 获取早停法信息

//Conduct early stopping training:
EarlyStoppingResult result = trainer.fit();
System.out.println("Termination reason: " + result.getTerminationReason());
System.out.println("Termination details: " + result.getTerminationDetails());
System.out.println("Total epochs: " + result.getTotalEpochs());
System.out.println("Best epoch number: " + result.getBestModelEpoch());
System.out.println("Score at best epoch: " + result.getBestModelScore());

//Print score vs. epoch
Map<Integer,Double> scoreVsEpoch = result.getScoreVsEpoch();
List<Integer> list = new ArrayList<>(scoreVsEpoch.keySet());
Collections.sort(list);
System.out.println("Score vs. Epoch:");
for( Integer i : list){
    System.out.println(i + "\t" + scoreVsEpoch.get(i));
}

迁移学习

1. 获取原有的网络结构

 // 构造数据模型
ZooModel zooModel = VGG16.builder().build();
ComputationGraph vgg16 = (ComputationGraph) zooModel.initPretrained();

2. 修改模型的训练部分超参数

updater
学习率
随机数种子：用于模型的复现

 FineTuneConfiguration fineTuneConf = new FineTuneConfiguration.Builder()
                .updater(new Nesterovs(0.1, 0.9))
                .seed(123)
                .build();

3. 修改网络架构

3.1 setFeatureExtractor

用于指定那个层以下为非 frozen 层，非冻结层。

3.2 结构更改

一般只有不同网络层之间才会出现 shape 异常：需要根据异常信息调整我们的网络层结构和参数
removeVertexKeepConnections 和 addLayer 或者是 addVertex 进行网络结构的更改

自定义网络层实现GRU

参考资料：

https://github.com/Gerry-Pan/pan-dl4j

根据GRU前向公式推导反向公式，并在dl4j中实现。

JStarCraft

群友 @HongZhaoHua 实现

JStarCraft Core：JStarCraft Core是一个面向对象的轻量级框架,遵循Apache 2.0协议。
JStarCraft AI：JStarCraft AI是一个机器学习的轻量级框架.遵循Apache 2.0协议.
JStarCraft Recommendation：JStarCraft Recommendation是一个面向推荐系统的轻量级引擎.遵循Apache 2.0协议。JStarCraft Recommendation引擎基于JStarCraft AI框架重构了所有LibRec引擎的推荐算法。

机器学习算法底层均使用 Nd4j 实现。代码可以参考迁移到使用 dl4j 框架的代码中。

作者	洪钊桦
E-mail	110399057@qq.com, jstarcraft@gmail.com

整合DL4J训练模型与Web工程

参考资料：

博文地址：https://my.oschina.net/u/1778239/blog/1648854
源码地址：https://gitee.com/lxkm/dl4j-demo/tree/master/digitalrecognition

【深度学习】图像矫正、dl4j yolo和tesseract ocr

参考资料：

视频地址：https://tianchi.aliyun.com/forum/videoStream.html#postsId=5312
视频代码所在github：https://github.com/awaymeet/tesseract

人脸识别 - FaceRecognition

参考资料：

Deeplearning4j 实现 Attention

参考资料：

GAN

GAN 使用 MNIST 实例。群友 @城枫林和 @liweigu 提供
gan_deeplearning4j

自制AI图像搜索引擎

群友 @射水鱼攥写了一本使用 DeepLearning4j 实现的《自制AI图像搜索引擎》

按章节详细讲述了图像搜索引擎各主要组成部分的原理和实现，并在最后一章带领大家使用DL4J从零开始逐步构建了一个基于深度学习的Web图像搜索引擎，使读者能够更透彻地理解图像检索的理论并具有独立地实现一个在线图像搜索引擎的实际能力。每章都在对相关理论和方法进行阐述的同时，使用基于Java语言的实现代码和详实的代码注释来对相关理论和方法进行复述。

书籍地址：https://www.epubit.com/book/detail/30316
源码地址：https://box.lenovo.com/l/LHh2vR 密码: 1aaa

<dependency>
    <groupId>be.tarsos</groupId>
    <artifactId>TarsosLSH</artifactId>
    <version>${tarsosLSH.version}</version>
</dependency>

如果导入项目中有依赖缺失，下载以下 jar 包：

TarsosLSH-0.9 下载地址提取码：88qv
TarsosLSH github地址，也可以自行编译

使用 <scope> system </scope>进行本地的 jar 包导入，或者使用以下命令安装在本地的 maven 仓库中：

mvn install:install-file -Dfile=/path/to/jar -DgroupId=be.tarsos -DartifactId=TarsosLSH -Dversion=0.9 -Dpackaging=jar

强化学习 RL4j

参考资料：

简书文章：https://www.jianshu.com/p/4d7f23395e92
gitee代码：https://gitee.com/re6g3y/DL4J-with-LIBGDX

Deeplearning4j 经典开源项目

ScalphaGoZero:An independent implementation of DeepMind's AlphaGoZero in Scala, using Deeplearning4J (DL4J 实现阿尔法狗)
https://github.com/tahaemara/yolo-custom-object-detector : 使用 YOLO 检测实时检测自定义数据集 - 魔方
https://github.com/mccorby/PhotoLabeller : 安卓客户端实现分布式训练。使用 Kotlin 实现
https://github.com/tahaemara/real-time-sudoku-solver : 使用 dl4j 解决数独
https://github.com/kaiwaehner/kafka-streams-machine-learning-examples : kafka 流训练
https://github.com/fra82/textdigester : dl4j 实现文档总结

获取最新的Deeplearning4j(Snapshots And Daily Builds)

参考资料：

https://deeplearning4j.org/docs/latest/deeplearning4j-config-snapshots

配置 pom.xml 文件

<repositories>
    <repository>
        <id>snapshots-repo</id>
        <url>https://oss.sonatype.org/content/repositories/snapshots</url>
        <releases>
            <enabled>false</enabled>
        </releases>
        <snapshots>
            <enabled>true</enabled>
            <updatePolicy>daily</updatePolicy>  <!-- Optional, update daily -->
        </snapshots>
    </repository>
</repositories>

自动获取 skymind 所提供的 jar 包编译更新

Spark 读取数据

ok, so there's 2 ways
(a) use SparkContext.parallelize (that's a standard spark op) - easy but bad performance (all preprocessing happens on master)
(b) write a better data pipeline that does the proper reading + conversion in parallel

额外资源

机器学习高质量数据集大合辑
中文开放聊天语料整理
gitxiv:只提供有复现开源代码的论文
hadoop-winutils：提供 hadoop 工具在 windows 平台下的 hadoop.dll和winutils.exe。便于 windows 下运行 spark-local 模式
深度学习理论与实战：提高篇

Deeplearning4j - 入门视频

Deeplearning4j - 入门视频

强化学习 RL4j

dl4j概览

调参

lesson1 nd4j基础操作

lesson2 简易线性回归

lesson3 简易数据分类

lesson4 Minst手写数字分类

lesson5 模型保存与读取

lesson6 Minst手写数字模型改进-CNN

lesson7 RNN循环神经网络

ObjectDetection 目标检测

tensorflow 导入tf模型

baidudianshi 百度点石比赛 baseline demo

模型训练早停法

1. 创建 ModelSaver

2. 配置早停法训练配置项

3. 获取早停法信息

迁移学习

1. 获取原有的网络结构

2. 修改模型的训练部分超参数

3. 修改网络架构

3.1 setFeatureExtractor

3.2 结构更改

自定义网络层实现GRU

JStarCraft

整合DL4J训练模型与Web工程

【深度学习】图像矫正、dl4j yolo和tesseract ocr

人脸识别 - FaceRecognition

推荐系统 - Recommend

Deeplearning4j 实现 Attention

GAN

自制AI图像搜索引擎

强化学习 RL4j

Deeplearning4j 经典开源项目

获取最新的Deeplearning4j(Snapshots And Daily Builds)

Spark 读取数据

额外资源

推荐阅读更多精彩内容