AI Edge：AI击败42名皮肤科医生的小组 | 美国国防部开始投资AI以及机器人 | 首先是ResNets，然后是DenseNets，现在... SparseNets ...

From Import AI

结果小D干了一期，就在成田机场出意外，航班取消，于是这期又是一个人来😂。

如有错误请见谅。

AI击败了42名皮肤科医生的小组，发现特定皮肤疾病的症状：

R-CNN +大量的数据胜过数百年历史的综合医学教育...

科学家收集了指甲和脚趾甲照片的大型医学级数据集，并用它来训练神经网络，结果比专家小组能更好地区分甲癣症状。该方法依赖于由微软研究所最初开发的对象分类器faster R-CNN (GitHub)，以及resnet-152模型（也是由微软研究所开发）的卷积神经网络。

这又是一个有力的证据表明，只要给予足够的数据和计算，就可以在特定任务上（至少是感知方面）设计出可以匹配或超过人类能力的系统。

结果：他们用获得的神经网络综合地与不同技能的不同人进行了对比，从护士到临床医生，再到皮肤科专家教授。在所有情况下，基于AI的网络都能够匹配或超过大部分专家。他们写道：“只有一位皮肤科医生的表现要好于用A1数据集训练的集成模型，而且三次实验中只有一次。“

未来：人工智能在医疗用例方面的前景之一是：可以大大降低初步分析一组特定症状的成本。而这个实验支持这一观点，除了收集数据集和开发AI技术外，科学家们还开发了一个基于网络和智能手机的平台来收集和分类更多的医疗数据。他们写道：“这项研究的结果表明，本研究中开发的CNNs和智能手机平台可能在远程医疗请款下非常有用，在这种情况下很难直接接触皮肤科医生。“

美国国防部开始投资AI以及机器人：

...新的美国国防战略备忘录提到AI ...

美国新的国防战略呼吁美国政府“广泛投资军事应用的自动化、人工智能和机器学习，包括商业应用的快速突破”。

这次总结还提到人工智能和其他技术令人不安的两面性。 “安全环境也受到技术的快速发展和战争性质变化的影响。开发新技术的驱动力是无情的，快速扩展更多人进入门槛降低，而且进步的速度也越来越快。新技术包括先进计算技术、”大数据“分析、人工智能、自动化、机器人、导能、超音速和生物技术 - 这些技术确保我们能够战胜并赢得未来的战争。“

阅读更多：2018年美国国防战略摘要（PDF）

来自Fast.ai的迁移学习语言建模技术大餐：

...校准，校准，校准...
与Fast.AI和Aylient公司的研究人员发布了微调语言模型（Fine-tuned
Language Models FitLaM）的细节，FitLaM是一组迁移学习方法，用于优化给定域的语言模型。本文与DeepMind近期的“彩虹（Rainbow）”算法类似，在两个例子中，研究人员在分别的领域（分别是语言建模和强化学习）整合了一系列最近的创新成果，创造出“又大又好”模型，取得了较好的任务表现。

结果：FitLaM模型在五个不同的文本分类任务上取得了最好的成绩，在大多数数据集中减少了18％到24％的错误。

如何工作：FitLaM模型由一个RNN和一个或多个任务特定的线性层组成，还有一个调节技术，可以在网络的较高层中操纵更多的数据，而深度更少，帮助保存从通用语言模型收集到的信息。随着这一点，作者开发了一堆不同的技术，以进一步促进迁移，详细请读论文。

迁移学习：为了辅助转移学习，研究人员在大型文本语料库上预先训练语言模型 - 在这种情况下，Wikitext包含超过约28,000个预处理过的维基百科文章。他们使用的其他技术包括重训练期间神经网络层的“逐步解冻”，使用余弦退火(cosine annealing)进行微调以及使用逆向退火(reverse annealing)。

测试的领域：情感分析（两个单独的数据集），问题分类，主题分类（两个数据集）。
- 更多：Fine-tuned language models for text classification(Arxiv)

Google收购了的Kaggle为在线编程提供了免费的GPU：

...免费GPUS，只要加点小代码...

谷歌表示，Colaboratory（有点像Jupyter Notebook和Google Doc混合起来的编码），不给用户提供免费GPU。但从谷歌公司Michael Piatek的一条评论来看，用户可以编写一些代码片段，在这里详细介绍，可以访问两个带有13GB内存的vCPU，以及一块NVIDIA K80 GPU。

访问Colaboratory。

首先是ResNets，然后是DenseNets，现在... SparseNets？
研究人员以一种奇怪的方式将网络连接起来，然后就获得了目前最好表现...

神经网络可以看作是对不同数据集进行操作，并找出将它们连接在一起的转换的机器。研究人员已经开发出了方法（ResNets和DenseNets）来识别不同的细化特征从而区分视觉现象，同时确保尽可能多的信息可以从网络的一层传播到另一层。

现在，西蒙弗雷泽大学的研究人员已经尝试从ResNets和DenseNets中获得最好的特征，并将它们综合到SparseNets中：“聚合前一层的特征：每一层只从具有指数偏移的层提取特征... CIFAR-10和CIFAR-100数据集上的实验结果表明，SparseNets能够与当前最好模型相媲美，并且参数显着减少。“，他们写道。

节俭的网络：那么，以这种方式构建网络的动机是什么呢？这就是说，如果你可以在不增加太多参数的情况下扩大网络的规模，那么你就能最终能够利用这个在未来建立更大的网络。用SparseNet进行的实验表明，像这样构建的网络可以获得类似于由ResNet和DenseNets获得的精确度，而参数数量却远远减少。

用神经网络增强数据质量：

中国研究人员尝试通过AI来扩展数据生成...
苏州大学，阿里巴巴集团，深圳高威机器人有限公司和黑龙江大学的研究人员已经开发出一套系统，通过生成低质量的数据并通过对抗训练来提高其质量，从而提高中文命名实体识别（NER）的性能。 NER是系统用来发现句子的关键部分以及如何链接到更广的世界知识的技术。提高了的NER方法倾向于快速转化为面向消费者的或面向监控的AI系统，如个人助理或用于分析大量言语的数据库。

技术：研究人员使用大量标注人员标记特定的数据集，如对话和电子商务中的数据集，并使用各种基于神经网络的系统来分析在各自分配的特定文本上，每个人应用的不同NER标签之间的共性和差异。由此产生的系统能够以比其他系统更高的精度进行分类。

中国研究人员收集行人追踪数据集，并评估其中九个人：

...喂，等一下。看啥看就你呢，浑身冒光两只手暖暖的家伙！

中国研究人员选择了60个用红外热像仪拍摄的视频，编成了一个数据集，用来评估热红外行人跟踪（TIR）技术。

数据集：60个热量序列包含来自各种设备（监控摄像机，手持摄像机，车载摄像头，无人驾驶飞机）的素材，可以混合使用不同比例的场景，摄像头位置和视频视角。
追踪评估：研究人员评估九个不同的行人的追踪器，实现不同的方法，从支持向量机，相关和回归过滤器，深度学习方法（系统：HDT和MCFTS）。 SRDCF - a spatially regularized discriminative correlation filter(PDF) - 是明显的胜利者，在一系列不同的测试中获得最可靠的高分。

令人惊讶深度学习方法：神经网络方法（HDT和MCFTS）也享有相当一致的高排名。他们写道：“我们建议，如果有足够的热像数据用于训练，那么基于深度特征的追踪器就有可能获得更好的性能。“

昂贵的计算：深度学习方法看起来相当无效率，DL系统（HDT和MCFTS）在部署在具有1080 NVIDIA GPU和32GB RAM的Intel PC上时分别达到10.60和4.73FPS的速度。而SRDCF得到了12.29FPS。