深度学习应用系统分析:应用组合和形态矩阵找到正确路径

镁客 8年前 (2016-11-28)

对深度学习研究和应用的兴趣从未这么热过。深度学习最迷人的地方是,神经网络似乎能够解决以前只能用定制方法解决的各种问题。

深度学习应用系统分析:应用组合和形态矩阵找到正确路径

【导读】本文收录了arXiv.org上关于深度学习的一些最新的研究论文,列出了这些文章的内容,包括“深度学习八大灵感应用”、“深度学习用例”、“科学与工程中的深度学习应用”、“深度学习应用程序的下一次浪潮”等。针对这些文章缺乏系统方法的问题,提出了具体的组合矩阵、形态矩阵解决方案,并给出了预测示例。

隐藏的潜力

对深度学习研究和应用的兴趣从未这么热过。几乎每天都可以在arXiv.org找到无数的新研究论文。这些论文为我们描述了新的方法,人工神经网络可以靠这些方法应用于我们日常生活的各个领域。深度学习最迷人的地方是,神经网络似乎能够解决以前只能用定制方法解决的各种问题。

此外,每天都会出现新的文章或博客,告诉我们更多奇特的应用深度学习的方式。这些文章、博客甚至书籍的问题是,它们不对神经网络应用程序进行系统性的处理。至少到目前为止,我还没有看到有人这么做。如果你知道有人这么做过,请告诉我。

最先进的方法

在搜索这篇文章的材料时,我发现了一些总结深度学习应用程序的文章。下面是来自那些文章的许多引用与相关链接。

1.第一篇文章是 Jason Brownlee 发表的深度学习八大灵感应用”,来自博客 Machine Learning Mastery。

下面是这些应用的列表:

1. 黑白图像的着色。

2. 添加声音到无声电影。

3. 自动机器翻译。

4. 照片中的对象分类。

5. 自动手写生成。

6. 字符文本生成。

7. 图像字幕生成。

8. 自动游戏。

正如上表所列的,这些应用都可以归到听觉、视觉和空间这几种感觉模态,这些模态也是人工智能研究最初得到应用的地方。

2 ,第二篇文章名为“深度学习用例”,来自专门用于Java的Deeplearning4j 机器学习库网站。

深度学习应用系统分析:应用组合和形态矩阵找到正确路径

和上一篇一样,我们可以将这里的所有应用程序归类为听觉,视觉和空间三种模态。其实并不存在空间模态,但出于一般性的考虑,我用“空间模态”来指代对序列的处理。

3 下一篇是为John Murphy的“科学与工程中的深度学习应用”。本文介绍了和前面几篇类似的深度学习应用,但也提供了另外一些奇特的应用,例如科学实验设计、高能物理和药物发现方面的应用。

4.此外,我想提及“深度学习应用程序的下一次浪潮”这篇文章。文中充满各种最奇异的、你可能闻所未闻的应用程序。例如:天气预报和事件检测、用于脑癌检测的神经网络。

5,最后一篇文章来自 Quora,是关于深度学习应用程序的一组问答。

上面所有这些文章缺乏的是系统方法。这种系统方法不仅描述深度学习的当前应用,而且能够预测未来的可能应用。

组合矩阵

我建议使用组合矩阵:所有当前的深度学习应用程序可以从矩阵中推导出来,该矩阵还具有提示未来应用程序的优点。

在该矩阵中,每一行和每一列都枚举出了各种类型的感觉模态,这样,我们可以在矩阵中找到任意两个感觉模态配对后的选项对,例如,语音 - 图像识别便是一个这样的选项对。矩阵中的每一个选项对都可以根据当前或未来可能的深度学习应用来解释。

深度学习应用系统分析:应用组合和形态矩阵找到正确路径

预测示例

如果我们看第4行、第B列,将找到来自音频模态的“语音识别器 - >语音生成器”选项对,这可以被解释为从语言到语言的翻译应用,例如Google翻译。此外,如果我们选择第6行,第D列,将找到“图像识别器 - >图像生成器”,这正是arXiv.org上的深度卷积逆向图形网络论文背后的想法。

可以看出,该矩阵中的可能选项对的总数是 12 *(12-1)= 132。一般而言,选项对总数为 N *(N-1)。

如果我们想要构思一个新的应用程序,我们可以系统性地遍历矩阵并寻找新的选项对,或选择一个随机的选项对,例如第4行和第H列,将得到“图像识别器 - >自然语言生成器”。它可能是这样一个应用:读取对着手机摄像头说话的人的唇语,并生成文本发送到另一应用。当身处嘈杂环境时,这个应用程序会很有用。(想法来自这链接)。

注意,我这样组织这个矩阵,只是为了举例子方便。也可以用其他方式来组织矩阵,那样就会产生其他的深度学习应用的可能组合。此外,该矩阵可以是多维的,以便考虑各种参数组合。

形态矩阵

尝试预测深度学习应用的另外一种方法是,使用由加州理工学院的瑞士天体物理学家 Fritz Zwicky 开发的形态矩阵法。顺便说一句,这种方法已经成功地用于预测中子星的存在。在瑞典形态学学会的网站上,可以找到关于形态矩阵及其应用的详细解释。现在,我们只需知道,该矩阵是以这样的方式构成:其第一行具有各种感觉模态,例如听觉,视觉,触觉等,其余的行则为这些模态提供可能的选项。下面的屏幕截图将有助于澄清这一点。

深度学习应用系统分析:应用组合和形态矩阵找到正确路径

预测示例

既然我们有了形态矩阵,我们就可以把深度学习应用看作一个模态选项的集合。例如,当我们从表格中锁定“语音识别/生成和图像识别”这个选项后,我们就可以理解 2016年11用 16日刚刚提交到 arXiv.org 的《在野外环境读取唇语》这篇最新的深度学习应用论文的本质。

请注意,此矩阵可以以其他方式组合,以产生深度学习可能应用的不同组合。

结论

正如本文所示,通过组合和形态矩阵来系统地寻找深度学习以及一般意义上的机器学习应用,这是可能和有效的。

【编者按】本文转自新智元。文章来源:gettocode,作者:Andrei Cheremskoy。编译:朱焕

最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!

镁客网


科技 | 人文 | 行业

微信ID:im2maker
长按识别二维码关注

硬科技产业媒体

关注技术驱动创新

分享到