使用机器学习从传感器数据中预测故障

4
我将要进行一个研究项目,其中涉及使用从传感器获得的时间数据来预测发动机即将发生故障的情况。该数据基本上包含多个月内各种嵌入式传感器每10分钟的读数。这样的数据可用于大约100个或更多不同的单元(所有均为相同的发动机型号),以及故障发生时间。
虽然我对机器学习有一定的了解,但我在处理此问题时还是很困惑。我已经完成了一些涉及静态数据集(使用SVM、神经网络、逻辑回归等)甚至一项关于预测时间序列的项目。但这是完全不同的。虽然该项目涉及时间数据,但它几乎不涉及预测未来值。相反,它是关于顺序时间数据的异常检测案例。
请问您能否提供一些我如何处理此类问题的想法? 我对神经网络/深度学习特别感兴趣,因此任何有关在该任务中使用它们的想法也将受到欢迎。我更喜欢使用Python或R,尽管如果有专门针对这种任务的其他语言,我也会考虑使用它。 此外,您能否给出一些正式术语,以便我可以搜索相关文献?
谢谢

只是一个想法:如何使用神经网络对一组传感器数据进行分类,以确定在某个(预定的)时间间隔d内,在时间t + d之前引擎是否会发生故障? - beaker
@beaker 是的,那将是完美的,但我该如何解决这个问题?像使用什么神经网络?如何让神经网络学习不同的传感器数据流,然后指示在接下来的一小时左右有很高的故障可能性?您知道有关解决此类问题的论文、文章或教程吗? 我遇到的主要问题是我无法分类它是什么样的问题。它肯定不是静态异常问题,也不是时间序列预测问题。谢谢 - user3046045
@user3046045,你找到解决问题的方法了吗?请分享一下。 - GeorgeOfTheRF
1个回答

5
作为一般性建议,尽可能将您所知道的有关物理系统的所有内容表达出来,并在推理中使用该模型。我在博士论文中处理过这样的问题:通过分布式信任网络实现工程系统的统一预测和诊断(参见第6章)。如果您提供有关您的问题领域的其他详细信息,我可以提供更多信息。
不要期望一般的机器学习模型(神经网络、SVM等)能够为您找出问题结构。拥有正确形式的模型比拥有通用模型和大量数据更重要——这是我经验的总结。

谢谢您的评论和链接。我一定会仔细阅读。关于“拥有正确的模型形式”,我还没有完全理解您的观点。 - user3046045
关于这个项目,我有一个大型的Excel表格,每个发动机单元都有一个。其中一个表格包含不同传感器读数(如温度、电压水平等)的时间数据。因此有100个这样的Excel表格。另外还有一个主表,其中包含了引擎出现故障的时间(无论是什么原因)。目标是利用数据构建一个实时监测系统,可以在未来一小时内提前预警故障。 - user3046045
关于模型,深入了解引擎的复杂性真的很重要吗?我的意思是,如果我正在使用神经网络,它不会通过学习训练数据自行建模引擎故障模型吗?坦白地说,我对引擎并不了解太多,我只是把这个作为一个数据科学项目来做。 - user3046045
@user3046045 尽量在整体模型中建立尽可能多的结构,然后确定您没有任何先前信息的部分。对于这些部分,建立一个神经网络模型。您可能会有几个黑匣子模型,每个模型处理整体模型的不同部分。请记住,当输入超出训练数据范围时,黑匣子模型可能会产生非物理输出,这种情况往往会经常发生。您需要一个能够尽可能外推到以前未见过的输入的模型,并且需要利用先前的信息。 - Robert Dodier
好的,但我不确定如何将某些数据标记为失败数据或正常工作数据。我有大约50个传感器流,5分钟分辨率长达5年的数据。在这5年期间,在某个时间点(或可能是2-3个时间点),该部件已经损坏。我有大约100个这样的单位的数据。从这里我该怎么办呢?我需要进行特征提取吗?我能否直接将这些原始数据馈入适用于时间序列的某些学习算法中,例如循环神经网络(RNNs)? - user3046045
显示剩余7条评论

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接