大数据分析和云计算领域有以下6个主要项目:
一是“钢包全过程跟踪”项目。
该项目根据多目标优化(MOO)框架和数据分析,采用了包括声学在内的各类传感器,以提高工厂产量、提高钢厂的安全性。项目目标是实现钢厂作业环境中的钢包的自动跟踪,涵盖从炼钢、连铸到板坯交付的全过程。准确跟踪钢包位置是炼钢工艺数字化转型的基础之一。钢包跟踪系统即要在保证平稳生产的条件下,也要确保在生产计划突然受到干扰的异常情况下优化钢包物流,以确保安全并提高产量。
二是“质量4.0”项目。
该项目基于高级人工智能(AI)、机器自学习分析方法和大数据处理,开发自适应平台,允许在线分析大数据流,从而实现产品质量决策并提供量身定制、高可靠性的质量信息。对于欧洲钢铁行业来说,产能过剩导致廉价钢铁充斥着整个钢铁市场,欧洲钢铁生产商迫切需要差异化,积极推广一个通用平台具有战略意义。但是,共享错误的质量信息可能会导致客户的严重不确定性并且损害客户的信心。自适应的“质量4.0”项目平台可以实现整个供应链上质量信息的横向整合,在线分析大数据流,采用机器学习算法的创新方法,建模客户关系并自动交换数据自动匹配可用的客户和订单信息,通过与客户双向交换量身定制的高可靠性信息,以实现差异化的产品质量水准决策并降低成本。
“质量4.0”平台作为面向服务的体系结构(SOA),可以灵活地组合单个模块并集成到现有的IT基础架构中,不需要依赖单个产品或技术。“质量4.0”平台由3个服务模块组成:一是质量数据生成服务模块(QGS),生成质量数据及其合理性值;二是质量分配服务模块(QAS),将客户订单与产品合理分配,并选择相关的质量数据; 三是质量交换服务模块(QXS),交换为每个客户订单编译的选定质量数据。
其中,“质量4.0-QGS”的主要功能是估计所有可用数据源的质量数据,并通过可能值(PV)量化该估计的置信度,以最终保证所提供质量信息的可靠性。可能值的确定可以用一个函数表达。
有效可靠地检测异常质量指标对“质量4.0”项目起着基础性的作用。在整个生产过程中收集的与质量有关的数据可能因检测等各种原因出现异常值。由于离群值的类型和多样性,目前还没有一种公认的方法可以在任何情况下有效可靠地检测异常值。离群值概念的非正式定义涉及其偏离正态性,可分为5类:基于分布、基于深度、基于距离、基于聚类和基于密度。该项目使用了FUCOD算法来检测异常值,该方法结合了现有的4种离群点检测方法,利用模糊推理系统(FIS)对每种方法的贡献进行动态管理,根据处理后的数据挖掘其优点,避免其缺点。FUCOD是为处理多维数据而设计的,这意味着离群值水平的计算不仅要考虑构成质量数据的单个变量的特性,还要考虑它们之间的相互作用。这些特点使得FUCOD方法特别适用于处理大量任务的工业数据集。该方法已成功应用于欧洲钢铁行业。
“质量4.0-QAS”结合质量数据和客户相关知识,实现对产品质量的自适应性监督,可提供估计的质量数据及反映质量数据置信度的专用合理性值,将收到的信息与目标客户的知识相结合,自主分配和交换相关订单的质量数据、编制质量缺陷以创造有价值的信息,并向供应商反馈这些信息。然而,在供应商和客户之间交换相关质量信息的系统必须能理解“相关性”的含义。因此,确定质量信息相关性所需的所有信息都是基于可用的客户信息和订单数据进行语义建模的。这种模型中包含了客户亲密程度,反映了供应商和用户之间的相互信任关系,从而能够合理定义质量信息的类型和数量。
“质量4.0-QXS”根据“质量4.0-QAS”提供的结果,为每个订单分别编译所选的质量数据,并使用标准通信协议交换数据。QXS是唯一可在工厂边界之间访问的服务,并管理“质量4.0”平台之间的质量数据交换,可实现以客户为导向的双向质量数据交换,并通过横向集成建立对产品质量的同步关注。为了确定合适的IT标准并在客户和供应商之间进行质量数据交换,目前已形成的解决方案有:QDX系统、 STEP系统和质量跟踪系统。由于没有适用于质量数据交换的免费标准,因此将在“质量4.0”框架中定义和实施特定的IT标准。
FADI是一个可定制的端到端大数据平台,是一个能够以可移植和可扩展的方式部署和集成的开源工具,也是一个多用户和多参与者(即专业分析师,数据科学家/工程师,IT管理员等)的平台。FADI有5个主要特征:一是收集来自各种数据源的批处理和流数据,二是将数据存储在不同类型的数据存储区中,三是使用ML和 人工智能技术,四是在用户Web界面中可视化和分析数据,五是生成和发布报告。
三是“传感器数据挖掘以提高产品质量”项目。
该项目提出了一个基于大数据、特征提取、机器学习、分析服务器和知识管理的解决方案,以自动分析感测时间序列数据。项目通过开发新的方法和工具,以帮助工厂提高产品质量并降低生产成本,其方法主要是关注3个方面的质量标准:外观、内在质量和机械性能。项目的开发内容一方面包括通过识别质量不良的主要原因,以优化制造过程;另一方面包括快速预报产品质量,以更好地表征产品特性并降低成本。
这些新方法在从大量复杂数据中提取知识,例如,基于相当长一段时间(2年~3年)的和高频(1Hz~10Hz)的、大量参数(数百个)的传感器时间序列,摘出特定信息(例如,平均浇铸速度)用于统计分析。为了自动大量分析这些传感器时间序列数据,该项目提出了围绕5个主轴构建的综合解决方案:

