出品丨虎嗅智库
头图丨视觉中国
虎嗅2023工业AI大会将于9月7日-8日在中国 · 苏州举办。我们期望促成领先制造企业与科技创新企业的理解、融合与对接,推动工业AI生态发展共识,为我国制造业高质量发展助力。
点击报名:大算力·大数据·大模型——虎嗅2023工业AI大会
围绕虎嗅2023工业AI大会,虎嗅将推出工业制造领域系列内容精选,此篇为第二篇。
以下核心观点和内容来自于虎嗅智库发布的《工业数据采集落地洞察报告》,点击报告名称获取内容。
核心观点:
1.工业数据采集根据不同行业、不同企业业务,其落地侧重点和部署策略均有所不同,不能盲目模仿;
2.落地部署过程中,非技术层面的问题相比技术层面问题更加棘手;
3.工业数据采集应遵循“应采尽采”的原则,但前提是明确自身业务目标范围。
在工业大数据流转全链路中,数据采集是第一步,是进行后续数据处理、分析、计算和应用等环节的基础。数据作为新型生产要素,是工业企业驱动数据智能的“燃料”,而数据采集的工作则是为企业持续补充高质量燃料,助推企业的数字化转型的关键点。
全面性、准确性、及时性和实时性是工业数据应具备的四大特性。企业数字化转型需要围绕数据才能展开,数据采集工作所能实现这四大特性的程度也决定了企业数字化转型成败。
从宏观层面,数据采集能够为企业提供智能化决策的数据依据,优化企业的管理和运营;另一方面,能够在原有的信息化基础之上,把从研发、生产和服务过程中与企业相关的人员、设备、工艺等要素进行更精细化和标准化地梳理,进一步夯实数字化转型工作。
工业数据采集需求的“千人千面”
工业数据采集的工作大致由“数据收集”和“协议解析”两部分构成。
数据收集主要是通过生产设备内置的采集装置、传感器等硬件或工控系统、SCADA等软件系统,将生产作业过程中产生的各类数据采集至设备或系统中;协议解析则是通过对数据采集软硬件内置的数据协议进行解析“翻译”,来请求获取采集上来的数据,并进行传输。
国内工业领域范畴非常广泛,当前对于各个行业的生产自动化、流程自动化或者无人工厂来说,数据采集是刚需。但根据所处行业的不同,不同类型的企业对于数据的业务需求有所差异,所以对数据采集工作的细分需求也会存在侧重点。
从制造业属性来看,通常流程类企业会更加注重采集的工作,离散类企业则更加关注协议解析。
石油化工、钢铁冶金、能源电力等流程类行业,特点是生产线长、业务规模大,产生的数据量非常庞大。企业需要在各个生产环节,从众多设备和各类分布式控制系统中进行数据采集,利用大规模的数据来支持设备的故障排查诊断和智能决策,避免因故障停产。但同时,流程类场景下的数据协议相对单一,故需求更多集中在“数据收集”环节。
对于离散行业来说,企业的设备类型会比较繁杂,采集的方式会比较多,数据采集协议的丰富度很高,数据采集的工作中对协议解析的要求和挑战比较大。企业的业务诉求是需要分别解析适配这些协议,提供数据传输通道来获取不同设备中的数据,以提升生产经营效率,所以离散类企业对数据采集工作的需求更偏向“协议解析”环节。
从企业角度来看,工业数据采集需要根据企业数字化建设程度以及数据采集的应用需求,来进行数据采集方案的调整。
部分企业前期信息化建设不到位,传感器的数量不足,无论是所购设备的功能还是完整性都相对差一些,开展采集工作便会较为困难。关注点这时更多会集中于采集的方式或者数据源本身的质量稳定性、鲁棒性等性能,所以需要加装采集装置或是监控系统,提升数据的采集数量和质量。
一些大型的集团企业通常会遇到采集数据格式标准化方面的阻碍。此类企业在进行数字化转型时,其分/子公司会与不同的专业厂商合作,无论出于怎样的目的或原因,不同厂商的设备所采集到的数据在格式上、精度上或者命名上等方面都会有一些自身的特征。不同的设备协议、不同的数据格式都会严重影响后续的采集质量和数据互通,这时数据格式的标准化将会成为此类企业的建设重点。
而从工业数据采集的应用需求来看,大体上可以分为“看”、“管”、“控”。“看”其实是第一阶段需求,后续基于“看”逐步实现“管”和“控”,三者呈现出逐级递进的关系。不同企业,对于所处的阶段以及当下阶段目的的不同,对数据采集的建设存在不同的侧重点。
非技术性落地问题更难解决
工业数据采集在落地层面会面临两类问题,分别是技术性和非技术性问题。而根据虎嗅智库调研访谈,非技术类的问题往往比技术类问题更难解决。因为技术问题可通过单方面自研解决,而非技术问题涉及到多方的协调沟通,需要在保证现场生产进度的情况下进行施工,难度大、效率低,其中大概有8%的效率会损失在沟通的过程当中。
工业企业在工业数据采集落地过程中需要重点关注以下五点技术层面的问题。
网络规划不合理。一些工厂过往的网络规划不合理,没有为后续做工业数据采集、可视化建设硬件方面的基础。这种情况下,基于硬件改造来获取数据可能会比较困难;
数据采集质量无保障。由于采集现场的网络改造比较困难,在使用无线方案时,现场会因为灰尘和金属摩擦而产生静电,干扰无线信号,进而造成数据的传输质量比较差,产生丢包、断线等问题;另外,设备数据采集接口的数据吞吐、传输速率、稳定性等性能同样需要考量;
设备类型多、协议多。现场不同类型的设备使用的协议数量非常多,很难找到一家厂商去满足所有设备种类、设备品牌的数据采集需求,是行业通病。此外,一些设备比较封闭,可能并没有开放接口API来接触到数据源,或者接口数量不足以满足采集海量数据的需求、接口性能不足以支撑数据采集的条件;
新增传感器会造成对原有系统或硬件设备的影响。新增传感器对采集设备的协议会有适配,但问题在于加装传感器时,可能会影响原有系统或设备的稳定性、可靠性,进而影响数据采集的效率;
现场施工安全问题。现场一些陈旧设备由于长时间暴露在外,物理端口进入了很多粉尘,此情况下如果工程师直接插网线,便可能会因为起静电而导致短路,损坏整个控制器或设备主板。
非技术层面的问题更侧重在施工前中阶段与工厂和现场的沟通协调。在整个数据采集处理的过程中,通常会涉及到一些跨部门的协调,但大家的关注点和侧重点会有所不同。
以典型的工厂为例,有生产科、设备科、IT信息化部门、工艺部、安全环境部,不同部门在数据采集过程中的关注点不一样,所以潜在结果是对于数据的获取、最后价值的评估,大家提供的口径均不一致,会严重影响数据采集的效率。
根据调研结果,工业企业在落地部署中需要注重以下四个非技术层面的问题。
管理层的支持。如果企业自身没有明确的数字化转型战略,或者主管的中高层领导在执行层面不看好,不提供明确的支持的话,无论是内部资源的投入、流程上的配合,都会遇到比较大的阻力,后续即使方案落地,效果也会大打折扣;
协调网络施工。在准备网络施工之前,厂商需要事先与工厂就IP梳理、设备识别、设备清单获取等事项进行沟通。但其中的沟通成本比较高,原因是工厂或企业人员对现场实施过程、顺序以及流程并不了解,很多预备事项没有完成,后续便会牵扯到多方的协调沟通,甚至分责;
协调停机停产。采集数据接入设备时需要临时停机停产,但这对工厂通常是不可接受的,所以事先与现场协调停机的难度非常大。工程师在现场实际接入一台设备通常需要1-2个小时,但加上沟通时间,实际评估一天最多接入2-3台设备,严重影响施工效率;
成本管控。从业务角度来衡量计算数据采集的业务价值和产品服务成本尤为重要,所以在成本上需要进行管控,在成本、效率与质量之间进行取舍平衡。
数据“应采尽采”前提是明确业务目标范围
企业在提出数据采集相关需求时,“应采尽采”是常见需求之一。但实际上数据采集在不同领域、不同业务场景下,没有所谓统一的、客观的、可量化的标准,例如什么类型的传感器应该以什么频次采集多长时间。
理论上数据采集的频率越高、点位越多,工业数据对工业设备的刻画就会越全面,但抛开实际成本与技术能力的限制来要求“应采尽采”是不切实际的。通常来说,数据采集方案需要结合工业企业的数据业务目标、业务诉求、现有数据资产来综合制定。设定好目标范围后,也便于后续项目的验收验证。
在部署数据采集解决方案之前,企业或工厂需要具备一定的硬件基础条件,对接入设备具备一定的认知或知识储备,进行数据资产盘点类的准备工作,来满足方案落地的要求。
1.要明确企业自身的业务状况、关注点和切入点,以及希望通过数据采集实现哪些业务价值,明确数据后续的应用方向;
2.重点要了解硬件的基础,查看施工现场的网络条件,是否需要进行弱电改造和网络施工,来保证数据传输稳定性;
3.对企业现有数据资产进行盘点评估,例如需要接入的设备清单(包含设备的品牌、型号、网口、IP地址等)、现有信息化系统(SCADA、DCS、MES等),同时对这些设备或系统内的数据现状进行梳理;
4.根据生产实际情况进行数据采集链路分析(包含带宽分析、合规性要求等),明确一些定制化需求,最终根据业务方面的考量来形成数据采集方案。
受企业自身业务特性、业务需求、数字化建设路径等因素的影响,定制化在工业领域是绕不开的话题。数据采集定制化主要聚焦于业务系统层面,提供业务逻辑上的支持,最后进行试点部署,但设备协议层面实际上则需要全新的定制化内容。
关于2023虎嗅工业AI我们已确认邀请到阿里云、IDEA研究院、深开鸿、商汤科技、羚羊工业互联网、西门子、阿丘科技、京东方、理想汽车、蜂巢能源、广汽集团、美云智数、伊利等领先企业,数十位行业资深专家。
点击报名:大算力·大数据·大模型——虎嗅2023工业AI大会
诚邀您的参与,立即扫码报名抢购早鸟票,一同探讨工业I新浪潮的最新技术实践与挑战!
大会围绕AI大模型与工业的创新结合、工业机器视觉的精进与应用、工业边缘智能的发展主线、AI开源生态在工业平台的突破等主题展开深入探讨,并具体就汽车与装备制造、3C电子制造、新能源和食饮鞋服制造等行业落地实践案例进行重点分享和研讨。