良品率高,但AI质检却陷入“数据饥荒”:一家装备巨头的智能制造新解

成功案例
报道时间:2026-02-12

在高端制造领域,随着硬件精密度的竞争趋于红海,核心竞争力正逐步向软件与算法能力带来的生产效率提升和研发加速方向迁移。


对于这家横跨光伏全产业链、锂电及半导体领域的全球智能装备领军企业而言,他们制造的设备精密程度已达微米级。然而,当他们试图让设备搭载的工业视觉检测(AOI)系统变得更聪明时,却面临着数字化转型中典型的“成长的烦恼”。


这篇案例就是一个关于大型制造集团如何依托和鲸 ModelWhale 数据科学协同平台,解决研发算力瓶颈,并逐步开展前沿技术(AIGC)探索的故事。


17720069982058707.jpeg


算力瓶颈与数据长尾



在引入统一平台之前,该企业的AI研发面临着“算力资源不足”与“缺陷样本获取难”的双重挑战。


算力资源的捉襟见肘


这是一线算法工程师感受最直接的痛点。工业现场环境复杂,工程师需要频繁更新模型以处理误检和漏检。然而,受限于传统的开发模式,工程师往往只能依赖本地工控机或个人电脑中有限的显卡资源进行训练。算力不足直接导致模型迭代周期拉长,难以快速响应一线交付的敏捷需求。


同时,集团下属的晶体生长、半导体装备等多个核心团队曾处于“各自为战”的状态,算力资源缺乏统筹,导致资源利用率不均。


高良率带来的“样本匮乏”


在高端制造场景中,良品率普遍较高,导致特定的瑕疵(如隐裂、细分叉状纹理等)样本非常稀缺,而新缺陷又层出不穷。缺乏足够的“负样本”,使得模型训练面临挑战。工程师们常常面临一个悖论:为了优化模型,必须拥有更多缺陷数据,但实际生产中特定的缺陷又极难复现获取。


一场基础设施驱动的范式革命



依托和鲸 ModelWhale 数据科学协同平台,该企业的 AI Lab 建立了一套标准化的 AI 研发体系,打通了从算力调度、数据生成到模型部署的全链路,发起了一场自下而上的研发范式革命。首先实现的就是将该企业分散在各个子公司的算力资源收拢,形成了集团级的“算力池”。


平台将原本分散在各子公司、各实验室的硬件资源配置成统一的算力资源池,工程师不再受限于本地硬件,而是可以通过平台,根据任务轻重动态申请调用集群中的高性能GPU资源。这不仅解决了算力卡脖子问题,更大幅提升了昂贵硬件的利用率。 


ModelWhale 还解决了复杂的环境配置依赖问题。通过平台镜像功能,新员工或跨团队协作时可一键拉起标准开发环境,无需在本地反复折腾配置,让研发人员能专注于算法本身。


前沿技术探索,用AIGC打破物理样本限制


在稳固的算力底座之上,该企业的AI Lab团队开始利用平台探索更具前瞻性的技术,试图通过技术创新缓解“缺陷样本少”的难题。


工程师们利用平台灵活的开发环境,对 Diffusion(扩散模型) 与 ControlNet 技术进行验证性研究。他们像训练 AI 绘画一样,训练 AI 去“画”出缺陷。通过 ControlNet 精准控制生成的位置和形态,生成大量高质量的、包含特定隐裂特征的虚拟图像。


接下来,这些由 AI 生成的合成数据,被反哺回检测模型中。原本因为样本稀缺而无法收敛的模型,在补充了这些数据后,鲁棒性大幅提升。这项尝试成功合成了大量长尾缺陷数据,解决了制造业“缺数据”的行业级难题。


AIGC制造数据 → 反哺模型训练 → 模型识别能力提升 → 发现更细微的真实缺陷模式 → 进一步优化生成逻辑。制造业“数据匮乏”的经典困境,在最前沿的AI模型的支持下,或将转化为持续创新的燃料。


17720069984067649.jpg

从“单点作战”到“云边协同”的神经系统


解决了数据的“源头活水”,下一步是让智慧流动到生产一线。基于ModelWhale 平台该企业构建了一个高效运转的“云边协同”流水线:


  1. 云端(训练中心):利用集中算力进行大规模的数据处理、模型微调(Model Fine-Tuning)及增量学习,持续优化YOLO等主流检测算法的精度。还针对难以定义的未知缺陷,利用 Anomalib、PatchCore 等框架建立正样本基准模型,尝试摆脱对标注数据的过度依赖,实现无监督异常检测的目标。


  2. 边缘(执行终端):为了适应一线工厂有限的硬件条件,云端训练出的高精度模型会经过“瘦身”手术——利用模型蒸馏与压缩技术(如 yolo_distiller),确保其能高效部署到边缘端的工业相机和工控机中。


这种“云端训练+合成增强→边缘部署→持续迭代”的闭环,有效缩短了现场因环境变化导致模型失效的修复时间。


沉淀面向未来的数字核心资产


这场转型不仅提升了当前的交付效率,更为企业积累了长期的数字资产。


通过平台化运作,顶尖工程师的调参经验、处理逻辑以及对新技术的探索过程,被系统性地沉淀下来,成为可传承的组织资产。不同事业部可以共享同一套技术栈,新人也能站在集体的智慧上快速起跑。


更重要的是,它构筑了面向未来的技术储备能力。依托平台的开放性,企业已开始针对 DeepSeek 等大模型技术及多模态视频理解技术进行预研,为未来向更智能的“工业多模态大模型”转型做好了充分的技术与能力储备。


17720069988332149.jpg


这个故事的终点,并非解决了一个技术难题,而是验证了一条路径:在“人工智能+”的浪潮下,高端制造的真正壁垒,将来自于能否构建一个让数据、算法与人类智慧持续碰撞、自由流动并加速进化的数字生态


从光伏硅片的隐裂检测,到火箭发动机的研发制造,再到风电、新能源等更多制造场景,和鲸“AI+制造”系列案例持续揭示着同一个趋势:制造业的竞争力,正从单一的硬件精度,转向“数据驱动”与“智能迭代”的软硬一体综合能力。 和鲸科技通过ModelWhale数据科学协同平台,正致力于成为这一转型过程中,最可信赖的“能力底座”。


关于和鲸


和鲸科技是国内领先的数据智能科技企业,以“连接数据、算法与人才”为使命,为制造、能源、金融等领域的先进组织,提供覆盖数据科学全流程的协同平台ModelWhale


在“AI+制造”的深水区,和鲸持续助力领军企业将前沿AI技术转化为扎实的生产力与可沉淀的核心资产,共同推动中国智造从“自动化”迈向“智能化”的新阶段。

开启 AI 之旅新篇章,立即体验和鲸 ModelWhale 的云端协作魅力
数以万计的用户正在使用中
电话咨询
商务咨询请致电:
021-8037 0235(转8)
微信咨询
工具使用、办赛需求 欢迎联系我们
新Momo