(本文作者为 邱吉洲聊 AIDC 电源模块,钛媒体经授权发布)
文 | 邱吉洲 (南京能利芯 VP | 专注 AIDC 电源与光互联技术)
光纤缺陷率 5% 到 10%。不是一条产线的数据—— 是整家公司,从光无源器件到光模块,从光通信零组件到子系统,所有产品线共同的痛点。
这个问题存在了数年。从 CTO 到技术总监,从工程到品质,所有人都认为这是人为操作问题—— 光纤又细又长,从 Pigtail 到光模块整个流程根本无法完全自动化,手必然要接触。所以解决方案就是加强培训、让操作员更小心。
后来我花了几个月时间,不是去否定这个前提—— 光纤确实必须人手操作—— 而是重新回答了另一个问题:所有被判定为"缺陷"的痕迹,到底哪些真的会出问题?哪些只是看起来吓人?
当年就帮这家美资光通信上市公司省了 500 到 1000 万。更没想到的是,多年以后,这套分类方法和标准化体系被老同事们带到了整个光通信行业。
一个系统性灾难
先说清楚这到底是个什么问题。
光纤有三层:最内层的 Core(纤芯) 传输光信号,Cladding(包层) 约束光,最外层的 Buffer Coating(涂覆层) 负责保护。Buffer Coating 的材料是聚丙烯酸酯—— 轻、薄、脆弱。
脆弱到什么程度?人的手指甲划过去,就能留下一道痕。

光纤结构示意图

AIDC 数据中心广泛应用的光纤
全球光纤市场的主要参与者包括康宁 (Corning)、古河电工 (Furukawa)、藤仓 (Fujikura) 等。国内方面,长飞光纤 (601869) 是全球最大的光纤预制棒及光纤光缆制造商之一,亨通光电 (600487)、中天科技 (600522)、烽火通信 (600498) 也是光通信产业链的核心企业。这些公司覆盖了从光纤预制棒、拉丝到光缆、光器件的全产业链。
而光纤制造有一个无法绕开的现实:从 Pigtail 组装到镀膜、准直器、隔离器、WDM、光开关、光环行器,直到最后的 Transceiver—— 数十个产品系列、上百道工序,每一道都需要人手接触光纤。光纤又细又长,哪怕盘成圈,操作起来也必须手介入。你想做全自动化?在那个年代的工艺条件下,做不到。
一旦光纤被判定为"缺陷",只有一个结局:报废。没有返修,没有降级使用。整根报废。
而这 5% 到 10% 的报废率,横跨了几十个产品系列—— 每一个环节都在为它买单。
从光纤器件到光模块到子系统,所有人都认为:这就是人为操作问题
这个问题不是没人管。恰恰相反,全公司都在管—— 管得越来越狠。
为什么所有人都觉得是人为操作?因为在当时的条件下,这个判断逻辑上站得住脚:
第一,光纤确实是人手在操作的。手工工序太多,接触不可避免。这是物理事实。
第二,一个更深层的担忧—— 也是推动报废标准越来越严的真正原因—— 大家真心相信:哪怕现在看起来只是一道轻微的皮伤或皮裂,随着时间推移、温度变化和机械应力,这个微小的损伤会逐步扩展、恶化,最终导致整个 Coating 层脱落、包层裸露,造成可靠性的灾难性失效。
基于这个假设,逻辑链条是这样的:人手必然接触光纤 → 接触必然产生痕迹 → 痕迹必然扩展恶化 → 最终必然导致可靠性失效。在这个逻辑链里,"加强培训让操作员更小心"是唯一能做的事。
于是各产品车间层层加码。目检不够上 20 倍显微镜,20 倍不够上 40 倍—— 任何微小的表面痕迹都可以被判废。检验成本飙升,lead time 无限拉长,而报废率依然没人敢算清楚。
更根本的问题是:没有人有一套成型的标准化体系来系统性地处理这件事。对光纤缺陷的管理,全公司上下只有一条规则——"有痕就判"。粗糙,但没有人知道更好的做法。
一件"不是我的事"
当时我的本职是下游产品的产品工程师,兼元器件工厂的系统工程师。按常理说,我只要把下游的检验标准加严,确保从我这里出去的产品不出问题,把压力传回上游就行了。
但那个时间点,我看着每个车间都在"20 倍不够就 40 倍"地往上加码,看着报废品堆得越来越多,心里越来越不舒服。我跟自己说了一句话:
这不是一个部门的事。这是一件值得有人站出来管的事。
然后我就去管了。
第一步:统一语言— 定义问题
第一件事,不是查资料、不是拉数据—— 是去梳理"语言"。
走访各个车间的时候,我发现了一个比报废率更根本的问题:同样一道痕迹,在 A 车间叫"光纤破皮",在 B 车间叫"光纤皮伤",在 C 车间叫"光纤皮裂"。不同的人、不同的线、不同的经理,看到同一个东西,描述完全不同。
我把所有车间关于光纤缺陷的描述词全部收集起来,梳理分类,去掉重复和模糊的说法,归成几大类。每一类有统一的名称、统一的定义、统一的图示。
这不是咬文嚼字。如果连"这是什么问题"都没有共识,后面所有的讨论都是在打空气。
第二步:不是所有缺陷都一样—— 分类体系
统一语言之后,真正的工作才开始。我对不同类别的缺陷,逐一做了三件事:
第一,溯源成因—— 这道痕迹是在哪个工序、因为什么原因产生的?是操作动作不可避免的正常接触,还是夹具设计不合理刮出来的,还是走线路径本身有问题?
第二,判断严重性—— 这种损伤对光纤性能与长期可靠性到底有没有影响?
第三,匹配方案—— 如果确实有风险,该改的是标准,是工艺,还是管理?如果没有风险,为什么还要报废?
拆完之后,真相浮出来了:
第一类缺陷:Buffer Coating 表面轻微划伤—— 皮裂、皮伤、轻微掉皮,但包层 (Cladding) 完好无损,没有裸露。
这是最多的一类。在 40 倍显微镜下看得一清二楚,很吓人。溯源发现,其中相当一部分就是 Fiber handling 过程中无意刮擦造成的—— 聚丙烯酸酯的脆弱程度决定了这类接触痕迹几乎无法根除。
但关键问题是:它会恶化吗?全公司最深的恐惧就是—— 这些微小的表面损伤,会不会随时间扩展,最终导致整个 Coating 层脱落?
从光纤结构及每一层结构的材料及功能用第一性原理进行分析,Buffer Coating 的损伤应该不会造成光纤的功能性损伤的。

我知道自己在公司人微言轻。我需要一个外界的声音。所以我直接发邮件联系了他们的 Specialist,并跟他们探讨 Buffer Coating 表面损伤,在长期使用中会不会扩展并导致可靠性失效的问题。
Corning 的专家给出了明确的结论:Typical Buffer Coating defect 不会随时间扩展恶化。聚丙烯酸酯涂层对光纤性能的保护,并不依赖于表面的完整性。这些研究 Corning 自己做过了一些研究的。

康宁单模光纤轴
这意味着什么?意味着全公司过去几年报废标准所依赖的核心假设——"Buffer Coating defect 会扩展并最终导致失效"—— 是错的。这不是一个"降低标准"的问题,这是一个根本性的认知纠偏。
在这个科学依据的基础上,我们对这类缺陷光纤逐批做了拉力试验和高温高湿 (85°C/85%RH) 可靠性实验,跑了 1000 小时。结果与 Corning 的结论完全一致:插损不变,反射不变,断纤率不变。
结论:这一类缺陷不影响光纤的性能和长期可靠性。可以被接受。
第二类缺陷:包层裸露,或 Coating 脱落导致玻璃纤维直接暴露。
这一类确实有风险。但往下追溯成因发现,它也不是简单的"操作员不小心"。很多时候,是特定工序的夹具夹持位置不对、力度未校准,是光纤在某个工位上的走线路径存在不合理的设计。
这一类不能接受—— 但它的解决方案不是在惩罚层面加码,不是在培训上反复说教。而是在工艺层面和管理层面做改进:优化夹具设计、调整走线路径、标准化关键参数。
还有一类介于两者之间的——Coating 有较深的划伤但未到包层,且处于后续要经历高应力工序的位置。这一类需要根据缺陷的具体位置和最终应用场景,分级判定。
三类的核心逻辑是同一句话:不同类别,不同成因,不同风险等级,不同处理方式。一刀切地"有痕就判",不是一个标准—— 是一个偷懒。
三类问题,三种逻辑,三套方案。三张牌全摊开之后,所有人都能看到:过去几年那一刀切的"有痕就判",判对了多少、判错了多少、漏了多少。
第三步:两件事并行
分类体系建立之后,接下来的不是"改标准"一件事,是两件事并行:
一、对不影响可靠性的轻微 Buffer Coating 损伤—— 停止判废。
这不是"降低标准"。这是基于 Corning 的材料科学结论和本公司可靠性实验数据,纠正一个长期存在的错误假设。在一个错误的标准上越查越严——20 倍不够上 40 倍—— 不是在提升质量,是在加速浪费。
二、对真正有风险的缺陷—— 改工艺,改管理。
既然光纤的手工操作不可避免,既然无条件追求"零接触"不切实际,那就要接受这个物理前提,然后在这个前提下建立一套有据可依的标准化体系:哪些工序是高风险点、夹具参数怎么设、走线路径怎么排、检验标准怎么定。操作员本身不是问题的根源,没有成型的标准化体系才是。
两件事同时做:不该报废的不报废,该优化的去优化。一个做减法,一个做加法。
第四步:拉联盟,推落地
方案有了,但真正难的是让整个公司接受这个分类逻辑。我当时的职位和资历不足以让技术体系听从我的判断。
Corning 的科学结论帮我解决了第一道坎—— 这不是一个下游产品工程师的主观看法,这是行业最权威的材料科学判断。内部没有人能在技术上推翻它。
第二道坎,我拉上了品质工程、制造部门及市场技术部门的核心成员,成立了跨职能项目小组。把"你部门的问题"和"我部门的问题",变成"我们一起解决的问题"。人是需要同盟的—— 不是技术上需要,是在推动组织变革的时候需要。
结果:省了 500 到 1000 万,但不止于此
新体系推行之后,当年的光纤相关报废大幅下降。第一类轻微损伤不再判废,第二类真风险通过工艺和管理改进消除,第三类中间态按分级标准逐案判定。可制造性、合理性和可靠性第一次被同时纳入了一套框架。一年节省的成本在 500 万到 1000 万之间。
更长远的影响是:多年以后,参与过这个项目的同事们去了光通信行业的各个角落—— 有人做技术负责人,有人做品质经理,有人做了厂长—— 他们把这套缺陷分类方法、判定标准、以及对应的工艺标准化体系带到了新公司。带到了同行,带到了上下游。
如今,这套方法的影子,已经散布在整个光通信行业里了。
这件事教会我的四样东西
第一,挑战一个共识之前,先确认它背后隐藏的假设是什么。
所有人都说"这是人为操作问题"—— 这句话本身没错,光纤确实是手在操作。真正的问题是藏在后面的假设:"人为操作产生的痕迹一定会扩展并导致失效。"而从第一性原理进行材料功能分析,这个假设不成立。找到那个隐藏的假设,然后问它到底对不对—— 这是破局的关键。
第二,把问题分类,比找答案更重要。
把一团乱麻拆成几类—— 每一类有自己的成因、自己的风险、自己的方案—— 你才能知道该打哪里、该放哪里。一刀切的"有压痕就判"不是标准,是偷懒。
第三,在无法消除人为因素的领域,标准化体系比"加强培训"管用一百倍。
如果手工操作是不可避免的,那你的工作不是要求操作员变成机器人—— 是在这个前提下建立一套科学的标准。工具怎么设计、参数怎么设定、检验怎么判定,把对人的依赖降到最低。
第四,推动组织变革需要两样东西:外部的权威影响,和内部的同盟。
Corning 的结论是"权威"层面的保障,没人能和你争。品质工程及制造和市场技术核心的结盟是"推动"层面的保障,没人孤立你。缺一个,事情都落不了地。

DMAIC 方法论
最后
你不需要在光通信行业工作,也能从这件事里借鉴有用的东西。
如果你在公司里看到一个老问题,所有人都认定了原因,解决方案也很明确—— 但你隐隐觉得,那个"原因"背后藏着一个从未被验证过的假设。如果你的职位和资历看起来不够格去挑战。
想一想这件事。
全公司从 CTO、技术总监、品质总监到工厂管理管理人员及工程技术人员一致认定的逻辑链条,里面可能有一个环节是错的。而找到那个环节的人,未必是级别最高的。往往是最想解决问题的那个。
本文侧重于方法论而不是行业分析。
更多精彩内容,关注钛媒体微信号 (ID:taimeiti),或者下载钛媒体 App
