韩国:数据中心火灾导致政府瘫痪
韩国大邱国家数据中心电池房火灾导致数百个数字政府服务中断。此次事件由锂离子电池爆炸引发,提出对关键基础设施的容错性与冗余性的质疑。
事件摘要
周五晚间,2025年9月26日(KST),在国家数据中心发生了大火。 National Information Resources Service (NIRS) in Daejeon 一场大火爆发在国家数据中心。原因是数据处理区锂离子电池的爆炸。NIRS是韩国政府的核心IT支柱,承载着数百个行政和专业流程的云服务器和网络,包括身份证与护照服务、支付和政府门户等。火灾导致647个政府系统无法使用,其中436个公共在线服务和211个内部网络。约100人被疏散,1人受轻伤。强烈的热量在无窗IT楼层使灭火工作受阻,导致服务器需要关闭。到周末,647个受影响系统中有551个逐步重新启动,96个系统直接受损。总统李在明宣布将采取更高的安全性与冗余措施,并批评缺乏应急计划。目标是为关键程序建立一个双系统架构。
技术分析
数据中心的直接供电由所谓的 USV-Systeme (Uninterruptible Power Supply) 现代 UPS 系统常使用锂离子电池,紧凑且能量密度高。然而,在发生故障或过热时,存在连锁反应的风险,被称为 Thermal Runaway, 会释放出火焰和有毒气体。 NFPA 855 规范对这类电池房的布置、分离和能量边界,以限制火灾负荷及扩散。数据中心领域的专业论文多年来一直强调需要对锂离子电池制定新的保护概念,从早期预警传感到房间分区。关于被破坏电池组的数量的报道在384至386之间波动。爆炸的确切技术原因——是制造缺陷、维护不善、BMS 问题,还是多种因素的组合——仍在进行调查。
Quelle: YouTube
专业讲座解释热失控发展的四个阶段,并展示电池房内可能的早期预警与保护措施。
Quelle: YouTube
对话对数据中心中电池代码、传感器以及灭火方案进行了务实的解读。

Quelle: justrite.com
一块正在燃烧的锂离子电池,是数据中心潜在的火灾原因。
背景与反应
此次事件发生在中秋节假日前的敏感阶段,在这个时期,运输、支付和身份证处理尤为繁忙,增加了政治与公众的关注。大量关键系统集中在一个地点提高了易受干扰性;政府承认集中化加剧了形势。这一案件让人想起在 SK C&C 数据中心发生的一起事件。 Kakao-Ausfall im Jahr 2022, 在 SK C&C 数据中心发生的一起电池房火灾导致全国范围的服务瘫痪,并加剧了对数据中心锂离子风险的讨论。国际上对高负载下 UPS 设备事件的报道日增,推动行业采用更好的保护与早期预警概念。对 Daejeon 的确切诱因的调查正在进行中;与 LG Energy Solution 的部件之间可能存在关联,然而公司因正在进行调查而不予置评。总统李敦促提高安全性、增加预算并为行政信息系统建立一个冗余的双系统,并批评缺乏应急计划。总理公开道歉并宣布如延长期限等救济措施。内务机构证实,将关键系统集中于一个地点加剧了局势,并公布替代渠道的指示。行业声部指出国际上也有 UPS 系统的类似事件,并呼吁在人工智能负载下更实际的保护场景。没有迹象表明这是一起网络攻击;当局将停机归因于物理性的电池房火灾。

Quelle: hillerfire.com
一个典型的数据中心,就像受到大邱火灾影响的那种。
影响与建议
对公民服务来说,这意味着要预计会有中断和重定向,检查官方状态页和替代门户,并关注各部部长的期限通知。对IT团队来说,重新思考冗余措施至关重要,尤其是将电池区和服务器区分开、进行物理分段、限制每个火区的能量密度以及早期检测气体与温度升高。NFPA-855 指导原则给出具体边界。使用锂离子电池的人应根据短时不间断电源的运行时间、负载尖峰和断电逻辑调整防护策略。专业文章显示如何及早识别并抑制热失控场景。尚待解答的问题包括导致具体起火链的准确原因、对电池房设计的监管影响及冗余义务,以及替换受损直接系统和核验数据完整性的速度。一个单独的电池房不能成为数字国家的单点故障。大邱事件表明,物理韧性、跨地点的真正冗余以及对电池房安全的持续执行不是奢侈选项,而是政府机构以及企业的基本前提。

Quelle: independent.co.uk
如同在大邱数据中心也可能发生的大火所造成的破坏。