面向弹载计算机的BIT技术研究

时间:2018-10-09 编辑整理:边 维,邓 凯,王建才,张淑舫 来源:早发表网

要:机内测试(Built-In-Test,BIT)技术是改善系统或设备测试性和维修性的重要途径。在对弹载计算机BIT技 术特征进行研究的基础上,提出了弹载计算机BIT设计的基本准则,提供了一种典型的弹载计算机BIT设计方法,经 实践验证该设计方法适用于多种类型的弹载计算机设备,故障检测率不低于90%,故障虚警率不超过2%,显著地提 高了弹载计算机的可靠性、可测试性及可维护性。

关键词:弹载计算机;机内测试;故障检测率;虚警率

1 引言

弹载计算机是指飞航导弹武器系统中可独立存储、 运算,完成指定解算任务及数据传输任务的典型电子设 备。随着各种电子设备在飞航导弹武器系统上的大量 应用及电子设备的不断复杂化,其故障率不断增高,测 试时间变长、维修保障费用增加,降低了飞航导弹武器 系统的战备完好性。因此需要飞航导弹武器装备广泛 采用 BIT 技术,以便对其内部故障进行自动检测、诊断 和隔离,从而提高飞航导弹武器系统的测试性、维修性 和保障性。

BIT 是指系统、设备内部提供的检测、隔离故障的 自动测试能力,它在少用或不用外围测试设备的情况下即可完成系统的性能测试,是一种能显著提高系统测试 性和诊断能力的重要技术,是实现可测试性设计的重要 技术手段 。

目前BIT的研究主要集中在大型武器装备系统中, 其中最为典型的是各式雷达系统和机载设备,通过 BIT 设备与被测设备构成BIT系统实现。

弹载计算机是飞航导弹武器系统的核心部件,具有 体积小、重量轻、功耗低、系统集成度高、接口多样化、可 靠性高、贮存时间长、工作时间短、全寿命维护时间长等 特点,因此,面向弹载计算机的 BIT 技术与机载设备以 及其他地面设备不同,需要具有以下特征。

(1)可应对硬件体积较小的限制:弹载计算机受限于使用条件,通常对产品的外形、重量及功耗有着极为 严苛的要求,在进行 BIT 设计时,对于额外增加的 BIT 硬件电路和存储资源开销需要进行合理规划,确保能够 满足产品本身的技术要求,并留有设计余量

(2)方法应具备实时嵌入性:弹载计算机 BIT 软件 设计通常与弹载计算机其他软件紧密耦合,如上电 BIT 功能集成在上电后首先运行的监控软件中;实时BIT功 能集成在飞控或其他应用软件中,由于软件本身具有的 实时嵌入特征,BIT软件设计时必须考虑以上因素。

(3)具备高可靠性:弹载计算机因其小型化、低功耗 的需求,除少数关键信号,通常不进行冗余备份设计,所 有弹载计算机功能器件需要满足一次成功及可靠工作 的要求。因此,在进行BIT软硬件设计时需要考虑可靠 性设计准则,满足或高于产品本身的可靠性指标。硬件 设计应考虑隔离、滤波等需求,软件设计需要注意软件 的健壮性设计。

(4)应具备较高的兼容性:不同型号的弹载计算机 因其本身功能和弹内通讯平台的不同,其系统架构各不 相同、待测资源种类繁多,BIT 设计时对硬件本身依赖 度很高。对于复杂的多处理器架构,待测对象除了各个 处理器的内部资源、各模块的板内资源,还包含板卡间 的存储资源、板间通讯接口以及各板卡的对外通讯接口 及共用接口的控制权切换等。弹载计算机 BIT 设计时 需要针对待测资源分别设计测试算法。

因此,本文提出了一种基于弹载计算机的BIT设计 方法(Missile-Borne computer BIT,MBBIT),为弹载计 算机的BIT设计提供通用的准则和方法。

2 MBBIT设计准则和总体框架

2.1 MBBIT设计准则

在传统BIT设计准则的基础上,通过研究弹载计算 机技术特点,对弹载计算机BIT设计时应遵循的设计准 则进行了总结(表 1),这些设计准则应贯穿在弹载计算 机BIT设计的全过程中。

 

(1)小型化设计准则

硬件增量准则:基于弹载计算机体积小、重量轻的 技术特点,BIT电路和装置造成的电子系统设计的硬件增量不应超过被测产品的电子系统的5%。

(2)嵌入式设计准则

信息管理准则:BIT 应具有保存检测数据的能力 (故障信息存储到非易失存储器或其他记录装置中),以 便分析维修环境中不能复现(Can No Duplicated,CND) 的间歇故障和运行故障。

滤波电路设计准则:在硬件增量允许的前提下,设 BIT硬件滤波电路,提高检测精度及实时嵌入式系统 的检测效率,降低虚警率。

(3)可靠性设计准则

隔离电路设计准则:弹载计算机的BIT设计应保证 其不会干扰主系统功能、减低弹载计算机产品的可靠 度,对于模拟电路和数字电路,在 BIT 硬件设计时采取 适当的隔离措施。

电气特性设计准则:BIT电路的电气特性应与被测 对象相匹配。

余量设计准则:模拟D/A、A/D接口的BIT硬件电路 在耐压设计上留有足够余量,即使有比较大的干扰脉冲 通过也不会对后级的电路造成损坏。

固件设计准则:在条件允许的情况下,所有自测试 程序应与功能固件分开存储,以防止测试软件中的问题 造成系统功能固件出现问题。

(4)兼容性设计准则

门限可装订准则:存储在软件或固件中的BIT门限 值应便于根据使用经验进行必要的修改。

门限设计准则:在确定每个参数的 BIT 门限值时, 应考虑每个参数的统计分布特性、BIT 测量误差,达到 最佳的故障检测和虚警特性。

2.2 MBBIT方法总体框架

MBBIT设计与产品设计同时进行,设计流程如图1 所示,分为产品故障库建立、BIT软硬件设计、BIT信息管 理设计、BIT准则检查、BIT性能预计五个部分,对于BIT准则的实现贯穿在BIT软硬件设计及系统管理设计中。

 

MMBIT 设计时首先根据待测系统 FMEA(Failure Mode and Effect Analysis,失效模式和效果分析)分解 结果建立故障库 ,明确待测系统功能模块、对应故障模 式及故障原因,如表 2所示。FMEA 分解在弹载计算机 产品设计阶段由型号总体设计师完成,是产品设计的一 部分。

 

FMEA 分解完成后结合系统的要求进行 BIT 软硬 件设计,同时进行信息管理设计,BIT 信息管理设计应 满足 BIT 软硬件设计中测试参数的设置需求以及测试 结果的处理需求,MBBIT 软硬件设计应满足信息管理 设计的存储需求。

以表 2中串口通讯功能检测为例,根据硬件增量准 则,对于可用软件实现的板内接口故障和通讯功能降级 故障检测可以采用软件设置LOOP通讯方式实现,而对 于外部信号故障需要增加BIT硬件才实现,各功能模块 的BIT设计方法详见本文第3章;确定设计方案后,需要 为测试参数、测试判据和测试结果信息设计信息管理策 略,信息管理系统设计策略详见本文第4章。

完成信息管理系统设计后,为其分配独立的硬件 存储空间,如选取 FLASH 空闲扇区或增加额外的存储 芯片。BIT 设计完成后需要根据 MBBIT 设计准则检查设 计方案,最后对待测系统BIT性能进行预计。

3 MBBIT软硬件设计方法

在进行 MBBIT 设计时,结合 FMEA 分解得到的故 障库,在遵循 MBBIT准则的条件下,提出合理的 BIT系 统软硬件设计方法,最大限度地提高 BIT 故障覆盖率、 降低虚警率。

3.1 BIT硬件设计

根据硬件增量准则,BIT电路设计比重不能超过全 系统的 5%,本文在进行弹载计算机 BIT 硬件设计时按 照表3优先级进行累加式设计。

以某型弹载计算机为例,其 FMEA 分解如表 2 所 示,按照表3硬件增量优先级,进行MBBIT硬件设计:

(1)首先为信息管理区分配空闲的FLASH扇区,由 于FLASH存储空间足够,并未增加系统硬件设计。

(2)其次为关键 IO 信号及 DA 信号设计自环绕电 路,并根据可靠性设计准则为其设计滤波电路和隔离电 路,根据系统需求,为 5路开关量输出及 4路 DA输出设 计环绕测试电路。

(3)由于该型弹载计算机并无高功耗处理器件,无 需设计电源管控模块。

(4)使用测试用 1M1553B 总线作为系统各接口板 测试参数的装订和检测结果的收集。

3.2 BIT软件设计

依据 MBBIT 兼容性设计准则及嵌入式设计准则, 本文对待测资源进行归纳分类,针对每类BIT资源设计 合理可行的 BIT算法,如表 4所示。采用接口函数封装 调用的方式实现 BIT 软件,并对 BIT 算法进行优化,在 很大程度上降低了 BIT系统的复杂度,提高了 BIT设计 的规范性。

本文对以上六类弹载计算机 BIT 待测资源提供通 用的BIT设计方法:

(1)对于易失性存储器件采用规范性的走步“1”和 走步“0”的 BIT 检测方法,该方法能将数据线故障定位 到 S-A-0(固定为 0)开路型故障、S-A-1(固定为 1)开路 型故障、0-支配短路型故障和 1-支配短路型故障;将故 障定位到某根地址线;采用对多个地址单元进行读/写 性能检测的方法,计算出每个单元的读/写时间和指标 值进行比较的方法进行检测 。

(2)对于非易失性存储器件对于非易失性存储器件需要考虑在检测时间是 否受限:在检测时间不受限制的情况下采用类似于易失 性存储器的检测方法;否则可以采用读取厂商 ID 和设 备ID,结合计算CRC校验和的方法进行检测。

(3)对于通讯接口在LOOP模式下进行数据发送/接 收通讯功能的检测,比对发送接收数据是否一致;通过 测试指定长度数据的传输时间是否在允许的容差范围 内,检测接口芯片时钟工作的正确性;对于具有复杂逻 辑及存储功能的通讯接口,如弹内总线普遍采用的 1553B 接口,采用易失性存储器的检测方法进行 RAM 资源的检测,采用离线模式进行通讯检测。

(4)对于处理器资源,需要监测定时器计数及内部 指令周期,对比外部时钟基准,判断定时器工作是否正 常、处理器的时钟配置是否正确。

(5)对于数模转换接口,考虑BIT硬件设计情况,对 于具有自环绕电路设计的 A/D、D/A 接口,采用对标定 电压范围内全边缘扫描测试、多次A/D采样和数据滤波 的方法对 A/D 接口芯片的转换精度和时间指标进行测 试;对于不具有自环绕电路设计的 A/D、D/A接口,对产 品上电后的A/D输入接口进行初态采样结果的判断。

(6)对于 I/O 接口,考虑 BIT 硬件设计情况,对于具有自环绕电路设计的I/O接口,采用规范性的走步“1(有 效)”和走步“0(无效)”的 BIT 检测方法进行测试;对于 不具有自环绕电路设计的 I/O 接口,对产品上电后的开 关量输入接口进行初态采样结果的判断。

以表 2 中开关量输出功能检测为例,BIT 硬件设计 阶段为其中5路关键开关量输出信号设计自环绕回路, 软件设计根据待测资源类型采用表 4中第 6项 I/O 接口 测试方法,可覆盖关键开关量输出信号的短路、常有 效、常无效故障,覆盖表 2 中开关量输出功能的所有故 障模式。

4 MBBIT信息管理设计方法

依据信息管理准则建立切实可行的 BIT 信息管理 设计策略,是解决虚警率和故障检测率矛盾的关键,本 文提出了适用于弹载计算机的BIT信息管理设计方法。

(1)BIT条件参数在线可装订设计

以串口通讯功能检测为例,FMEA分解如表2所示, 信息管理模型设计如表5所示。

 

(2)BIT信息存储及维护设计

在非易失性存储器上建立BIT信息存储区,包括当 前故障区和历史故障区,当前故障区记录本次系统的故 障信息(如:系统时间、上电次数和相对时间、BIT 汇总 信息、BIT 条件参数、BIT 检测详细信息等,如表 5 所 示);历史故障区记录了历次产品工作的BIT信息。

以某型弹载计算机为例,采用循环存储的方式最多 存储100条历史故障信息,当上电次数超过100次后,将 最早记录的1条历史信息记录删除。该策略对BIT测试 过程进行了全面的记录,同时保存了历史故障信息,以 便分析维修环境中不能复现的间歇故障和运行故障,并 形成产品的故障知识库。

(3)BIT故障诊断及分析设计

对于系统集成度较低、单处理器架构的弹载计算机,建议采用集中式BIT进行故障诊断、分析和决策;对 于集成度高、多处理器架构、系统复杂的弹载计算机,建 议采用分布式与集中式相集合的BIT故障诊断、分析策 略,各分系统协同工作,对各单元状态做出判断和决策, BIT 结果应具备独立存储、上传的能力,总的系统决策 由某一单元模块完成。

(4)ATE辅助分析设计

 

ATE 系统中建立故障知识库,存放测试时间、产 品编号、故障模式、故障原因、故障影响因子、相关因素、 判据等信息,通过专用总线对弹载计算机的工作状态进 行实时监控、诊断及分析,结合本地故障知识库确定弹 载计算机是否存在故障以及故障的程度,判断弹载计算 机工作状态是否出现异常并给出异常状态下的故障描 述信息;通过对历史数据进行统计分析(如DA、AD的误 码规律),对弹载计算机的故障进行预测和评估。

5 实验

5.1 实验环境和实验设置

本文采用某型导弹武器系统内三种不同类型弹载 计算机(TYPE1-3)作为验证系统,在满足原有技术要求 的前提下对其进行 BIT 软硬件改进。实验对象涉及导 弹武器系统中制导、电气、遥测等分系统,既包含功能复 杂度高的一体机,也包含功能相对单一的电气控制装 置。实验结果能够代表大多数的弹载计算机设备。

实验考察的指标为 BIT 故障覆盖率、BIT 故障隔离 率以及BIT虚警率。

(1)BIT故障覆盖率(FDR) rFD 是指用 BIT正确检 测到的故障数与故障总数之比,用百分数表示,见公 式(1):

 

 

率零为第一组,误差率±10%为第二组,误差率±20%为第 三组,依次类推,以误差率±100%为第十一组。实验采 用软硬件故障注入的方式对产品 FMEA 分解得到的故 障类型进行激发 ,对改进后的弹载计算机(TYPE1~3) 进行测试,执行故障激励次数 NT 分别为127、89及54。

5.2 实验结果及分析

三种不同类型的弹载计算机实验结果如表 7~表 9 所示。

 

由以上实验结果可以得出以下结论:

(1)随着误差范围的增大,故障覆盖率、故障识别率 及虚警率都是递减的,这是由于BIT故障覆盖率、BIT故 障隔离率以及 BIT 虚警率与测试中采用的判决严格程 度有关,如,定时器周期测试中,使用外部基准测试 50 ms定时周期是否设置正确,若判据设置为严格相等, 由于代码执行或基准不同步等原因都可能增加故障虚 警率;反之,若设置偏差范围为 50 ms±50 ms,不仅定时 周期故障无法告警,与其相关的时钟类故障识别模糊度 都将增加,这显然降低了故障覆盖率及故障隔离率。

(2)权衡故障覆盖率及虚警率的表现,判据设置为 10%~30%最佳.

(3)对比原有简单自检的 BIT 方法,改进后的 MBBIT设计方法显著地提升了BIT故障覆盖率及故障识别 率,能够达到故障覆盖率及识别率大于 90%,虚警率小 于2%的技术指标。

6 相关工作

BIT 技术在国外的军用航空电子和民用航空领域 进行了非常广泛的应用。美国是研究和应用 BIT 技术 较早的国家之一,已在军用飞机的航空电子设备和机电 系统上不同程度地应用了BIT技术,提高了这些飞机的 战备完好性和出勤率,降低了维护费用,取得了明显的 经济效益 。

二十一世纪开始,在故障预测与健康管理 PHM (Prognostics and Health Management)思想的牵引下, BIT技术的发展趋向于系统化,PHM技术在提高装备系 统的安全性、可靠性、维修性、保障性、测试性以及经济 性等方面展现出独具特色的优势;在军用航空领域, 以 F-35 战斗机为标志,中央测试系统转变为机上的 PHM 系统 。该系统包括 BIT、系统/分系统 PHM 区域 管理器、飞机PHM管理器等,提供数据采集、增强诊断、 故障预测和维修决策等综合的健康管理能力。在美国 海军的资助下,波音等多家知名公司制定了基于状态维 护的开放式系统架构 OSA-CBM。

国内的 BIT 技术研究起步于 20 世纪 70 年代末,以 航空航天等国防工业领域为代表,开始 BIT 技术的研 究。1990年“电子系统和设备的测试性大纲”颁发以后, 有关单位在不同程度上开展了这方面的工作,并取得了 一些成果,目前,BIT 技术在雷达系统和机载卫星设备 中已得到了较为广泛的应用,近些年来,一些新的技术如人工神经网络、混合诊断模型也融入到提高测试性能 的研究中,随着导弹武器装备的系统复杂度逐步提升, 一些导弹武器系统中也开始应用 BIT 技术增加装备的 可测试性和可维护性 。

7 结束语

通过对弹载计算机 BIT 技术的深入研究和实践验 证,本文提出了MBBIT设计准则并提供了典型的MBBIT 设计方法,经过实验验证,该方法能够有效地提高机内 自检的故障覆盖率和故障识别率、降低故障虚警率。目 前的研究仅限于弹载计算机单机系统内的BIT设计,下 一步的研究方向为在导弹武器系统内建立多机互联的 BIT 系统,并将 BIT 结果应用于导弹武器系统的故障预 测与健康管理。


职称
论文

期刊
发表

加急
见刊

写作
咨询

课题
专答

编辑
顾问

关注
我们

返回
顶部