一、项目背景
诸暨市财政局主要应用业务有:集中支付应用系统、土地出让金收支管理系统、非税征管系统、基础信息管理系统、行政事业单位资产管理系统、乡镇公共服务平台系统、办公OA管理系统、行政事业单位会计核算系统、预算编制系统、资金审拨系统、财政收入分析系统等,其中集中支付应用系统、预算编制系统、非税征管系统、办公OA管理系统运行于AIX小型机系统下。
目前,用户拓扑图下:

从拓扑上可以看出,诸暨市财政局当前完成了应用的超融合整合和数据的灾备防护,在架构上已经初步完善。但是,当前诸暨市财政局的小型机已经老化严重,无法适应业务发展需求,为了确保业务的持续性和数据安全性,急需对现有环境进行改造升级。
二、总体目标
诸暨市财政平台数据中心意采用“前置应用多点部署多活,核心数据库双活模型”架构,建设应用层平台和数据库平台2个平台,2个平台根据的根据应用特殊性不同来建设不同架构对外提供服务,两个平台均实现双活模式:
实现局部节点出现异常,对业务系统产生0影响;
结合现有的灾备实现物理机上、逻辑上全方位数据安全;
实现应用的线性扩展;
实现硬件状态的实时监控;
实现近乎0的运维管理压力。
三、设计方案
建设拓扑:

建设要点:
(1)针对核心数据库:核心数据库当前作为各种业务的集中数据库,关系到所有业务的数据安全和业务持续性,采用高性能硬件级双活架构,实现网络、计算、存储全双活,既满足系统对硬件冗余要求,又满足大业务压力的需要;
(2)针对应用平台:应用业务通过weblogic进行统一管理,包含非税征管、资金申拨、会计核算、支付管理、审核拨付、用款计划、预算编制、政府采购、指标管理、集中核算、动态分析等,为政府、教育等所有单位提供服务,要求系统7*24小时在线,而这些系统本身数据增量较少,提供业务接入作用,压力比较核心数据库来说相对来的小,故采用超融合多点部署架构,实现所有应用多活的同时,合理利用资源;
(3)由于原灾备系统采用异构数据库复制系统,导致无法实现CDP级别回退,而本次迁移到linux下后,复制模式变为同构复制,在此基础上扩容CDP数据库备份模块,实现数据库任意I/0级别回退,确保每一条数据的安全,更好的应对各种逻辑故障的发生。
建设清单:
货物名称
| 数量 | 品牌/制造商 | 型号和规格 |
数据库一体机系统 | 1 | 云备姆 | VFTserver-D24RFS:采用网络、处理单元、存储(无需仲裁)全冗余架构,确保无单点故障。采用物理级芯片级(非软件实现模式)CPU级别同步技术,采用容错技术,不需要用户自己搭建或另外编制繁琐的转换软件来实现容错或故障恢复功能。可以实现oracle、MSSQL、MySQL、SYSBASE等数据库数据库双活,非RAC架构。当前配置为2节点机架式服务器,2U/每节点,每节点配置为:2颗Intel XEON Gold 6130 16C/32T,处理器主频≥2.10GHz,二级高速缓存≥22MB(每个处理器),内存:128GB,内置硬盘:1*240GSSD+3*1 T SSD(2.5寸盘U.2接口 PCIe 3.1*4 ,3D Nand,TLC,单盘随机读取性能≥29万IOPS,随机写性能≥3万IOPS),最多可插入24个硬盘;板载2个1000MB以太网端口,4个10GB SFP太网端口,1个100MB以太网管理端口,热插拔双冗余电源;内置全系统自备份功能,实现系统级备份和快速回滚;内置oracle数据库实时备份功能,支持每个commit提交记录回退;三年原厂商软件及硬件质保。 |
四、一体机架构展示

√ 实现业界最高等级的可靠性:双活服务器采用“Lockstep 锁步技术”的结构设计,帮助用户全面提升系统运行的稳定性。可靠性指标从传统方案的99.9%提升到99.999+%以上。
√ 简化部署结构:双活服务器在保障机器运行的极度可靠前提下,更为用户带来单一操作的系统和应用处理环境。 用户只需要执行单一的操作系统、应用软件安装。无需像集群环境中添加各种脚本配置文件。双活同时提供冗余网络,单一IP的使用。为网络连接主动提供可靠性和简便的支持。
√ 使用、管理、维护便捷:单一简化的部署,为用户的使用和管理带来方便。 也减少复杂环境可能引发的认为操作错误。图形化的运行窗口和状态指示灯明确向用户展现了系统的运行情况。所有服务器部件的联机热拔插更换,为用户的后期维护带来极大的便利性,可以大大节省系统维护人员的劳动强度和人工可能带来的操作失误。
√ 磁盘冗余:2个节点的磁盘数据完全一致,实现了存储的双活功能,任意磁盘故障,只需更换磁盘,而无需进行复杂的配置操作,就能迅速恢复到以前正常的工作运行环境,而不需重新安装OS或应用程序,大大节省恢复时间。
√ 网络冗余:自动将2节点的网络组合成一个冗余的逻辑网卡。供操作系统使用。两个网口可以相互切换,公用同一个IP。当网卡或网线发生故障或链接问题,网卡之间以毫秒级别自动完成切换。TCP/IP的连接或数据并不会发生中断或丢失。
优势
√ . 零停顿时间
双活系统提供业界最高可靠性、和可用性。要求采购的服务器系统采用双模(DMR)和三模(TMR)硬件体系结构。双模系统可用性达到99.999%,平均每年非计划(意外)停机时间不超过5分钟。而三模系统可用性可超过99.9999%的可用性。与其它解决方案低于99.99%,平均每年非计划(意外)停机时间超过4~5小时的可用性相比,用客户获得极大的稳定性。
√ . 无故障恢复时间
系统所有关键部件均为冗余配置。冗余部件时钟同步运行相同指令。保证即使在硬件出现故障时,其冗余部件仍然保持继续运行,从而保证当前交易的处理,应用不会 因此而停顿和数据丢失。其它方案下,应用需要等待计算机系统的故障恢复,数据库的恢复,网络联接的恢复以及应用的恢复。
√ . 无内存数据丢失
双活系统独特的冗余硬件结构不但保证磁盘静态数据的完整性,而且保证内存数据的完整性。从而保证交易的完整一致性。而其它解决方案使无法做到的。在故障恢复期间,当前交易和内存数据将要丢失。
√ . 标准Windows/Linux 兼容性
双活系统支持标准的Windows/Liunx(RedHat)操作系统环境。保持应用二进制兼容。标准Windows和RedHat下运行的软件无需任何变动即可稳定在上面运行。
√ . Windows/Liunx(RedHat)可靠性增值
双活系统利用其独特的冗余结构和容错技术,改进和完善了Windows /Liunx(RedHat)的可靠性和稳定性。
1.强化驱动
为加强可靠性而设计的双活系统强化驱动不但可以实时检测和隔离故障部件,而且可以检测和隔离不良驱动的内存越界写操作,防止造成系统严重后果。
2.在线转存
在Windows /Liunx(RedHat)发生崩溃后,双活系统立即可从一个CPU重启动,使关键应用立即投入生产。与此同时,另一个冗余CPU保持内存状态数据,并在线将故障状态转存至磁盘,以供调试和诊断。
3.快速重启动
双活系统提供预先定义内存段,使得当系统崩溃后的重启动期间,此定义的内存段数据保持不被刷新,从而重要数据、上下文生成数据、以及较大的驱动程序维持在定义的内存段,减少重启动时间,并保护了重要数据。
√ . 应用透明性
双活系统故障处理在硬件部件级完成。任何故障均能被自动隔离,而不会导致系统进一步严重问题。双活系统容错系统对应用使透明的,即:
a 在单机上开发的应用无需修改,即可获得YBM-ND容错技术的特征。不象其它方案那样需要额外编制面向故障的脚本程序;
b 应用的测试仅限于正常的软件测试。而无需进行繁琐的、重复的脚本程序测试来验证脚本程序能够正确地进行恢复工作;
c 功能系统的维护如同单机一样。没有额外备份或集群技术的维护需要。
√ . 生命周期总成本和风险
双活系统的故障处理和维护使可预测的,为企业的成本预算奠定基础,从而双活系统解决方案总成本是最低的。相反,其它利用脚本程序解决故障的方案因为一些不可预测的故障没有相应的脚本程序处理而使应用瘫痪,企业将面临不可预测的成本和风险。