一卡通、金蝶财务、交换数据库都存在比较严重的dblink session不释放的问题,一季度先后先后联系并配合内控开发公司、生产开发公司进行了整改,有效降低了RG01的session数,使RG01 session数保持在一个稳定的数量。
上半年通过监控发现集发公司外包工程师VPN远程进行千万级数据量的删除工作,sql执行时间超过30分钟,redo日志切换频率高达每小时52次,给磁盘IO带来非常大的压力,严重影响数据库的性能。
生产数据库上存在APPLOG、无车承运人GPS历史信息历史数据占用空间较大的问题。通过分析,最终新建了RG05日志数据库,将APPLOG和无车承运人GPS信息迁移过去。
10月10日上午,及时发现了一起生产数据库服务器宕机故障。故障原因为:服务器内存板损坏。配件于11日下午17:25到货,18:10自主完成更换。
10月16日生产数据库第三节点服务器(EDI机房,型号:SUN T5-2)宕机,无法启动,经确认,服务器主板损坏。18日晚完成更换,生产数据库恢复正常,至今运行稳定。
今年8、9月份作为生产数据库备机集群使用两台EMC VNX5300存储连续损坏十几块硬盘,这两台存储已经使用超过6年的时间,硬盘集中损坏也是正常现象,已经分两次采购了备用硬盘。
7月23日早上,EID机房和门厅出现墙体渗水、机房办公室窗户严重漏雨的情况。多次联系港湾施工方查看现场,业务技术室给港湾发函后港湾进行了彻底检查和整改。
7月25日,机房动环监控系统串口服务器损坏造成EDI机房通信中断。立即联系业务技术室采购一台新的串口服务器。27日设备到货后,顺利恢复了串口服务器,监控系统恢复正常。