介质故障是最重的故障类型,原因是它通常需要DBA 的干预。
与介质有关的问题的常见类型:
包含某一数据库文件的磁盘驱动器出现磁头损坏。
对实现正常数据库操作所需的文件进行读写操作时存在物理问题。
文件被意外删除。
那怎么样来解决介质恢复呢?
通过备份
备份恢复策略定义:
DBA 要考虑的问题不管你选择什么样的备份策略 ,一定要获得相应管理层的认同是很重要的。
比如你这个数据没有备份,一定要告诉领导 。
数据库1T,备份需要多少T?
在选择备份策略时,应考虑以下一些问题:
根据对系统可用性的期望,管理层是否权衡了所选备份策略的利弊?
是否有专门的资源来确保成功实施备份和恢复策略?
是否已明确了解进行备份和准备恢复的步骤的重要性?
管理层要考虑成本投入和风险比.
从业务影响考虑:
管理层必须量化停机时间及数据损失的代价,
并将其与减少停机时间及尽量减少数据损失所需的成本进行比较。
MTTR:数据库的可用性是DBA 要考虑的一个主要问题。
出现故障后,DBA 应努力缩短平均恢复时间(MTTR)。
此策略可确保数据库的不可用时间尽可能地最短。
通过预测可能发生的故障的类型并采取有效的恢复策略,DBA 可以最终达到缩短MTTR 的目的。
MTBF:保护数据库以防止出现各种类型的故障也是DBA 的一个重要任务。
要做到这一点,DBA 必须延长平均故障间隔时间(MTBF)。
DBA 必须了解Oracle 数据库各文件结构的重要性,并对数据库进行相应配置,比如镜像控制文件和日志文件,这样才不会经常发生故障。
DBA 和相应的管理层都应定期对备份和恢复策略的有效性进行检查,这一点至关重要。
从操作需求考虑:
7×24 小时操作
ORACLE提供了很多高可用性方案,比如RAC、ADG。
在网络层需要做冗余,比如双线路、双交换机、双网卡、双负载均衡器等
应用服务器做冗余
硬件物理级做冗余,如RAID1,RAID5, RAID01,RAID10等
备份恢复技术考虑:
资源:硬件、软件、人力和时间
操作系统文件的物理镜像
数据库中各对象的逻辑镜像
数据库配置
事务处理量,这将影响需要备份的频率
技术要求:
你有多少数据?
你的计算机的能力及容量是否足以支持备份?
数据是否易于重新创建?比如索引
你是否可以将数据从纯数据文件重新加载到数据库?
数据库配置是否能支持从不同类型故障中复原?
从灾难恢复考虑:
自然灾害
你的数据可能非常重要,以至于你必须确保甚至在系统完全瘫痪的情况下也能够复原。
自然灾害和其它问题可能影响你的数据的可用性,因此在创建灾难恢复计划时应考虑这些问题。
在选择备份和恢复策略时,应考虑以下一些问题:
在发生以下严重灾难时,你的业务会受到什么样的影响:
水灾、火灾、地震或飓风
存储硬件或软件故障
备份是否存储在其它地方?如磁带,磁盘,CDROM,闪存等
容灾考虑的是同楼、同区、同城、跨城、跨国
容灾考虑网络带宽,或者其它灾备传输途径,比如人工快递
测试备份
DBA 可以通过制定计划定期测试备份的有效性,来确保他们的策略可以缩短MTTR 并延长MTBF。有效的恢复取决于有效的备份。