首页联系我们
联系我们
加入UTrust渠道计划
UTrust高性能文件系统
UTrust高性能文件系统
提升地震资料处理能力
大庆油田曾是支撑起中国“石油大厦”的顶梁柱。大庆油田经过半个多世纪的勘探开发,剩余 油气资源分布情况非常复杂难于发现,进入上个世纪90 年代大庆油田每年新增探明储量非常有限, 大庆油田似乎进入了高速枯萎阶段。对于大庆来说,有限的数据采集能力和缓慢的数据处理速度, 成为了石油勘探的瓶颈。针对这一问题,大庆油田研究院开始了创新性的研究。
■大庆油田研究院介绍
大庆油田有限责任公司勘探开发研究院1964 年正式成立至今,一直是大庆油田石油勘探开发 技术的研究中心。该院现有员工1595 人,专业技术人员1085 人,其中教授级高级工程师7 人、 高级工程师332 人,工程师471 人,博士研究生46 人、硕士研究生148 人。
38 年来,围绕着油田勘探和开发两大主线,建立形成了油气勘探、油田开发、三次采油、分 析测试、计算机应用等五个科研、设计、生产体系。形成了八大技术学科及其分析测试的配套技术, 并设有相应的科研保障系统。研究院先后开展了3000 多项研究课题,取得2696 项科研成果。这 些科研成果确保了大庆油田年产5000 万吨以上26 年高产稳产。
大庆油田研究院从2003 年开始引进集群系统开展三维叠前偏移处理,使用的是国产的联想深 腾1800 (128 节点) 。之后在2006 年研究院引进了惠普高性能刀片服务器集群以及日立的存储 设备。该集群系统由刀片服务器、全线速万兆以太网络及SAN 存储磁盘阵列组成,总共1432 个 CPU,该处理系统将用于地震资料的高分辨目标处理和叠前偏移处理,使研究院处理解释中心具备 了二维地震资料目标处理120000 千米、三维叠前偏移处理5000 平方千米的年处理能力。
■本系统的技术特点
对于当今的石油勘探,为了获取更加丰富的地下信息,数据采集的数据量较2001 年前已经翻 了几十倍。以前因为成本,在国内无法实现的三维迭前偏移处理,目前已经成为地震资料处理的常 规手段,被应用于地震生产。其计算量和空间需求量成指数增长。单靠传统的单节点系统已经无法 完成。传统的工作方式:以一台I/O 服务器以NFS 将文件系统出口给所有计算节点,其IO 服务器 就成为了性能瓶颈。而解决这一问题的关键是引入本系统,包括:共享文件系统,存储管理系统, 自动磁带库。
作为本管理套件中的核心SAN 高性能共享文件系统,本共享文件系统为异构客户端提供了对 集中式磁盘存储的高性能共享访问。传统 SAN 只提供对存储设备的共享访问,而本文件系统通过 整合能够被多个操作系统访问的数据,极大降低了存储设备的需求。而且,由于多个客户端能够同 时共享相同的文件,因此消除了通过局域网移动大型文件和存储重复文件副本的需求。大庆油田研 究院由此提高了存储效率,改进了工作流工作效率,减少了网络瓶颈。
本管理系统是一个数据长期归档存储管理系统,它按照系统管理员预设的各种规则将本文件 系统中的数据从昂贵的RAID 系统中迁移到廉价的JBOD 磁盘阵列和磁带库当中,在降低存储成本 的同时对数据进行长期、安全的归档存储。这一切对于应用系统和用户是透明的,他们不用关心所 需数据位于何处。本管理系统可以智能地存储和调用数据,满足应用系统的需要。例如,当本文件系统磁盘空间达到某个百分比( 如90%) 时,便会将最不经常使用的数据迁移到磁带库中,使本文件系统磁盘空间保持某个百分比( 如50%) 的空余空间存储新的数据;若文件在预定时间内没有被访问,则将其迁移到磁带库中,节省磁盘空间用于存储新数据。
智能化磁带库独特的iPlatform 体系结构的嵌入式智能通过包含磁带库、磁带机驱动器和光纤连接的单一管理视图,增强了性能和 可靠性。数据通道就绪性检查、驱动器性能优化和连接故障切换功能一起,可使备份保持正常运行。运用业界最先进的可扩展性体系结 构——按需提供容量,扩展系统以满足目前的预算要求,同时根据需要轻松地增加容量。实现了重要的体系结构进步,通过在磁带库中 嵌入先进的功能,集成外部组件,降低成本,并具有业界领先的密度,能够实现业界最先进的可扩展性和RAS 特性,同时提供全面的混 合介质支持,在成本节省方面也有出众特点。
通过应用本系统,大庆油田研究院已经成功创建了大规模地震处理集群系统。大规模地震处理集群系统的特点有:节点多,总共 692 台服务器,1432 个CPU ;万兆网络技术新, 总共有576 个以太网口;存储设备多(网络光纤盘阵、自动磁带库);多种应用软件(5 套地震处理软件) 。
■本系统的具体应用
为了合理配置系统资源,消除影响处理效率的瓶颈问题,提高集群系统的管理水平和地震资料处理能力,大庆油田研究院从五个方 面对大规模地震处理集群系统进行了优化。
1. 为共享文件系统元数据服务器增配两块4GB HBA 卡,提高数据传输效率。在原有工作方式中,HBA 卡只承担磁盘阵列的数据 传输工作。改进后的工作方式,增加了数据传输通道,以提高数据的传输效率。
2. 建立地震处理软件运行机制,整合I/O 资源,保障地震作业高效运行。大庆油田研究院在大规模集群系统上安装了5 套地震处理 软件,由于每个软件所需要的系统运行环境不同,因而需要按照软件的CPU 许可证数量合理分配计算节点、I/O 节点、磁盘空间,以及 内部网络配置。传统的文件系统共享,某个I/O 节点只能归一套地震处理软件使用,导致I/O 节点忙闲不均,无法实现共享应用。通过 建立本共享文件系统,就可使得多个I/O 可以同时访问同一文件系统,因此有必要整合I/O 节点资源,扩充其内置的磁盘存储空间,增 大数据交换缓冲区,提高数据传输效率。
3. 开发共享文件系统,合理划分磁盘存储空间,建立满足大规模叠前连片处理需求的文件系统。在有限的I/O 服务器资源环境下, 不同的地震作业需要通过一个I/O 去读写数据,导致I/O 服务器使用频繁,满足不了大批地震作业的处理需求。本系统装配后,承担地 震资料处理任务的Omega 软件和Paradigm 软件使用的是系统安装所建立的30 个小文件系统,每个文件系统容量为 1.2TB。由于这 种文件系统没有共享互锁机制,所以多个地震作业不能通过多个I/O 服务器访问同一个文件系统,为保证地震作业运行效率,使用了大 部分的I/O 服务器访问这些小文件系统。因此,在项目进展过程中要通过合理划分磁盘存储空间,开发共享文件系统,实现多个I/O 服 务器访问同一个共享文件系统,使多个地震作业可以通过不同的I/O 系统读取同一文件系统的数据,从而建立满足大规模叠前连片处理 需求的共享文件系统,提高地震作业的处理效率。
4. 开发磁带库存储系统,制定合理的数据迁移策略,实现地震数据的安全存储管理。开发新引进的智能化、磁带库系统,根据地震 数据处理流程,实现地震数据的迁移、回迁、归档和移除。比如,按照时间、工区、用户及关键处理环节等制定相应的数据迁移策略把 中间成果数据从在线的磁盘阵列迁移到磁带库中,同时释放磁盘存储空间,并可在需要时自动从磁带库回迁该数据到磁盘中。另外,可 实现最终处理成果数据复制到磁带库中,实现成果数据的归档管理。
5. 分析地震处理软件的并行作业处理方式,制定出满足地震处理软件高效运行的系统性能优化配置方案,提高地震资料处理效率。 大庆油田研究院分析三套主流地震处理软件叠前偏移并行作业的处理方式,跟踪作业运行情况,结合实际生产应用,根据不同处理阶段 地震作业对系统资源的需求,随时调整、合理分配计算节点服务器资源,跟踪每个计算节点的运行效率,建立一套保障叠前偏移并行作 业高效运行的系统资源配置方案:作业起始环境的建立;计算节点、I/O 节点资源分配;磁盘存储空间的分配;作业执行过程中的监控、 故障处理措施及性能优化;中间计算成果、结果数据的安全保障及成果归档;负责整个区块处理过程中的技术支持和服务。