[摘要]生物医学是一门新兴的学科,它是应用了生物学、医学和生命科学的理论和方法而发展起来。随着信息技术的高速发展,计算机科学已经深度参与和渗入到生物技术的研究之中了。生物医学应用多属于大规模计算密集型应用,而生物医学研究中也越来越频繁地涉及到大数据存储和高性能集群运算需求技术,所以需要采用大规模的计算环境支持。
[关键词]生物医学;计算平台;管理模式;运行与维护
近几年,随着生物医学应用的飞速发展,大规模生物医学应用计算平台正从传统的以计算集群为基础的网格环境向高性能计算环境快速发展,以承载和支撑大规模生物与医学为中心任务,充分利用其并行运算和大数据处理的能力,为大数据提供高效的处理和分析机制。
一、生物医学计算平台的有效管理
(一)生物计算平台发挥的作用以及工作宗旨
其作为相对独立的辅助部门存在,为教学科研提供保障,最大限度地发挥资源的利用率,提供一流的生物医学计算和存储等服务工作。因此,计算平台是否能够按需求服务,科研和教学用户对平台服务是否满意,如何通过创建和创新服务而为生物医学研究创造更多的价值等一系列问题,依然是需要关注的重点问题。
(二)生物计算平台所面临的建设、运营等主要问题
一方面,各实验室和院所的发展对生物计算平台的建设提出许多新的挑战,需要长远目光和快速响应,比如每年的项目申报。另一方面,因频繁变化的业务使计算平台日常管理遭遇很多突发状况,如临时停电、软硬件技术故障、突击检查等,要求提前做好充分的准备工作。
(三)生物计算平台服务管理的广度和深度
生物计算机平台对人、基础设施、信息资产、其他资产的管理,范围广,涉及到的面多,只有抓住信息这个要素以信息管理为重点,以流程为指标,建立标准服务级别,并进行模块化管理。
(四)定制的服务体系构架
1)服务级别管理:计算机平台的核心使命是为各类用户提供满意的存储及计算服务,因此立足于平台的实际,针对不同用户的特点,制定和实施相匹配的用户服务协议,是衡量平台工作的核心标准之一。
2)财务管理:计算机平台逐年累月积累下来的教学和科研经验,必须考虑投入和产出效益。因此,需要设计预算和计费管理、运维的管理、对外服务的管理等,费用约定应明确体现在服务协定上,这对改善计算平台的运维和服务质量,提升平台的使用平率都十分必要。
3)持续可用性管理:作为一个重点建设,任务繁重的计算平台,必须在人员、技术、资产等方面进行持续管理。并必须明确计算平台服务需求,这样平台的工作目标才是明确的,这样优化和基础构架才有实用性。
4)事故能力的管理:为避免用户违规、例外操作等造成的事故,计算机平台需要制定严格的服务质量标准,并在此基础上规范操作、记录操作事故现象、分析并给出报告,以达到与用户沟通、减少事故次数、提高服务质量的目的。计算平台需要通过合理的岗位设置,来实现各类服务,并通过对人员的培训,以及对资源的优化合理配置,来发挥计算平台投资的最大效能。
5)问题配置管理:为兑现服务协议,降低事故损失,有必要开展事前分析,找出潜在因素,减少服务成本和对用户的影响。而合理地配置是计算机平台软件协同、高效工作的基石,对系统的配置项需要定期确认,以确保变更管理和日志。
6)变更发布管理:科学试验的流程变更需要合理管理,因计算平台面向的用户众多,拥有的信息资源有限,而在实际过程中,用户的使用权限或端口会经常进行变更,所以用户出于自身需要对软硬件的变更也是变更管理工作的重点。为使IT技术信息透明化,应定期发布有关产品的配置项信息,而计算机平台通常使用可信第三方提供的软件产品。
二、生物医学计算平台的合理化运维
(一)生物医学计算平台下的用户维度
在传统模式下,业务系统与物理服务器明确对应,而采用计算平台后,是利用虚拟服务器进行服务的,其数量会动态增减。如要查看客户满意度、群集开机率、任务按时完成率以及平均等待时间,都可以在计算平台中操作实施。因计算平台面向的用户面广,所以用户维度是关键。在为各类用户提供满意的计算平台服务,并达到与客户之间的良好沟通,才能对计算平台的使用率以及良好的信誉有很大的提升。