注:本作品第一出版权归属微软 中文网或其指定的第三方,转载时请务必以超链接形式标明文章原始出处、作者信息和本声明,谢谢!
项目背景
在2010年,中国电信着眼于云计算长远规划和发展,推出“星云计划”并批准四家云计算业务试点省公司。上海电信位列其中,主导 IDC 基础设施云计算业务的现网试点任务,探索面向企业、政府客户的基于基础架构即服务(IaaS)模式的主机托管业务。
经过激烈竞争,于2010年4月,上海电信最终选择了与微软、惠普合作建设新一代“云 IDC 数据中心”。凭借优秀的微软虚拟化技术 Hyper-V 和私有云解决方案产品 ,以及惠普在基础设施和项目实施能力,上海电信顺利完成支持异构环境、跨数据中心的统一资源管理和动态调度、监控和自服务能力的 IDC 云计算平台建设,成为中国电信运营商第一个云 IDC,为新业务的探索和发展奠定了坚实的基础。当系统一期上线和试运行后,获得了电信负责人的认可和肯定。
“通过使用微软软件,我们只用了六个月就成功搭建好我们的互联网数据中心,并投入运营,如果使用其他厂商的技术,需要的时间将会延长一倍。”
商彦明 中国电信集团上海分公司新业务开发中心 IT 部门产品经理
项目里程碑
2010年5月 – 项目启动
2010年6月 – 原型系统发布,配合上海电信市场部相关营销活动
2010年8月 – 系统完成一期一阶段实施,具备统一资源管理能力和自服务能力
2010年12月 – 系统完成一期二阶段实施,具备服务自动化和资源监控能力,投入商业试运行,纳管主机约50台
2011年11月 – 系统完成二期实施,增强了网络自动化、备份/恢复、资产管理、报表等功能,主机扩容到100台以上
目前,项目三期已启动,正处于规划阶段
项目经验
任何优秀的解决方案落地离不开四个要素: 理解客户需求,具有差异化竞争力的产品和附加价值(功能),合理的团队组织和分工,以及安全运维设计。
客户为什么需要云计算?
面对IDC市场同质化竞争的愈演愈烈,电信运营商也不得不接受基础设施居高不下的固定成本投入(CAPEX)和维护投入(OPEX)。探究其根本原因,可归纳为:
成本较高 – 数目庞大的机柜、服务器、网线,以及空调、UPS 等配套设备,涉及到庞大的购置成本,同时,每天都会产生不菲的维护成本。服务器利用率低 – 资源平均利用率只有20%左右,最繁忙时,也不超过50%。配置复杂 – 对资源的使用和管理缺乏完善的流程定义,多采用人工方式,通过简单的工作表进行统计和分配而缺乏平台支持,工作效率较低。业务模式不灵活 – 不提供自助服务能力,对业务处理请求往往无法做到及时响应和准确有效。
通常,我们讲云计算具备五种基本特征:统一资源管理、动态资源调度、资源(服务)使用度量、用户自服务和广泛的网络接入。云计算技术的运用可以针对性的解决电信运营商当前在 IDC 业务上所面临的挑战,提高数据中心资源的使用效率,利用规模化经济效应节约成本,孵化新的运营模式和商业模式。
那如何选择云计算方案,为什么微软私有云解决方案能够脱颖而出呢?
云计算的利器 – 微软私有云产品
目前,云计算已成为软件服务提供商的战略发展方向,多家公司投入大量人力和资金研发云计算技术和产品。面对市场诸多产品的竞争, 之所以能够脱颖而出,源于其独特的竞争优势和高性价比:
一体化云数据中心管理
是一体化、集中式的云数据中心管理解决方案,其组件覆盖从资源管理到监控、从配置管理到数据保护,从运维管理到自动化,并且实现了各组件间高度集成,例如,SCOM 监控主机运行状态,当负载高或发生故障时触发报警,随即通知 SCVMM 重新分配资源或将虚拟机动态迁移到其它主机上。功能的完整性和一致、友好的用户体验使得 IT 人员更易于开展日常运维和管理工作。
易于扩展的开放性
企业通常要求对软件功能进行定制开发以符合差异化的业务需求,这意味着软件本身需具备优秀的扩展性。 提供了强大的访问接口 – 基于 Web 的 DDTK 和基于对象的脚本语言 ,开发者可以通过这两类接口调用或扩展 中的大部分功能,例如,发布模板、创建虚拟机、获得资源监控数据等。另外,官方和社区网站也提供了软件开发工具包 (SDK) 和实例代码下载,大大缩短了开发者的学习曲线。
虚拟化的异构支持
可将多种虚拟化纳入一个统一工具进行管理,不仅提供了对 Hyper-V 无以伦比的支撑管理能力,也提供了对 虚拟化平台的支持,另外,即将推出的 2012 也将支持 Ctrix 管理功能。据 调查显示,有70%的 CIO 担心在云计算中受限于一家厂商,所以, 作为统一的云平台,管理多种虚拟化平台的能力,极大的增强了客户对此产品的信心。
图1 – 微软私有云解决方案 2007
量体裁衣 – 基于 定制开发
由于 IDC 业务的服务对象是企业和政府用户,用户需要通过互联网访问的方式申请和管理资源,于是,开发团队在 的基础之上开发两个门户:一是自服务门户,为最终用户提供自助申请/变更/撤销、资源使用和监控等功能界面呈现和交互;二是云管理门户,为运维人员提供服务目录管理、资源池管理、资源监控、服务请求管理和报表等功能。
图2 – 上海电信 IDC 云计算平台逻辑架构
从技术层面上看,门户中的功能逻辑实现需要使用 或 DDTK 向 下达指令,指令执行完成后,通过同步或异步的方式将结果返回到门户中。例如,在虚拟机操作页面和资源使用统计页面的开发过程中,开发人员从 获取了虚拟机常用信息、桌面实时截图、监控数据、虚拟机操作指令、物理主机资源信息等。
图3 – 自服务虚机操作界面
图4 – 资源使用统计界面
项目团队在开发门户过程中使用了诸多微软的技术和产品:
集成开发环境 – 2010,帮助项目团队开发代码、单元测试、版本发布、源代码管理和提高团队协作效率。开发语言/技术 – C#//WCF/WF, 前台界面层与后台逻辑层是通过 WCF 开发的 Web 进行交互,资源调度的工作流设计使用 WF 进行定制。数据库 – SQL 2008 R2,存储门户后台处理逻辑中所使用的信息以减少对 的调用频率。身份认证 – ,为加强对云平台的安全性管控,平台中的主机和虚拟机被加入到域中,进行账户、身份认证以及策略管理。
团队的力量 – 项目团队
为保障项目实施质量,项目团队的组织结构、角色和责任需要进行规划和合理安排。例如,安排专职或兼职的需求人员和业务专家梳理和分析客户的需求,形成需求文档;由熟悉 的设计人员设计系统功能和技术架构,编写设计文档;由开发组人员根据设计规格进行功能开发,然后,提交给测试组人员进行系统集成测试和性能测试。质量人员督导项目合规性和质量,同时,实施方项目经理应制定与项目团队和客户方的沟通计划,控制项目进度和规避项目风险。
图5 – 上海电信 IDC 云计算平台团队组织结构
从软件开发生命周期管理角度,考虑到该项目的创新性和工期压力,频繁的需求变化和调整是不可避免的,故采用了敏捷开发管理方法(Scrum),即每一个阶段由若干个迭代组成,且每一个迭代控制在2周以内,通过与客户方的紧密合作,最终确保了系统功能与客户期望的一致性。
顺利启航 – 平台的安全运维
上海电信 IDC 云计算平台自投产以来,通过基础设施云技术的支撑,实现了对有限的物理服务器资源的有效利用,提高了电信的运营效益与收益。但随着客户和业务的不断增加,平台面临的安全挑战也逐步显现,所以,健全安全运维机制对平台的顺利运行起到重要的作用。
云平台权限分离模型
在云管理平台中,可将具有独立操作、管理功能的服务器/应用权限分别进行定义,形成独立的权限组,例如数据库管理员、SCVMM 管理员、SCOM 管理员、域管理员、云管理门户管理员等。将需要进行这种操作的用户加入到相应的权限组中,赋予权限。所有的权限应该尽可能的小,每个角色下面每个用户都应有独立帐户,最大程度上避免帐号混淆产生的问题和职责不清的问题。
云平台虚机的安全管理
对于云平台上开通的虚拟机会默认加入域,接受域服务器的统一控管。这种管理方式的优势在于:
平台安全与审计
在云平台运维过程中,应采用有效的系统安全审计,建立规范的审计机制,也是确保平台安全运维的最有效保证。利用活动目录(AD)的安全审计功能,审计员通过审查确保用户和组的权限信息的正确性,例如,对于负责部分管理职能的管理员,只能获得用于行使他们职能范围之内的权限,避免具有其他管理权限。
展望未来
“人云亦云”的云计算概念炒作即将远去,云终究要化成雨落入大地,随着云计算市场的日渐成熟,云计算产品功能会更加完善和贴近客户需求。即将发布的 2012 将会给我们带来更多的期待和惊喜,例如,更广泛的虚拟化平台支持,更全面的资源管理,基于 ITIL 的服务管理提升,多层次灵活的角色访问控制,对 Azure 的支持等。这些功能会进一步加快企业从传统 IT 向服务化、标准化和自动化的演进速度,建立起新一代的 IT 数据中心管理框架。
这里,将工作实践中对云计算未来发展的一些观点和建议整理于此,以供参考:
自动化提升 IT 竞争力
企业通常将大量的预算投入到已建系统的维护工作,IT 人员不得不分散大部分精力和时间在这些重复性较高的事情上。通过自动化能力的提升,将极大的提高 IT 人员的工作效率,减少运营成本,有利于将节省的预算和人力投入到更具创新性的工作中。微软将收购的 并入到 2012 成为自动化组件 ,为私有云中的自动化能力提供了强劲动力,同时,建议能够支持更多厂商的产品,例如,硬件和中间件、消息队列、数据库等。
高可用为业务保驾护航
将来越来越多的用户期望将关键业务运行在私有云上,所以,私有云如何通过高可用和自动化技术保证业务连续性是一个热门话题。建议 提供跨资源池、跨群集的高可用,支持不同资源池或群集间的故障转移,例如,当一个资源池由于网络异常无法正常访问时,能够实现故障转移,并将应用请求快速切换到另一个资源池上(可能处于不同数据中心中)。
应用迁移到云端
从传统 IT 环境到虚拟化,再从虚拟化到私有云的趋势,将成为企业 IT 架构转变的必经之路。但企业通常缺乏应用迁移的经验和能力,感觉到不知所措、无从下手,从而延误了最佳时机。建议 提供功能更加丰富的容量规划和迁移评估工具,简化应用迁移的实施难度,例如,鉴于 X86 替代小型机的趋势,提供从小型机系统(AIX 或 HP-UX)到 X86 的应用迁移评估工具等。
公有云与私有云融合
长远来看,随着公有云的发展,企业除了在内部私有云中部署应用外,部分应用将运行在公有云服务提供商所提供的环境中。进一步提高对公有云的接入和管理能力,为企业提供统一的资源和应用管理平台,是私有云解决方案未来的一个重要趋势。 2012 可以管理和监控 Azure 上的应用,是一个良好的开始,从开放角度出发,建议进一步得支持更多的公共云服务(如 , , 等)的整合能力,实现企业在不同公有云中的数据安全转移和资源的集中管控。
最后,相信微软私有云解决方案会赢得市场的更多认可,帮助更多的企业在云端畅游漫步!
参考