云计算和云服务是大势所趋,但在采用云服务最开始的时候,就了解到可能导致失败的主要原因并正确地避免它们,才是云服务长期健康发展的基石。

核心教训一:云服务看似很便宜,但如果没有被密切关注和管控,费用就会积少成多,最终导致转回物理硬件。

两年半前,纽曼还在西雅图Cole& Weber广告公司的IT部门工作。当时他从一家名为Tier 3的提供商那里采购了云服务,但后来却中途放弃了,因为成本很快超过了预算。

纽曼称之为云服务滥用(Cloud Sprawl):开发人员随意创建虚拟服务器,用过之后丢弃,再使用其它的虚拟服务器,又不关闭已经不再需要的虚拟服务器,结果虚拟服务器的数据剧增,造成失控。

虽然纽曼预计开发人员最多使用25个虚拟服务器,但实际使用的数量达到了70个左右,他说:“与公司原先计划的开支相比,费用高得失控了。”

他试图改变使用虚拟服务器方面的政策,实现只能从上午7点到晚上7点之间才可以使用虚拟服务器。但难免由于出现赶项目进度、满足最后期限等情况,因此这一招也行不通。

最后,这家公司建立了自己的VMware云环境,最终支持100个虚拟服务器。

纽曼跳槽到了一家开发电脑游戏和在线游戏的Big Fish Games公司,他在这家公司再次试用云服务,碰到了类似的结果。

Big Fish当时租用了亚马逊公司的服务器容量,以发布一款试验阶段的Facebook游戏。这款游戏后来大获成功,游戏放在云环境中运行很好,因为能够迅速扩展,但是成本随之失控了。

于是,纽曼再次从云环境中撤下内容,并将游戏放在公司内部运行。此举在3个月内收到了成效:由于不必支付云服务费用,因而节省了成本。他说,促使这次变化的并不是性能问题。他表示,除非Big Fish公司开展的某个项目将利益于云服务,否则不会再使用云服务。

核心教训二:必须认真阅读云服务的SLA服务水平协议和审查云服务的安全性。

纽曼吸取的其它教训还包括没有认真阅读SLA(服务水平协议)。他说:“你可能遇到了一起严重停运事件,但按SLA的条款,它可能在允许范围之内。”如果云服务商提供99%的正常运行时间,这相当于每月可以停机7个半小时,这可是整整一天。

他对云服务安全持怀疑态度,他其实也没有认真审查过云服务。比如,云提供商表示自己在网络防御方面符合SAS 70标准,但是纽曼担心来自提供商员工的威胁,“就像其他公司一样,提供商最大的威胁来自内部。”

除非制定了可靠的云安全标准并认真审查提供商的安全性,否则他会避免把关键应用程序放在云环境中。他说:“我几乎不得不认真审查提供商所做工作的方方面面。”

此外,还存在不确定性因素。比如说把数据放在某一个数据中心,但云提供商扩大了规模或数据复制到云提供商网络的另一个数据中心,对方怎样知道第二个站点一样安全?

即便有的云提供商在安全方面做得很到位,但仍会要求客户承担部分责任。他说:“对方的立场就是,你需要自行采取必要的措施。”

总结一:滥用云服务的现象非常类似滥用免费邮箱的心理。很多人都有这样的经历:由于能够申请大容量的免费邮箱,往往一个人申请了好几个大容量免费邮箱,每个邮箱都充斥着大量的电子订阅邮件和很多无用的信息,但却长期不去清理,导致免费邮箱运营商的成本不断增加,直到最后关闭免费邮箱服务。这就是云服务的隐性隐患,能直接导致云服务的成本飙升。

总结二:云服务往往伴随着复杂的使用规则和服务承诺细节,需要IT人员认真仔细的阅读和审查云服务商所提供的所有文档,对于文档里的关键数据要有正确的理解,并及时把关键数据对业务的影响通知业务部门。对于安全方面的文档,IT人员要具体了解云服务商到底是如何实现的,在实现的过程中可能还有哪些隐患,以及可能的应对之道。那么问题就来了,云提供商有那么多家,难道要把每家的文档都通读一遍,再详细讨论个中细节?

以上两点的解决之道:一是采用自动化的云服务生命周期管理解决方案,通过自动化的方式发现云服务“垃圾”并及时清理;二是与第三方专业云代理商合作,第三方专业云代理商又称云经纪人,他们通晓各家云服务商的知识与细节,能够很快地帮助企业IT部门做出正确的判断。当然,国内云代理商或云经纪人行业刚刚出现,还在发展的初期,他们或是原来的VAR增值服务代理商、ISV独立软件开发商或SI系统集成商转型过来,也可能是像埃森哲、德勤这样的IT咨询公司。

(以上案例主要部分转载自《助理云经纪师教程》)