云里雾里云计算【13】云计算经济学之时间成本
前文说到,伯克利大学的研究人员算了一笔帐,比较企业自建机房,与租用云计算平台的成本。结论是,租比造好。
成本不仅仅反映在金钱,而且还有其它方面,譬如时间和声誉。声誉如何折射成成本,可能不太好理解,但是时间是成本,这很显而易见。先谈时间。
文章举了一个例子,说是 2008 年 3 月 19 日,美国国家档案馆解禁了一批档案,其中包括希拉里(Hillary Clinton),作为第一夫人,在克林顿任总统的八年间,每日生活的起居录。这份档案共 17481 页,全部是 PDF 格式。华盛顿邮报得到这份档案后,指定一位工程师,让他把文件从 PDF 格式转换成便于搜索的格式。
如果用一台服务器,这份工作需要花费 1400 多小时才能完成。但是这位工程师租用了 200 台 Amazon EC2 服务器,做并行处理,前前后后总共只花了 9 个小时。
“云而上” 这篇文章着重强调,租用一台 EC2 服务器,运行 1400 多小时,与租用 200 台服务器,运行 7 个小时,费用是一样的。以此来强调,云计算超大的并行计算能力,非常适用于高性能计算(HPC,High Performance Computing)。
高性能计算(HPC)的应用很多,海量文本处理是一个例子,科学实验数据处理也是一个例子,令人感兴趣的另外一个例子是动画电影。
文中提到好莱坞 Pixar 制作室也是云计算的用户。Pixar studio 以制作计算机动画见长,曾经获得 21 项奥斯卡奖,4 项金球奖,以及 3 项艾美奖。1979 年成立,当时是拍摄 “星球大战” 的 Lucas 电影公司 的一个部门。1986 年该部门卖给 Apple 的创始人 Steve Jobs,成为一家独立公司。2006 年卖给迪斯尼公司,折价 74 亿美元。
计算机动画的数据处理量大,耗时长,用云计算平台,做大规模并行处理,实在是一个好应用。
Computer Generated Imagery Animation (CGI-Animation)
Courtesy http://upload.wikimedia.org/wikipedia/commons/6/6d/Activemarker2.PNG
云计算做并行计算的能力,能够大大缩短数据处理的时间,这一点大家都不怀疑。令人担忧的是把海量数据上传到云上去,以及把海量数据从云里下载下来,所需要 花费的时间和金钱。所以,有人开玩笑说,云不是问题,问题是云雨。
话是糙了点,但是问题很中肯。文章中举了一个例子,如果想把 10TB 的数据,从伯克利大学通过互联网,上传到位于西雅图的 Amazon 云计算平台,需要 4,000,000 秒,也就是 45 多天。而且还要支付 1000 美元网络带宽费。无论从时间,还是金钱,通过互联网传输 10TB 规模的数据,代价都是非常高的。
如果用邮递方式,把光盘寄过去,需要多少时间和金钱呢?最快的邮递方式是隔夜速递,也就是最多 24 小时。如果每张光盘存放 1TB 数据,那么总共需要 10 张 光盘,邮费大致是 400 美元。
45 天 vs 1 天,1000 美元 vs 400 美元。互联网时代传输海量数据,高科技网络反而比不过传统物流,实在有点反讽。
为什么互联网带宽费用这么高?文章说,光缆并不贵,贵的是高端的路由器。带宽费用的 2/3,用于支付高端路由器的购置费。说到这里,文章提到,一个 “激 进” 的解决办法,是用众多廉价的路由器,去取代高端的路由器。
哦也,如果说云计算是用一堆廉价的机器,去取代大型机(Mainframe),有人在试图用同样的思路,去取代高端路由器!