免费陕西麻将游戏|免费正宗陕西麻将
你好,游客 登錄
背景:
閱讀新聞

劉鵬在中國互聯網大會云計算峰會上的演講

[日期:2009-11-04] 來源:騰訊科技  作者: [字體: ]



中國電子學會云計算專家委員會委員、解放軍理工大學教授劉鵬(騰訊科技攝)

騰訊科技訊 11月2日下午消息,“網絡技術創新應用論壇暨2009云計算產業峰會”在北京國際會議中心舉行。作為2009中國互聯網大會的重要組成部分,本次峰會將以“解讀云計算中的沸點與精彩”為主題,重點探討云計算的應用與發展趨勢,對用戶信息化應用將產生的實際影響,分享最新研究成果及實踐經驗。云計算的理念和模式如何能夠在中國特色互聯網應用中落地,給中國互聯網用戶切實帶來怎樣的革命性進步,都將在2009云計算峰會中給出全新答案。

2009互聯網大會會于11月2日至3日在北京召開,騰訊科技作為官方指定戰略合作門戶網站、官方指定獨家合作新聞中心進行全方位的視頻、圖文采訪與直播。特設立4個現場專訪間,力邀業界專家與企業代表剖析產業現狀,暢談產業前景,并就金融危機一年來的發展進行深度解讀。

以下為中國電子學會云計算專家委員會委員、解放軍理工大學教授劉鵬演講的文字實錄:

演講題目:《云計算--將計算變成水和電》

對應的PPT請下載:http://www.ohifb.tw/download/ppt/cloud_liupeng.ppt (11MB)

劉鵬:我今天主要講講云計算一些內在的東西,從技術上看,它到底是什么?另外,云計算為什么受歡迎?然后我們對未來做一些預測。

我們有一個夢想。這個夢想始于很多年前。就是我們希望使用互聯網上的資源能不能像水和電一樣,打開龍頭插上插頭就可以使用了,而不必關心計算、存儲、數據資源在什么地方。這個夢想有沒有實現呢?我們正一步一步走向這個實現階段。

首先我們看網格計算。所謂網格計算,是在動態變化,由多個機構組成的虛擬組織中協調資源共享和求解問題。網格現在發展得怎么樣呢?現在美國的TeraGrid網格已經集成了幾百家機構的高性能計算資源。歐洲的EGEE網格已經集成了48個國家250個站點的資源,平均每天運行的作業量是15萬個。這個已經朝我們剛才說的夢想前進了一大步。但是這個網格為什么沒有引起我們極大的興趣呢,因為這個網格主要是局限于一些大的研究機構,沒有走進我們的日常生活。

走進日常生活的計算就是云計算。由于公眾對網格的熱情不像以前那么濃了,現在逐漸成為科學家的一種基礎設施了,而且它的應用面是有限的。但是云計算,大家可以看到,從07到09年增長速度是非常快的。包括Google、亞馬遜、微軟、IBM這些重要的大公司,以及Facebook、Salesforce這樣的小公司也在用云計算。

我對云計算下的定義是:云計算是一種商業計算模型,它是將計算任務分布在由大量計算機構成的資源池上面,使各種應用系統能夠根據需要獲取計算力,存儲空間和信息服務。我們理解的云計算實際上是一個資源池,就好象今天中午我們在吃自助餐一樣。原來我們各點各的菜,現在我們把所有的菜集中在一起,你可以按需獲取你的資源。資源共享了,品種多了,浪費少了。你點來的菜,可能吃掉的只有50%,這還因為我們每天飲食的需求基本上是確定的。如果你每天的需求是不確定的,浪費還會更嚴重。有的時候我們非常餓的時候,點的菜非常多,但是吃不掉。

我們來看看亞馬遜提供的典型的云計算服務,一個是S3,叫簡單存儲服務。S3提供給公眾的編程接口很簡單,就是把數據放到虛擬的桶里,交給亞馬遜。想要的時候,把桶中的數據取出來。存儲方式的確非常簡單,但是使用起來不方便,用戶必須要調這個接口,而且沒有目錄,不能直接存儲文件,因為它不支撐POSIX接口。但是S3非常受歡迎,為什么呢?它非常便宜。你存儲一個GB的數據,存放一個月只需要花費0.15美元。

我們再來看看亞馬遜的EC2服務,即彈性計算云服務。有了EC2,你可以用租用亞馬遜的服務器,動態租用它10臺機器,或者是100臺機器。它給你提供一個工具,這個工具可以把你機器目前運行的環境整個打成一個包,這個包叫一個映象。將這個映象傳到亞馬遜的服務器上面,展開之后就可以恢復出跟你機器一模一樣的環境,這個過程叫做虛擬化。我想將租來的機器虛擬化什么樣都可以,比如我想將租用的機器做成一個數據庫,做成一個網站,做成數據處理節點,都可以。我覺得,這是EC2受歡迎最根本的原因之一,即通用性,它使用亞馬遜云計算可以用來滿足各種應用的要求。EC2受歡迎的第二個原因是它的可伸縮性。你的一個映象可以傳到十臺機器,也可以傳到一百臺機器,只要你付錢。當業務量大的時候,你可以多租一些機器,當業務量下來的時候,你可以退掉一些機器。EC2受歡迎的第三個原因是它非常便宜,租用一個服務器一小時,只需要付0.10美元,比到網吧用電腦還要便宜得多。

由于亞馬遜提供了非常便宜又非常強大的服務,所以我們可以用它來做以前想都沒想到的事情。比如這家小公司,它的設施基本都可以租用亞馬遜的機器,存儲的數據是放在S3服務,處理節點用的是EC2。還有一家公司SMUGMUG,它的網站上面已經有幾億張高清圖片,擁有幾十萬付費用戶,這么大的規模,這家公司人數只有五十人,之所以如此,是因為它所有的設施都是托管于亞馬遜的。紐約時報曾經使用亞馬遜的服務,在24小時之內就把歷史上所有的文章從TIF格式轉化成PDF格式,一共才花了240美元。別少看這240美元,它可以租2400個機器小時。如果紐約時報要用自己的機器來完成的話,需要幾個月的時間才能做好。所以亞馬遜的服務給業務量不確定應用帶來非常大的好處。事實上,大多數互聯網應用都是業務量不確定的。

我們再來看看Google。Google幾乎所有的業務,包括Gmail、Google Maps、Google Earth、Google Docs和新近出來的Google Wave,全部都是在云計算上運行的。我們可以通過各種終端、在各種平臺上訪問Google服務,可以是手機,可以是PC,也可以是Macintosh,或者在Linux環境中。Google之所以能夠做到這一點,根本原因是它后面的云計算設施。Google把這些云設施建到非常偏遠的地區,比較冷和靠近電站的地區,用電成本非常低,通過光纖傳信息來代替通過電線傳電力。Google有一個說法,傳輸光子的成本要遠遠地公共低于傳輸電子。Google的云計算數據計算中心目前分布于30多個不同地點,共有200多萬臺計算機。我們來看看一些圖片,這些云設施,被人們稱為“信息時代的核電站”。再看看機房內部,有些機房里的機器就是一大堆普通的PC。極其廉價,但非常容易壞。Google認為,機器會壞是正常的,不壞是不正常的。Google牛就牛在任意一個節點壞,或者兩個節點同時壞,它的數據不會丟,服務不會中斷。它的云計算設施管理起來也非常方便,一個人可以管理上千臺機器。這個人用小推車推了一些機器,看到機架上哪臺機器的燈在閃,就將它拿下來,換一個新的插上去就可以了。你們看,圖片上的機器是難看的背面對外,為什么?更換方便!

要做到這個境界,Google主要依靠四個技術:GFS、MapReduce、Bigtable和Chubby。這里我主要講下Google文件系統GFS。這個文件系統能做什么呢?我們看這張圖:GFS將集群里的節點分為管理節點和數據節點兩類。管理節點存儲元數據,客戶端通過訪問管理節點來獲得文件應該存儲在什么位置的信息。一個文件被分布若干塊存儲于不同的數據節點上,客戶端從管理節點知道存儲的節點編號后,就可以直接訪問數據節點存取數據。這樣,數據傳輸是直接發生在客戶端與管理節點之間的,管理節點只需要處理元數據訪問請求,從而不會在管理節點形成瓶頸。我們再來看數據是怎么存放的。Google的數據塊是比較大的,默認是64MB一塊,這和Google應用的特點有關。任何一塊數據在GFS里默認是有3份的,當客戶端向數據節點A存儲了一個數據塊,A會立即將它復制給B和C。如果B壞了,會自動再復制一份給D。Google對GFS的訪問作了許多限制,例如不允許在文件的中間去修改數據,但可以在后面加數據。之所以作限制,是為了實現方便并提高整體的可靠性。這個系統無論規模做得很大,瓶頸也不會顯現出來,這個Google文件系統,看似非常簡單,但是是一個非常巧妙的系統。如果GFS只管理了100臺機器,看起來并不高明,甚至比不上常見的分布式文件系統,但當GFS管理了100萬臺機器時,它的優勢就顯現出來了。這就是規模效應。

微軟也推出了Azure云計算服務。你可以到微軟的網站上申請一個帳號,它給你一個空間,這個空間是免費的25個GB。這個免費空間的容量是一個非常驚人的數字。因為我們知道,原來Google發布Gmail的時候是一個G,后來163做了3個G的免費空間,現在還是3的G。25GB免費,用傳統的技術是根本做不出來的,成本太高。只有用計算才有可能,因為云計算的成本是傳統技術的1/30。如果25個GB用亞馬遜的架構的話,是多少錢呢?考慮到利用率,大概不到十塊錢人民幣,基本上微軟公司每個月花在你這25個G的空間的成本上是只有十塊錢。

國內呢,中移動的“大云”是比較早的,從2007年就開始了。這個云設施一共有256個結點,前面他們已經介紹了。我們也做了云計算存儲系統MassCloud,現在有少量的部署,在技術上比較特別和實用。

云計算的技術體系是不統一的,不同廠家,亞馬遜、Google、微軟都有不同的解決方案,現在,我們認為它們其實是有共性的。這是我們畫的云計算共用體系結構圖,它們都有資源池,由中間件來管理,只是不同的廠家實現了不同的模塊。

為什么云計算擁有劃時代的優勢?主要原因在于它的成本。企業的IT開銷,分為三部分:硬件開銷、能耗和管理成本。根據IDG的調查,全球企業IT開銷中的硬件開銷是逐年下降的。能耗的成本上升得很厲害,管理的成本上升最厲害。如果使用云計算的話,成本有很大的區別。剛才中國移動說成本節省30倍,Google也說節省了30倍,我們來算一算:根據UC Berkeley的統計數據,使用云計算技術后,特大型數據中心的網絡、存儲和管理成本較之中型數據中心可以降低5-7倍。另外,雖然在我們國家電是統一價格,但在美國是不一樣的,夏威夷本地沒有資源,要運煤過去發電,所以價格比較貴。愛達荷州的水電比較方便,所以電價比較便宜。二者相差7倍。再者,資源的利用率也不同。比如一個網站,平時訪問人很少,但是到圣誕節前時候訪問量很多。再比如某一個網站,之前默默無聞,但是突然來個芙蓉姐姐,訪問量爆增。網站擁有者為了應對這些突發流量,會按照峰值要求來配置服務器資源,造成這些資源的平均利用率只有10-15%。而云計算平臺是大家共享的,資源的利用率平時都能維持在80%左右,這又是5-7倍。云計算有更低的硬件成本和更低的電價,更高的資源利用率,兩個乘起來就是30倍以上的成本節省。

在這里,我們總結一下云計算的特點。它是超大規模,是靠規模效應取勝的;它是虛擬化的,它是高可靠的。它是通用的,這個和網格有很大不同,云計算可以把遠端的云變成任何想要的樣子,而網格計算只能跑高性能計算程序。另外它是高可擴展的,它是按需服務的,它是非常便宜的。由于云計算有這些驚人的特性,所以,我們可以預料,在未來三到五年里,傳統的IT企業將發生翻天覆地的變化。例如,IDC企業如果不轉型的話,如果國內出來一個云計算的數據中心,它可以用原來三十分之一的價格拉你的客戶的話,你的客戶肯定跑光了。所以云計算將計算變成了大眾用得上和用得起的水和電。

由于云計算的出現,使得曾經被認為是正確的,后來又認為是非常荒謬的預言又變成接近正確的了。一個是IBM的創始人Thomas Watson,他說:“我認為全球大概只需要五臺計算機就夠了”。的確,云計算是靠規模取勝的,Google、Amazon、Microsoft和IBM等企業都在拼命擴展他們的云計算版圖。這至少已經有4臺“計算機”了。第5臺是誰的?會是中國的嗎?這需要做許多工作。另一個預言是BillGates作的。他說:“640KB內存應該對任何人都夠了”。隨著云計算的發展,上網本、手機上網流行起來了,甚至彩電、冰箱、攝像頭、數碼相機都能直接上網,對終端的能力要求不強了,即使640KB內存不夠,2GB應該在相當長的時間里夠了。我們以前老覺得機器慢,老是升級操作系統,但現在Windows XP我們已經用了許多年了,還不覺得非換不可,為什么?是因為我們上網了,我們的精彩在網上,不在本機上。試想,有了云平臺,未來的精彩將更精彩!

我們來看看網絡計算發展的趨勢。95年出現了集群計算,98年出來網格計算,99年出了對等計算(P2P),07年出來云計算,那么下一個會出現什么?我們暫且叫做云格,我造了一個新詞,叫Gloud,它是Grid+Cloud。我們把云計算和網格計算做一個比較,網格計算集成不同單位的異構資源,云計算集成同一單位的同構資源。網格計算以科學計算為主,云計算是以數據處理為主,網格計算是共享高性能計算機,云計算共享普通計算機。網格主要用在科學界,云計算主要用在商業社會。網格計算與云計算有很強的互補性。未來它們將融在一個面向服務的開放環境里面,云和云之間融合,云和網格融合,所有的東西都是服務,這就是我們的未來。

云格(Gloud)的世界將更精彩...

謝謝!

推薦 打印 | 錄入: | 閱讀:
相關新聞      
本文評論   
評論聲明
  • 尊重網上道德,遵守中華人民共和國的各項有關法律法規
  • 承擔一切因您的行為而直接或間接導致的民事或刑事法律責任
  • 本站管理人員有權保留或刪除其管轄留言中的任意內容
  • 本站有權在網站內轉載或引用您的評論
  • 參與本評論即表明您已經閱讀并接受上述條款
免费陕西麻将游戏 老版吉祥棋牌 新疆时时彩开奖结果喜乐彩 云南11选5遗漏 股票行情大盘走势湖南黄金 l辽宁11选5 复式分解器 竞彩网五分彩在线计划 金牛棋牌官网 五分彩走势 中国七星彩开奖现场直播