數(shù)據(jù)存儲(chǔ)對(duì)象包括處理過程中數(shù)據(jù)流生成的臨時(shí)文件或處理過程中要搜索的信息。數(shù)據(jù)以某種格式記錄在計(jì)算機(jī)的內(nèi)部或外部存儲(chǔ)介質(zhì)上。NAS數(shù)據(jù)存儲(chǔ)方式全面改進(jìn)了以往低效的DAS存儲(chǔ)方式。它使用獨(dú)立于服務(wù)器的、為網(wǎng)絡(luò)數(shù)據(jù)存儲(chǔ)而開發(fā)的文件服務(wù)器來連接存儲(chǔ)設(shè)備,并自行形成網(wǎng)絡(luò)。這樣,數(shù)據(jù)存儲(chǔ)不再依附于服務(wù)器,而是作為一個(gè)獨(dú)立的網(wǎng)絡(luò)節(jié)點(diǎn)存在于網(wǎng)絡(luò)中,所有網(wǎng)絡(luò)用戶都可以共享。
如前所述,云計(jì)算的本質(zhì)是對(duì)有形產(chǎn)品(如網(wǎng)絡(luò)設(shè)備、服務(wù)器、存儲(chǔ)設(shè)備、各種軟件等)進(jìn)行改造。轉(zhuǎn)化為服務(wù)產(chǎn)品,并讓人們通過網(wǎng)絡(luò)遠(yuǎn)程在線使用。計(jì)算資源主要指服務(wù)器(中央處理器、內(nèi)存)、存儲(chǔ)和網(wǎng)絡(luò)。一方面,存儲(chǔ)是虛擬內(nèi)存的組成部分,另一方面,它也是軟件和數(shù)據(jù)的存儲(chǔ)場(chǎng)所。
CPU和內(nèi)存通過主板緊密綁定在一起,利用主板上的高速并行總線進(jìn)行通信。目前的技術(shù)無法將它們分開,也沒有必要。但是,如果將存儲(chǔ)與CPU分開(不是通過主板直接連接),會(huì)有很多好處,比如共享存儲(chǔ)、無狀態(tài)計(jì)算機(jī)、計(jì)算資源的方便橫向擴(kuò)展。
目前可以將CPU和存儲(chǔ)分離的技術(shù)有很多,比如FC、FCoE、iSCSI、NFS、CIFS等。前三種是磁盤塊共享技術(shù),后兩種是文件共享技術(shù),還有塊共享SAN產(chǎn)品和文件共享NAS產(chǎn)品。
一個(gè)磁盤塊等于整數(shù)個(gè)磁盤扇區(qū),一個(gè)磁盤扇區(qū)可以存儲(chǔ)512字節(jié)的數(shù)據(jù)(現(xiàn)在大容量硬盤是4KB扇區(qū)),扇區(qū)是讀寫硬盤的最小單位。也就是說,小于一個(gè)扇區(qū)(512B或4KB)的數(shù)據(jù)一次不能從硬盤讀取或?qū)懭搿V苯幼x取磁盤塊不需要操作系統(tǒng)的參與,而是讀取硬盤上的文件(比如復(fù)制“我的簡(jiǎn)歷。doc”到u盤)需要操作系統(tǒng)的配合。根據(jù)存儲(chǔ)和CPU的分離程度,存儲(chǔ)可以分為以下三種類型。
1)外部存儲(chǔ):存儲(chǔ)和中央處理器不在同一臺(tái)計(jì)算機(jī)上。例如,存儲(chǔ)區(qū)域網(wǎng)絡(luò)和網(wǎng)絡(luò)連接存儲(chǔ)是獨(dú)立的存儲(chǔ)設(shè)備,通過以太網(wǎng)電纜或光纖與計(jì)算機(jī)連接。專用存儲(chǔ)網(wǎng)絡(luò)設(shè)備非常昂貴。隨著以太網(wǎng)速度的不斷提高,基于以太網(wǎng)的存儲(chǔ)技術(shù)越來越普及。比如iSCSI,10Gbit/s的網(wǎng)卡可以提供1GB/s的理論速度。注意這里的單位是Gbit/s和GB/s,前者代表每秒多少位,一位是二進(jìn)制數(shù),要么是0,要么是1;后者表示每秒多少字節(jié),一個(gè)字節(jié)等于8位。計(jì)算機(jī)中的一個(gè)字節(jié)在通過網(wǎng)卡傳輸之前需要加上一個(gè)校驗(yàn)位和一個(gè)停止位,所以一個(gè)字節(jié)在傳輸?shù)骄W(wǎng)絡(luò)時(shí)需要占用10位。
2)直接存儲(chǔ):內(nèi)存直接插入主板,通過PATA、SATA、mSATA、SAS、SCSI或PCI-E接口總線進(jìn)行通信。傳統(tǒng)機(jī)械硬盤一般采用PATA、SATA、SAS、SCSI接口。與外接存儲(chǔ)相比,機(jī)械硬盤直接插在主板上的速度優(yōu)勢(shì)越來越不明顯,但固態(tài)硬盤(如mSATA、PCI-E)的速度優(yōu)勢(shì)明顯,尤其是PCI-E固態(tài)硬盤,代表了行業(yè)頂級(jí)的存儲(chǔ)技術(shù)。
3)分布式存儲(chǔ):通過分布式文件系統(tǒng),每臺(tái)計(jì)算機(jī)上的直接存儲(chǔ)被集成到一個(gè)大存儲(chǔ)中。對(duì)于參與存儲(chǔ)的每臺(tái)計(jì)算機(jī),既有直接存儲(chǔ),也有外部存儲(chǔ),因此分布式存儲(chǔ)集成了前兩種存儲(chǔ)方案。由于需要使用分布式文件系統(tǒng)來集成分散在每臺(tái)計(jì)算機(jī)上的直接存儲(chǔ),并使其成為一個(gè)單一的命名空間,因此涉及的技術(shù)、概念和體系結(jié)構(gòu)都非常復(fù)雜,并且還會(huì)消耗額外的計(jì)算資源。
服務(wù)器存儲(chǔ)區(qū)域網(wǎng)絡(luò)(Server SAN)逐漸被數(shù)據(jù)中心所采用,發(fā)展迅速。Ceph分布式存儲(chǔ)系統(tǒng)屬于Server SAN,被很多云中心采用。目前,軟件定義存儲(chǔ)(SDS)的概念是分布式存儲(chǔ)。存儲(chǔ)的評(píng)估指標(biāo)包括容量、速度、每秒讀/寫次數(shù)(IOPS)和可用性。“容量”很容易理解,即可以存儲(chǔ)的數(shù)據(jù)總量。
在實(shí)際項(xiàng)目中,我們更在意有效容量,比如4個(gè)1TB硬盤,加起來就是4TB,但如果這4個(gè)硬盤是鏡像的(RAID-1),那么有效容量就是2tb;如果制成RAID-5,有效容量將再次不同。容量需求容易滿足,一般采用水平擴(kuò)展。“速度”是指每秒傳輸?shù)臄?shù)據(jù)量,速度和帶寬是同一個(gè)概念。
IOPS是最重要的指標(biāo),它被定義為每秒響應(yīng)讀(或?qū)?操作的次數(shù),反映了并發(fā)性和隨機(jī)訪問能力。IOPS與磁盤的速度和平均尋道時(shí)間密切相關(guān),磁盤的平均尋道時(shí)間為4 ~ 12 ms,對(duì)于轉(zhuǎn)速為7200rpm的磁盤,我們可以計(jì)算出IOPS的近似值:1000÷[1000÷(7200÷60)÷2+8]= 83。對(duì)于單個(gè)磁盤,“讀/寫”磁盤在微觀層面上是串行的。
比如100人同時(shí)訪問磁盤時(shí),磁盤會(huì)逐一響應(yīng)用戶的請(qǐng)求,但在宏觀層面上卻表現(xiàn)出并行性,即一秒鐘內(nèi)有100人同時(shí)訪問磁盤,給人一種并行的假象。有許多方法可以改善IOPS,例如使用更好的硬盤(如固態(tài)硬盤),增加磁盤數(shù)量并分散對(duì)每個(gè)硬盤的訪問,或者使用更多的緩存,以便經(jīng)常訪問的內(nèi)容駐留在緩存中。租用服務(wù)器可咨詢夢(mèng)飛云idc了解。