|
|
電信博物館 >
多媒體 > 繽紛世界的背后
>
數(shù)據(jù)庫技術(shù)的挑戰(zhàn)
多媒體數(shù)據(jù)庫的新問題
在傳統(tǒng)的數(shù)據(jù)庫中引入多媒體數(shù)據(jù)和操作,是一個極大的挑戰(zhàn)。這不只是把多媒體數(shù)據(jù)加入到數(shù)據(jù)庫中就可以完成的問題。傳統(tǒng)的字符數(shù)值型的數(shù)據(jù)雖然可以對很多的信息進行管理,但由于這一類數(shù)據(jù)的抽象特性,應(yīng)用范圍畢竟十分有限。為了構(gòu)造出符合應(yīng)用需要的多媒體數(shù)據(jù)庫,我們必須解決從體系結(jié)構(gòu)到用戶接口等一系列的問題,多媒體對數(shù)據(jù)庫設(shè)計的影響主要表現(xiàn)在以下幾個方面:
1、數(shù)據(jù)庫的組織和存儲。媒體數(shù)據(jù)的數(shù)據(jù)量大,而且媒體之間的差異也極大,從而影響數(shù)據(jù)庫的組織和存儲方法。如動態(tài)視頻壓縮后每秒仍達上百K的數(shù)據(jù)量,而字符數(shù)值等數(shù)據(jù)可能僅有幾個字節(jié)。只有組織好多媒體數(shù)據(jù)庫中的數(shù)據(jù),選擇設(shè)計好合適的物理結(jié)構(gòu)和邏輯結(jié)構(gòu),才能保證磁盤的充分利用和應(yīng)用的快速存取。數(shù)據(jù)量的巨大還反映在支持信息系統(tǒng)的范圍的擴大,顯然我們不能指望在一個站點上就存儲上萬兆的數(shù)據(jù),而必須通過網(wǎng)絡(luò)加以分布,這對數(shù)據(jù)庫在這種環(huán)境下進行存取也是一種挑戰(zhàn)。
2、媒體種類的增加增加了數(shù)據(jù)處理的困難。每一種多媒體數(shù)據(jù)類型都要有自己的一組最基本的操作和功能、適當(dāng)?shù)臄?shù)據(jù)結(jié)構(gòu)以及存取方式、高性能的實現(xiàn)。但除此之外也要有一些標準的操作,包括各種多媒體數(shù)據(jù)通用的操作及多種新類型數(shù)據(jù)的集成。雖然主要的多媒體類型只有那么幾種,但事實上,在具體實現(xiàn)時往往根據(jù)系統(tǒng)定義、標準轉(zhuǎn)換等演變成幾種媒體格式。不同媒體類型對應(yīng)不同數(shù)據(jù)處理方法,這就要求多媒體數(shù)據(jù)庫管理系統(tǒng)能夠不斷擴充新的媒體類型及其相應(yīng)的操作方法。新增加的媒體類型對用戶應(yīng)該是透明的。
3、數(shù)據(jù)庫的多解查詢問題。傳統(tǒng)的數(shù)據(jù)庫查詢只處理精確的概念和查詢。但在多媒體數(shù)據(jù)庫中非精確匹配和相似性查詢將占相當(dāng)大的比重。因為即使是同一個對象若用不同的媒體進行表示,對計算機來說也肯定是不同的;若用同一種媒體表示,如果有誤差,在計算機看來也是不同的。與之相類似的還有諸如顏色和形狀等本身就不容易精確描述的概念,如果在對圖像、視頻進行查詢時用到它們,很顯然是一種模糊的非精確的匹配方式。對其它媒體來說也是一樣。媒體的復(fù)合、分散及其形象化的特點,注定要使數(shù)據(jù)庫不再是只通過字符進行查詢,而應(yīng)該是通過媒體的語義進行查詢。然而,我們卻很難了解并且正確處理許多媒體的語義信息。這些基于內(nèi)容的語義在有些媒體中是易于確定的(如字符、數(shù)值等),但對另一些媒體卻不容易確定,甚至?xí)驗閼?yīng)用的不同和觀察者的不同而產(chǎn)生不同。
4、用戶接口的支持。多媒體數(shù)據(jù)庫的用戶接口肯定不能用一個表格來描述,對于媒體的公共性質(zhì)和每一種媒體的特殊性質(zhì),都要在用戶的接口上、在查詢的過程中加以體現(xiàn)。例如對媒體內(nèi)容的描述、對空間的描述、以及對時間的描述。多媒體要求開發(fā)瀏覽、查找和表現(xiàn)多媒體數(shù)據(jù)庫內(nèi)容的新方法,使得用戶很方便地描述他的查詢需求,并得到相應(yīng)的數(shù)據(jù)。在很多情況下,面對多媒體的數(shù)據(jù),用戶有時甚至不知道自己要查找什么,不知道如何描述自己的查詢。所以,多媒體數(shù)據(jù)庫對用戶的接口要求不僅僅是接收用戶的描述,而是要協(xié)助用戶描述出他的想法,找到他所要的內(nèi)容,并在接口上表現(xiàn)出來。多媒體數(shù)據(jù)庫的查詢結(jié)果將不僅僅是傳統(tǒng)的表格,而將是豐富的多媒體信息的表現(xiàn),甚至是由計算機組合出來的結(jié)果。
5、多媒體信息的分布對多媒體數(shù)據(jù)庫體系所帶來的巨大影響。這里所說的分布,主要是指以www(萬維網(wǎng))全球網(wǎng)絡(luò)為基礎(chǔ)的分布。Internet網(wǎng)的迅速發(fā)展,網(wǎng)上的資源日益豐富,傳統(tǒng)的那種固定模式的數(shù)據(jù)庫形式已經(jīng)顯得力不從心。多媒體數(shù)據(jù)庫系統(tǒng)將來肯定要考慮如何從萬維網(wǎng)的信息空間中尋找信息,查詢所要的數(shù)據(jù)。
6、處理長事務(wù)增多。傳統(tǒng)的事務(wù)一般是短小精悍的,在多媒體數(shù)據(jù)庫管理系統(tǒng)中也應(yīng)該盡可能采取短事務(wù)。但有些場合,短事務(wù)不能滿足需要,如從動態(tài)視頻庫中提取并播放一部數(shù)字化影片,往往需要長達幾個小時的時間,作為良好的數(shù)據(jù)庫管理系統(tǒng),應(yīng)該保證播放過程中不會發(fā)生中斷,因此不得不增加處理長事務(wù)的能力。
7、多媒體數(shù)據(jù)庫對服務(wù)質(zhì)量的要求。許多應(yīng)用對多媒體數(shù)據(jù)庫的傳輸、表現(xiàn)和存儲的質(zhì)量要求是不一樣的。系統(tǒng)能夠提供的資源也要根據(jù)系統(tǒng)運行的情況進行控制。我們對每一類多媒體數(shù)據(jù)都必須考慮這些問題,如何按所要求的形式及時地、逼真地表現(xiàn)數(shù)據(jù);當(dāng)系統(tǒng)不能滿足全部的服務(wù)要求時,如何合理地降低服務(wù)質(zhì)量;能否插入和預(yù)測一些數(shù)據(jù);能否拒絕新的服務(wù)請求或撤銷舊的請求,等等。
8、多媒體數(shù)據(jù)管理還要考慮版本控制的問題。在具體應(yīng)用中,往往涉及對某個處理對象的不同版本的記錄和處理。版本包括兩種概念。一是歷史版本,同一個處理對象在不同的時間有不同的內(nèi)容,如CAD設(shè)計圖紙,有草圖和正式圖之分;二是選擇版本,同一處理對象有不同的表述或處理,一份合同文獻就可以包含英文和中文兩種版本。我們需要解決多版本的標識、存儲、更新和查詢,盡可能減少各版本所占存儲空間,而且控制版本訪問權(quán)限。但現(xiàn)有的數(shù)據(jù)庫管理系統(tǒng)一般都沒有提供這種功能,而由應(yīng)用程序編制版本控制程序,這顯然是不合理的。
[上一頁] [下一頁]
|
|
|