隨著傳統媒體日益數字化,內容越來越多地存儲在數字卷中,而不是傳統內容(電影、報紙、設計圖紙、客戶信息、辦公室文檔等)。換言之,商品正在從實用物品轉變為虛擬物品。這樣,內容很容易分發和復制。因此,數據保護成為確保數據所有權的關鍵條款。數據定價、數據交易和數據保護構成了一個相互影響的三維閉環。為了實現數據所有者的最大利潤和數據的最大價值,數據保護是不可分割的一部分。下面,我們將討論大數據生命周期的最后一個重要階段,即數據保護。


建立數字版權管理(DRM)是為了防止數字內容被故意復制、共享和竊取,更重要的是作為數字版權保護發展的指導方針。2001年初,W3C成立了第一個DRM集團,作為參與全球數字版權管理的標準組織。實現DRM的解決方案多種多樣,包括XrML版權表達語言、Microsoft DRM、Apple HLS DRM、Adobe Flash access DRM、RealNetworks Helix DRM和OMA DRM規范。
所有這些DRM解決方案都需要五個關鍵組件:(i)安全性。它著重于內容的加密以及為數字內容創建哈希、水印和數字簽名;(ii)訪問控制。它負責身份和訪問管理,并為需要訪問受保護數字內容的用戶提供憑據。此外,該組件監視授權用戶的行為,并為不同用戶設置不同的訪問權限;(iii)使用控制。它監視每個授權用戶的使用情況,并將使用情況記錄為歷史記錄;(iv)許可證管理。它向授權用戶發布許可證(密鑰、XrML文件、身份驗證代碼),并控制和檢查許可證的生命周期(有效期);(v) 付款管理。此組件與使用控制一起工作,并計算用戶需要支付的費用。這是數字商務的主要目標。
我們以Microsoft DRM為例來解釋DRM的工作原理。如圖7所示,匿名用戶嘗試訪問內容服務器(content server)以播放或下載某些內容,這些內容受DRM服務器保護。他或她首先向個性化服務器發送請求。然后服務器檢查個性化客戶端設備上的應用程序。如果有應用程序正在運行,應用程序將向DRM服務器發送許可證要求。個性化應用程序是一個客戶端DRM軟件,稱為個性化黑盒(IBX)。如果沒有此軟件,DRM服務器將無法釋放解密內容的許可證。為了滿足IBX的要求,DRM服務器釋放加密的許可證。當用戶試圖解密許可證時,IBX保護敏感信息,這種過程稱為個性化。釋放許可證后,DRM服務器將檢查用戶狀態。如果這是第一次訪問服務器,DRM將要求用戶加入域。不同的域區分特定用戶的內容和權限。這就是DRM實現訪問控制的方式。最后,允許用戶訪問內容服務器(content server),內容服務器會發回內容。
(圖7. Microsoft數字版權管理工作流)


根據不同的數字內容,我們將DRM模型分為以下三類:(i)基于軟件的DRM,(ii)基于多媒體的DRM,以及(iii)基于非結構化數據的DRM。

最常見的DRM是基于軟件的DRM,因為軟件是計算機上使用最廣泛的應用程序。軟件屬于數字商品,易于復制和重新制作,成本為零。因此,軟件開發公司通常設計保護版權和防止盜版入侵的機制。最佳的DRM機制可以記錄安裝時間和PC標識信息,并支持多個安裝和主機。
涉及的主要方法有兩種:在線身份驗證和離線身份驗證。對于在線身份驗證,當用戶開始安裝過程時,軟件首先檢查Internet連接。如果存在Internet連接,軟件將向DRM服務器發送身份驗證請求,如上面討論的常見DRM策略中所述。否則,安裝將在沒有Internet連接時停止,或者只安裝SoftwareDemo。脫機身份驗證比聯機身份驗證更重要。如果不支持脫機DRM,本地許可證文件將很弱,并且很容易解密。許多研究工作集中于離線身份驗證。例如,Reavis Conner和Rumelt提出了一個成本函數來衡量解密的復雜性。如果解密成本大于此函數確定的價格,則軟件是安全的。Barapatre等人提出了一種結構,以增加解密許可證文件的復雜性。該模型使用靜態和動態代碼的代碼注入和軟件版權保護(SCP)技術對許可證文件進行加密,以保護原始軟件。在軟件層和許可證層(許可證文件、硬件令牌管理文件、庫文件等)之間引入了保護動態鏈接庫(DLL)層。因此,用戶不能直接訪問認證信息。

多媒體是數字商品最重要的組成部分。超過80%的互聯網流量專用于視頻內容。因此,帶來的巨大的挑戰是如何妥善保護多媒體內容的版權。一般來說,加密和水印技術就是在這個方向上使用的。軟件和多媒體(視頻和音頻)的最大區別在于在線流媒體。在線視頻和音頻支持實時協議(RTP)/實時流協議(RTSP),以實現在線流,并且在某些情況下,需要支持組域身份驗證(家庭成員、企業用戶等)。通常,對手會在主機上運行惡意客戶端來中斷和監視流,以分析加密密鑰。為了解決這個問題,大衛(David)和扎登伯格(Zaidenberg)提出了一種使用選擇性視頻解密的方案,以確保內容的安全性,同時減少加密時間。此外,選擇性解密是高效視頻加密的一種變體,并且所提出的算法僅對變換參數的符號位進行操作。它不需要額外的空間,并且由該算法加密的流產生H.264比特流。同時,該方案通過限制訪問狀態將加密過程推進到一個安全的環境中。例如,用戶要么處于加密狀態,要么處于解密狀態,但不能同時處于兩種狀態,這是禁止的。
此外,水印技術已廣泛應用于視頻和音頻DRM中。將水印嵌入視頻內容需要對視頻內容進行完全解碼。這是一個關鍵問題,因為這一過程需要大量計算資源,并降低了視頻質量。為了避免隨著視頻比特率的增加而增加嵌入水印的復雜性,提出了一種基于H.264編解碼器標準的盲水印算法。請注意,H.264是基于運動補償的高質量編解碼器標準。H.264標準使用幾個宏塊以及每個宏塊的亮度和色度(Cb和Cr)來表示幀,。水印算法掃描宏塊并選擇最優預測模型。因此,根據H.264的特點,盲水印算法將水印權利嵌入到所選宏塊中,防止共謀攻擊,并在解碼過程中保持視頻質量。
有研究提出了另一種水印算法,該算法適用于基于深度圖像渲染(DIBR)的三維視頻內容。傳統的水印系統要么會破壞三維視頻,造成不可逆的變形,要么容易受到攻擊,而本文提出的綜合Duns水印算法克服了這些問題。所設計的算法基于偽三維離散余弦變換(3D-DCT)和量化索引調制(QIM)將水印嵌入深度圖中,提高了水印的魯棒性,避免了對視頻內容的破壞。值得注意的是,圖像也被視為多媒體內容,類似于視頻和音頻內容,水印技術是保護版權的最常用方法。對于基于圖像的水印系統,通常使用離散小波變換(DWT)、最小有效位(LSB)和離散余弦變換(DCT)算法將水印嵌入到安全密鑰中。此外,可以在一幅圖像中嵌入多個水印。此外,水印方案已被用于追蹤匿名互聯網惡意流量,以識別惡意來源,用于取證。

非結構化數據,如Microsoft Word文檔、PDF文檔、各種數據庫、源代碼等,都是可以方便地傳播和存儲的數字化數據。盡管如此,它是脆弱的,并且很難防止故意復制和篡改非結構化數據。此外,非結構化數據通常具有很高的商業價值,并且包含敏感信息,這些信息的泄漏將導致數據所有者的嚴重損失。因此,非結構化數據保護是當今的一個熱門話題,也稱為數據泄漏保護(DLP)。非結構化數據DRM與其他類型的DRM完全不同,因為數據易于操作和損壞。因此,加密作為一種最安全的方法,通常用于保護非結構化數據。盡管如此,隨著數據規模的不斷擴大,加密過程的成本將繼續增加。例如,史(Shi)等人提出了一種基于概率數據結構(Bloom Filter)的保護方案。該方案將狀態記錄到帶有正標記或屬位標記的矩陣Bloom過濾器中。該方案包括一個分析器,用于分析和掃描內容。與加密方案相比,該方案具有更好的性能。
總之,在本章節,我們闡述了三種數字版權管理模式,并討論了每種模式的現有相關方法。不同類型的數字內容管理,即基于軟件的數字版權管理、基于多媒體的數字版權管理和基于非結構化數據的數字版權管理,已經有了很好的探索??梢钥吹?,數字管理技術是保護大數據不被竊取和復制的關鍵方法。盡管如此,隨著數字內容的快速增長和大數據的交易屬性,現有數據保護方案和更先進技術的可行性有待進一步研究。
七、 結論
本文討論了大數據交易的問題。具體而言,我們首先講述了與大數據相關的現有研究,并確定了數據交易的大數據生命周期,包括數據收集、數據分析、數據定價、數據交易和數據保護。然后,講述了與大數據定價相關的現有工作。關于數據定價,闡明了它的重要性,對不同的市場結構、數據定價策略和數據定價模型進行了分類,然后列出了每種類型的優勢和局限性。對于數據交易流程,我們概述了與數據交易相關的關鍵問題及其可能的解決方案。我們進一步研究了拍賣策略,詳細說明了不同的方案、交易平臺和相關問題。最后,研究了作為大數據生命周期最后階段的數據保護。對現有版權保護方案進行了分類,并概述了大數據版權保護面臨的挑戰。本次調查的主要目的是對大數據交易有一個清晰而深入的了解。我們概述了與數據定價、數據交易和數據保護相關的廣泛主題,并強調了尚未解決的領域,以進一步促進大數據的研究和開發。
譯者:林渠、楊冰之、朱娟英
單位:國脈戰略研究院
來源:IEEE ACCESS
相關鏈接
國脈業務體系
首席數據官系列專題
洞察 | 首席數據官——數據時代價值發掘者的使命和成長之道(之一)
洞察 | 首席數據官——數據時代價值發掘者的使命和成長之道(之二)
重磅 | 《廣州市推行首席數據官制度試點實施方案》發布(全文+圖解)
文件 | 《深圳市首席數據官制度試點實施方案》(全文)
政策丨珠海市人民政府辦公室關于印發珠海市首席數據官制度試點實施方案的通知
圖解 | 一圖讀懂《佛山市首席數據官制度試點工作實施方案》
圖解 | 《肇慶市首席數據官制度試點實施方案》(全文+圖解)
文件 | 江蘇省企業首席數據官制度建設指南(試行)
重點推薦
系列培訓認證研修班:
聯系人:劉丹
電 話:13269683561(微信)
郵 箱:liudan@govmade.cn