歡迎訪問(wen)西(xi)安融智(zhi)慧安智(zhi)能科技有限公司官方網站!
第一(yi)章 總體概述
互(hu)聯網、物聯網、云(yun)計算等信息技術(shu)與通信技術(shu)的(de)(de)迅猛(meng)發(fa)展(zhan)使(shi)我們(men)步入了大數(shu)(shu)據(ju)(ju)(ju)(ju)時代,人類活動產生(sheng)的(de)(de)數(shu)(shu)據(ju)(ju)(ju)(ju)呈爆發(fa)式增長(chang),由于海(hai)量數(shu)(shu)據(ju)(ju)(ju)(ju)背后存(cun)在巨大商業(ye)價值,數(shu)(shu)據(ju)(ju)(ju)(ju)泄漏、數(shu)(shu)據(ju)(ju)(ju)(ju)盜(dao)用、數(shu)(shu)據(ju)(ju)(ju)(ju)濫用事件時有發(fa)生(sheng),因(yin)此,如何保障數(shu)(shu)據(ju)(ju)(ju)(ju)安全,成為了國家、企業(ye)和個人面臨的(de)(de)嚴峻挑(tiao)戰。
目前,大多數政府、企業、機構都會將大量敏感數據存儲在自己的后臺數據庫中,在業務過程中將不可避免的產生數據訪問、復制和交換等行為。大數據時代背景下,數據作為新興的生產要素,毫無疑問,已逐漸成為企業甚至國家的基礎性和戰略性資源,但數據背后的價值越高,數據的安全性需求愈發凸顯。2021年初,國家網信辦、工信部、公安部等多部門對數據安全、網絡信息安全等涉及到國家安全的領域密集出臺相關監管措施,從上至下編織起“數據安全”和“網絡安全”兩張大網。
2021年7月10日,《網絡安全審查辦法(修訂草案征求意見稿)》公開征求意見; 9月1日,《中華人民共和國數據安全法》開始實施;11月1日,《個人信息保護法》正式施行,多部聚焦于數據安全的法律法規的密集頒布,可見國家和企業對于數據安全建設的訴求已經提升到一個全新層次。因此,在數據使用過程中,如何保證不同敏感類型、級別的數據能夠安全地被不同需求,不同權限、角色的用戶規范、合理的使用,減少敏感數據被非法使用或泄漏的風險,已成為數據擁有者們最為關注的問題。
數據脫敏(Data Masking),又稱數據混淆、數據漂白、數據去隱私化,是一種為用戶提供虛假數據,防止真實敏感數據被非法使用的技術。數據脫敏能夠保護企業敏感數據不被非法泄漏或濫用,是目前數據安全防護的首選方案之一。
數據(ju)脫敏(min)通常包括(kuo)靜態數據脫敏(Static Data Masking)和動態(tai)數據脫(tuo)敏(Dynamic Data Masking):靜態數據脫敏(min)通常用于(yu)非生(sheng)產(chan)環境(jing),將脫敏后的數(shu)據(ju)分發(fa)至(zhi)生(sheng)產(chan)、測試等環境(jing),從(cong)而保障數(shu)據(ju)安全;而動態數據脫敏則通常用(yong)(yong)于生產環境,可基于用(yong)(yong)戶的(de)請求進行(xing)實(shi)時數(shu)據脫敏,從而保障運(yun)維、應用(yong)(yong)系統、數(shu)據交(jiao)換等業務(wu)場景下(xia)的(de)數(shu)據安全。
第二章 產(chan)品介紹(shao)
2.1 產品概(gai)述
閃(shan)捷動(dong)態(tai)數(shu)據(ju)脫敏(min)系統(tong)是一款(kuan)簡單高效的敏(min)感數(shu)據(ju)匿名化、去標識化產品,具備高性能和(he)高擴展性,支持(chi)多種(zhong)脫敏(min)算法,能夠定義敏(min)感數(shu)據(ju)特征,對數(shu)據(ju)進行分(fen)類分(fen)級,發現敏(min)感數(shu)據(ju)后可自動(dong)創建脫敏(min)規(gui)則,提供不同(tong)角色訪問生產環境的敏(min)感數(shu)據(ju)的差異化管控。
在應用側(ce),無(wu)需(xu)改(gai)造(zao)業務系統,無需修改(gai)數據庫及(ji)存儲數據,即可(ke)保證脫敏后的(de)數(shu)(shu)據保留(liu)原有特征和分布,使企業(ye)可(ke)以低成本、高效(xiao)率、安全(quan)地(di)使用生產的(de)隱私(si)數(shu)(shu)據;在運維(wei)側,基于(yu)角色對敏感數(shu)(shu)據高效(xiao)漂白,保證運維(wei)工(gong)作正(zheng)常開展的(de)同(tong)時,又能夠兼(jian)顧(gu)數(shu)(shu)據安全(quan),可(ke)廣泛(fan)適用于(yu)金融(rong)、保險、能源、政府、醫療、教育等行業(ye),在滿(man)足企業(ye)自(zi)身(shen)數(shu)(shu)據安全(quan)需求(qiu)的(de)同(tong)時,滿(man)足政策合規(gui)性要求(qiu)。
此外,閃捷動態數據脫(tuo)敏系(xi)統支持與數據治理平臺、數據網關對接,能夠對API形式調用(yong)敏感(gan)數(shu)(shu)據的行(xing)為進行(xing)監控(kong),自動分析(xi)是否包含敏感(gan)數(shu)(shu)據,結合中臺應用(yong)系統層級的細粒度管(guan)控(kong)機制,可對敏感(gan)數(shu)(shu)據部分按照既定規(gui)則(ze)進行(xing)實時(shi)的動態(tai)數據脫敏,充(chong)分(fen)保護應用系統/API服務中的敏感數據。
閃捷動態數據(ju)脫敏系統支持硬(ying)件、軟件和虛擬化三(san)種(zhong)部(bu)署形態,且支持市面大(da)部(bu)分(fen)數據(ju)源類型:
(1) 主流數據庫:Oracle、SQL Server、MySQL、PostgreSQL、DB2、Informix;
(2) 國產數據庫:達夢、人大金倉、神通、GuassDB A、GaussDB T,Gbase,TDSQL、Tbase;
(3) 數據倉庫:GreenPlum、Teradata;
(4) NOSQL數據庫:ElasticSearch、MaxCompute、Hbase、Phoenix、Hive、Kudu
(5) API網關:JSON/XML/HTML格式;
2.2 技術(shu)原(yuan)理
針對不同(tong)數據源,動態數據脫敏(min)主要有兩種技術(shu)方(fang)案。
? 改寫SQL方案
通過SQL重寫實現動態數據脫(tuo)敏:
圖2-1 改寫SQL方案
這種技術方案脫敏效率高,關系型數據庫可直接進行改寫,在數據庫通訊協議層面實現了完全透明的、實時的敏感數據掩碼能力,但某些大數據平臺需要安裝UDF才可進行SQL改寫,適用場景稍窄。
? 改(gai)寫返回數(shu)據集方案(an)
通過(guo)改寫返回(hui)數據集實(shi)現動(dong)態數據脫(tuo)敏:
圖2-2 改(gai)寫數據集方案(an)
該方法可動態地對生產數據庫返回的數據進行差異化脫敏,效率稍低,但兼容性更高,適用場景更廣,可支持大數據平臺、API接口等多種數據源的脫敏需求。
2.3產品架構
圖2-3 產(chan)品(pin)架構(gou)圖
第三章 產品主要功能
3.1 數(shu)據資產管理
資產(chan)管理包含數據源管(guan)理(li)、資(zi)產狀態和(he)敏(min)感數據(ju)訪問統(tong)計三個功(gong)能模塊。
數據(ju)源管理(li)模塊主要用于(yu)添加(jia)、維護、查看(kan)需要進行敏感數(shu)據(ju)防(fang)護的數(shu)據(ju)源(yuan)。支持(chi)(chi)添加(jia)、刪除和修(xiu)改數(shu)據(ju)資產信(xin)息,并支持(chi)(chi)對添加(jia)的數(shu)據(ju)資產進行連接(jie)測試(shi),便于(yu)確認數(shu)據(ju)資產與動態數(shu)據脫(tuo)敏(min)服(fu)務(wu)的映射關(guan)系(xi),保證脫敏服務的正常使用。
資產狀態模(mo)塊用于展示數據源的狀態信息。包括數據源內數據統計信息、不同模版下的敏感數據定義、敏感數據發現可視化結果、脫敏規則不同維度統計信息等,且資產狀態支持定期/手動更新(減少服務器壓力),及數據源一鍵切換,可快捷查看其他數據源相關信息。
圖3-1 數據(ju)資產狀態
敏感數據訪問(wen)統計模塊幫助用戶統計數據資產中敏感數據訪問信息,包括數據庫用戶名、訪問IP、訪問數據目標及敏感數據訪問次數,直觀的統計信息可協助用戶開展針對性數據管理,高效保障數據資產安全。數據源管理模塊也可直接查看相關資產的訪問流量信息。
3.2 敏感數據發(fa)現
添加數據資產后,數據發現模塊會自動添加一條針對該資產的數據發現掃描任務,用戶無需再手動新建任務,用戶只需根據需求進行任務配置的修改,包括抽樣數量、需要掃描的模式/表/視圖、需要發現的數據類型、是否需要根據行業模版進行掃描等,最大程度簡化任務配置操作,減少用戶工作量。系統通過掃描引擎發現數據資產中的敏感數據后,用戶可基于掃描結果直接單條/批量創建脫敏規則,方便快捷。
3.3 高效脫敏
系(xi)統內(nei)置豐富的(de)敏感(gan)數(shu)據(ju)類型特(te)征庫,特(te)征庫里(li)包含常見(jian)的(de)敏感(gan)數(shu)據(ju)類型,例如:中文(wen)姓名(ming)、身份證號、固定(ding)電話、手機號碼(ma)、銀行卡號、電子郵(you)箱、中文(wen)地址、郵(you)政編碼(ma)、企業單位名(ming)稱、組織機構代(dai)碼(ma)、營業執照代(dai)碼(ma)、稅務(wu)登記(ji)代(dai)碼(ma)、企業三證合一代(dai)碼(ma)等共二十余種,可充分滿足(zu)常見(jian)場景脫敏需(xu)求。此外,系(xi)統支持通過正則表達(da)式自定義添加(jia)敏感數據類型,滿(man)足用戶特殊業務場景(jing)下(xia)的脫(tuo)敏需求。敏感數據特征庫支持(chi)上傳離線包一鍵更(geng)新升級,更(geng)新便捷。
l 數(shu)據分(fen)類分(fen)級
用戶也可(ke)以對所有不同類型的數據(內(nei)置或自定義添加)進(jin)行分(fen)(fen)類分(fen)(fen)級操作(zuo),自定義添加數據類別(bie)(例(li)如身份信息類、金額類等),和敏(min)感等級(高、中、低),根據自身業務特征,隨(sui)意組合不(bu)(bu)同類(lei)型、不(bu)(bu)同類(lei)別和不(bu)(bu)同敏(min)感等級(ji)的數據,自定義(yi)脫敏(min)算法,生成可復用的方(fang)案模(mo)板進行高效(xiao)脫敏(min)。
圖3-2 數據分類(lei)分級(ji)預覽(lan)
l 存儲過程脫敏
閃捷動(dong)態數據脫(tuo)(tuo)敏(min)(min)系統支持(chi)對存儲過程中的(de)語句(ju)(ju)進(jin)行(xing)掃(sao)描,確定敏(min)(min)感(gan)字段(duan),對包含脫(tuo)(tuo)敏(min)(min)規(gui)則敏(min)(min)感(gan)字段(duan)的(de)語句(ju)(ju)進(jin)行(xing)分析,實現動(dong)態數據脫敏(min)。防止脫(tuo)敏(min)繞過。
l 脫敏(min)算法介紹
閃捷動(dong)態(tai)數(shu)據脫(tuo)敏系統內置豐富高效的脫(tuo)敏算(suan)(suan)法(fa),主要可分為遮(zhe)蔽(bi)、隨機、仿真、置空四大類算(suan)(suan)法(fa)。
? 遮蔽脫敏:通過*等特殊常量符號,把全部/部分信息內容遮蓋。例如:"張三"--->部分遮蔽--->"*三";張三"--->全遮蔽--->"**"
? 隨機脫敏:將數據進行隨機映射,每次隨機值會變化。例如:"張三"--->隨機脫敏1--->"李四";"張三"--->隨機脫敏2--->"王五"
? 仿真脫敏:將數據映射成唯一值,每次映射不改變,支持數據的聚合和連接操作。例如:"張三"--->仿真脫敏1--->"李四";"張三"--->仿真脫敏2--->"李四"
? 置空脫(tuo)敏(min):將敏(min)感(gan)數據(ju)直(zhi)接(jie)修改為NULL值,適用(yong)于對數據(ju)敏感(gan)要(yao)求較高的場景
圖3-2 內(nei)置算法(fa)列表
上述四大類脫敏算(suan)法又根(gen)據(ju)二十多種(zhong)內置的敏感數據(ju)類型,組合成了九十余(yu)種最常用(yong)(yong)的脫(tuo)敏算(suan)(suan)法(fa)(fa),豐富的算(suan)(suan)法(fa)(fa)庫可(ke)滿足大多數用(yong)(yong)戶(hu)各(ge)類場景(jing)下的脫(tuo)敏需求,減(jian)少用(yong)(yong)戶(hu)根據實際需求編(bian)寫自定義算(suan)(suan)法(fa)(fa)的過程,保證產品易(yi)用(yong)(yong)性,減(jian)少用戶脫敏算(suan)法配(pei)置工作,提高業務效率(lv)。
l 行業模板(ban)
閃捷(jie)動態數據(ju)(ju)脫(tuo)敏(min)系統具(ju)備豐富的(de)實(shi)施案例和(he)長期技術積累,根(gen)據(ju)(ju)行(xing)(xing)業特征,總結(jie)了具(ju)有普適(shi)性的(de)行(xing)(xing)業模(mo)版,供(gong)用(yong)戶(hu)直接使用(yong),用(yong)戶(hu)也可根(gen)據(ju)(ju)自(zi)身的(de)業務需求制定模(mo)版進行(xing)(xing)復用(yong)。該模(mo)塊是(shi)閃捷(jie)動態數據(ju)(ju)脫(tuo)敏(min)系統的(de)特色功能之一,可以幫助客戶快速的實現敏感數據的定義和脫敏規則的創建,大幅簡化脫敏系統的配置/維護成本。
l 脫敏規則
脫敏(min)規則決(jue)定(ding)了敏(min)感數據的脫敏(min)結果。
創建(jian)脫敏規則的方法有以下三(san)種:
1、通過敏感數據發現結果進行創建;
2、通過關聯行業模版功能來實現自動創建;
3、輸入參數手動單條/批量創建;
3.4 訪問(wen)控制
白名單-----基于(yu)角色的脫敏(min)控(kong)制
用戶(hu)可(ke)以設定數據庫用戶、IP、時間,在此訪問范圍內可跳過一條/多條指定規則或者全部規則的脫敏動作,滿足需要減少一定程度脫敏效果或者需要得到未脫敏數據的使用場景。
拓展規則--------基于角色的訪問權限控制(zhi)
用戶可根據需求設定數據庫用戶名、IP、時間、匹配條件下的響應動作,包括替換表名、阻斷、替換SQL、搜索并替換字符串等,限制上述條件下對敏感表/數據的訪問權限。