什么是垃圾數(shù)據(jù)?
另一方面,垃圾數(shù)據(jù)是任何不受治理的數(shù)據(jù),當(dāng)你創(chuàng)建了一個(gè)數(shù)據(jù)副本,然后為一個(gè)特定的使用案例進(jìn)行操作,而沒(méi)有將改進(jìn)的數(shù)據(jù)返回到原始數(shù)據(jù)存儲(chǔ),為下一次使用提高質(zhì)量時(shí),就會(huì)產(chǎn)生垃圾數(shù)據(jù)。Salesforce將垃圾數(shù)據(jù)分為四類:缺失的信息、不準(zhǔn)確的信息、過(guò)時(shí)的數(shù)據(jù)和重復(fù)的數(shù)據(jù)。
當(dāng)個(gè)人從一個(gè)更大的數(shù)據(jù)集中為一個(gè)特定的用例復(fù)制數(shù)據(jù),對(duì)其進(jìn)行修改,然后不將這些修改整合到更大的數(shù)據(jù)集中時(shí),垃圾數(shù)據(jù)就開(kāi)始積累。例如,如果你在你的記錄系統(tǒng)中有一個(gè)正式的客戶地址數(shù)據(jù)庫(kù),只復(fù)制了那些在芝加哥地區(qū)的客戶,并更新了該數(shù)據(jù)的子集,而沒(méi)有更新源數(shù)據(jù),你就創(chuàng)造了垃圾數(shù)據(jù)。有了垃圾數(shù)據(jù),你就沒(méi)有一個(gè)明確的脈絡(luò)或省份,它就不能被其他人輕易地訪問(wèn)和使用;更糟糕的是,你有多個(gè)不一致的“真相”版本。這最終會(huì)在一個(gè)組織內(nèi)產(chǎn)生多個(gè)一次性的數(shù)據(jù)集,而這些數(shù)據(jù)并不能為所有用戶提供價(jià)值。垃圾數(shù)據(jù)帶來(lái)了問(wèn)題。
為什么垃圾數(shù)據(jù)是一個(gè)問(wèn)題?
垃圾數(shù)據(jù)會(huì)給組織帶來(lái)許多問(wèn)題,例如:
不一致的結(jié)果,取決于你是用原始的還是復(fù)制的、修改過(guò)的數(shù)據(jù)集,如果數(shù)據(jù)包含不同的信息,會(huì)有不同的結(jié)果,包括不同的匹配率、運(yùn)營(yíng)失敗,也許最糟糕的是導(dǎo)致糟糕的客戶體驗(yàn)。
不準(zhǔn)確的結(jié)果,如果數(shù)據(jù)集是過(guò)時(shí)的,不完整的,或包含錯(cuò)誤的信息,輸出也會(huì)是這樣。
隱私問(wèn)題,包含任何敏感信息的無(wú)人管理的數(shù)據(jù)副本是有風(fēng)險(xiǎn)的,因?yàn)榭赡懿环媳O(jiān)管的要求,而這種風(fēng)險(xiǎn)往往是高層管理人員所不知道的,直到嚴(yán)重的問(wèn)題發(fā)生,為時(shí)已晚。
信息安全,在任何可以創(chuàng)建垃圾數(shù)據(jù)的環(huán)境中,都存在著安全問(wèn)題。這個(gè)問(wèn)題類別的嚴(yán)重程度將根據(jù)數(shù)據(jù)的類型而有所不同。常見(jiàn)的例子包括不遵循內(nèi)部程序,違反許可證或知識(shí)產(chǎn)權(quán),以及數(shù)據(jù)被黑客攻擊,因?yàn)樗粌?chǔ)存在公司的安全操作之外。
財(cái)務(wù)成本,由于上述任何一個(gè)原因,創(chuàng)建和使用垃圾數(shù)據(jù)是低效的。
然而,垃圾數(shù)據(jù)造成的最大問(wèn)題是,它為實(shí)現(xiàn)數(shù)據(jù)完整性構(gòu)建了一個(gè)障礙。通過(guò)建立數(shù)據(jù)完整性,一個(gè)組織能夠更好地發(fā)展和管理一個(gè)可信賴的數(shù)據(jù)基礎(chǔ),這個(gè)數(shù)據(jù)基礎(chǔ)是準(zhǔn)確的、一致的、有背景的,并帶來(lái)更明智的商業(yè)決策。
為什么數(shù)據(jù)完整性很重要
數(shù)據(jù)完整性是指數(shù)據(jù)集的質(zhì)量、可靠性、可信度和完整性。它建立在四個(gè)關(guān)鍵支柱上:企業(yè)范圍內(nèi)的整合、準(zhǔn)確性和質(zhì)量、位置智能和數(shù)據(jù)豐富。
在更大的范圍內(nèi),如果一個(gè)組織的數(shù)據(jù)具有完整性,企業(yè)領(lǐng)導(dǎo)人就可以利用這些數(shù)據(jù)做出準(zhǔn)確的業(yè)務(wù)決策,從而獲得更好的結(jié)果。在垃圾數(shù)據(jù)的背景下,如果一個(gè)公司已經(jīng)實(shí)現(xiàn)了數(shù)據(jù)的完整性,他們就不再需要花時(shí)間去解決數(shù)據(jù)的不一致性,糾正和審查數(shù)據(jù)。完整性的數(shù)據(jù)已經(jīng)在手邊,這些數(shù)據(jù)可靠并準(zhǔn)備好,可以開(kāi)始工作了。
從垃圾數(shù)據(jù)到數(shù)據(jù)完整性的轉(zhuǎn)變
擺脫垃圾數(shù)據(jù)的最好方法是消除對(duì)它的需求。如果一個(gè)組織創(chuàng)建了具有高完整性的可訪問(wèn)數(shù)據(jù)資產(chǎn),并在一個(gè)受管理的環(huán)境中確保數(shù)據(jù)可以按照公司的政策、權(quán)利和指導(dǎo)方針使用,那么員工將不再需要?jiǎng)?chuàng)建和維護(hù)數(shù)據(jù)的副本來(lái)執(zhí)行一個(gè)特定的任務(wù)。通過(guò)花時(shí)間在前期投資其數(shù)據(jù)完整性,公司可以確保其數(shù)據(jù)資產(chǎn)的質(zhì)量和安全性,并適當(dāng)?shù)靥峁┙o企業(yè),最終節(jié)省時(shí)間和金錢(qián)。
標(biāo)簽:什么是垃圾數(shù)據(jù)為什么垃圾數(shù)據(jù)會(huì)給組織帶來(lái)問(wèn)題垃圾存在的問(wèn)題有哪些垃圾問(wèn)題的現(xiàn)狀
標(biāo)簽: 垃圾數(shù)據(jù) 什么是垃圾數(shù)據(jù) 垃圾存在的