加入收藏 | 设为首页 | 会员中心 | 我要投稿 PHP编程网 - 金华站长网 (https://www.0579zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

大数据时代的“数据质量”问题

发布时间:2022-10-25 10:40:29 所属栏目:大数据 来源:
导读:  信息时代,公司的战略正在从业务驱动向数据驱动的方向转变。传统的BI分析中“业务—IT—业务”的模式转变为业务人员独立完成,大幅提高相关人员的工作效率,同时也让以往忙于处理繁杂业务需
  信息时代,公司的战略正在从业务驱动向数据驱动的方向转变。传统的BI分析中“业务—IT—业务”的模式转变为业务人员独立完成,大幅提高相关人员的工作效率,同时也让以往忙于处理繁杂业务需求收集的IT人员,可以将更多的精力用于数据治理和系统运维上。
 
  与传统数据相比,大数据时代下的数据信息系统更容易产生数据质量问题,直接影响到数据在流转环节中的各个方面,给数据存储处理分析性能、数据质量保障都带来了很大的挑战。大数据与传统数据对比如下表所示。
 
  为了改进和提高数据质量,必须从产生数据的源头开始抓起,从管理入手,对数据运行的全过程进行监控,密切关注数据质量的发展和变化大数据圈,深入研究数据质量问题所遵循的客观规律,分析其产生的机理,探索科学有效的控制方法和改进措施;必须强化全面数据质量管理的思想观念,把这一观念渗透到数据生命周期的全过程。

  大数据圈_大数据培训大数据培训_大数据——大价值、大机遇、大变革(全彩)
 
  在数据的生命周期中影响数据质量的因素主要来源于四方面:信息因素、技术因素、流程因素和管理因素。
 
  (1)信息因素:产生这部分数据质量问题的原因主要有:元数据描述及理解错误、数据度量的各种性质(如:数据源规格不统一)得不到保证和变化频度不恰当等。
 
  (2)技术因素:主要是指由于具体数据处理的各技术环节的异常造成的数据质量问题。数据质量问题的产生环节主要包括数据创建、数据获取、数据传输、数据装载、数据使用、数据维护等方面的内容。
 
  (3)流程因素:是指由于系统作业流程和人工操作流程设置不当造成的数据质量问题,主要来源于系统数据的创建流程、传递流程、装载流程、使用流程、维护流程和稽核流程等各环节。
 
  (4)管理因素:是指由于人员素质及管理机制方面的原因造成的数据质量问题。如人员培训、人员管理、培训或者奖惩措施不当导致的管理缺失或者管理缺陷。
 
  大数据培训大数据培训_大数据圈_大数据——大价值、大机遇、大变革(全彩)
 
  然而数据总会有那么百分之零点几的差异,但是只要在可控的范围内,就可以保证后续决策的质量。
 

(编辑:PHP编程网 - 金华站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!