正在阅读:大数据发展遭遇瓶颈 如何突破壁垒迎新生?

大数据发展遭遇瓶颈 如何突破壁垒迎新生?

2016-09-19 09:40:14来源:中国信息通信研究院 编辑:沐子飞 关键词:大数据存储数据废气阅读量:33837

导读:大数据已经上升成为国家战略,社会各界对大数据的期待上升到了的高度。如何务实推动大数据战略落地,成为接下来的政策重点。
  【中国智能制造网 市场分析】大数据已经上升成为国家战略,社会各界对大数据的期待上升到了的高度。如何务实推动大数据战略落地,成为接下来的政策重点。
  
大数据发展遭遇瓶颈 如何突破壁垒迎新生?
 

  1、引言
  
  2015年,我国《促进大数据发展行动纲要》出台,十八届五中全会进一步提出要在“十三五”期间实施国家大数据战略,大数据一路上升成为国家战略,社会各界对大数据的期待上升到了的高度。如何推动大数据战略落地成为未来几年的政策重点。本文重温了大数据的内涵,分析了大数据的局限性,结合国内大数据发展面临的瓶颈,提出了相关的策略建议。
  
  2、把握概念本质,深刻认识大数据的战略价值
  
  大数据是新资源、新技术和新理念的综合体。从资源视角来看,大数据是新资源,体现了一种全新的资源观。摩尔定律仍然有效,计算存储和传输数据的能力在以指数速度增长,分布式计算、存储和数据技术的革新不断涌现,互联网企业对“数据废气”(Data Exhaust)的挖掘利用大获成功,引发全社会开始重新审视“数据废气”的价值,开始把数据当作一种独特的战略资源对待。
  
  从技术视角看,大数据代表了新一代数据管理技术。传统的数据管理与分析技术以结构化数据为对象、在小数据集上进行分析、以集中式架构为主,成本高昂。与“贵族化”的数据分析技术相比,源于互联网的,面向多源异构数据、在超大规模数据集上进行分析、以分布式架构为主的新一代数据管理技术与开源软件潮流叠加,在大幅提高处理效率的同时(数据分析从T 1到T 0甚至实时),成百倍地降低了数据存储和管理成本。底层技术的变革释放了上层应用的创新活力。
  
  从理念的视角看,大数据提供了一种全新的思维角度。大数据的应用,赋予了“实事求是”新的内涵,其一是“数据驱动”,即经营管理决策可以自下而上地由数据来驱动,甚至像量化股票交易、实时竞价广告等场景中那样,可以由机器根据数据直接决策;其二是“数据闭环”,观察互联网行业大数据案例,它们往往能够构造起包括数据采集、建模分析、效果评估到反馈修正各个环节在内的完整“数据闭环”,从而能够不断地自我升级,螺旋上升。
  
  大数据本身既能形成新兴产业,也能推动其他产业发展和社会进步,战略重要性毋庸置疑。从狭义看,围绕大数据采集、存储、管理和挖掘,正在逐渐形成一个小的产业生态(狭义大数据产业)。2015年,的大数据产业规模约为200~300亿美元。据中国信息通信研究院调查[1],2015年我国大数据市场规模达到115.9亿元,增速达38%,预计2016-2018年还将维持40%左右的高速增长。
  
  从广义看,大数据具有通用技术的属性,能够提升运作效率,提高决策水平,从而形成由数据驱动经济发展的大生态。据华沙经济研究所测算,欧盟27国因大数据的引进,至2020年将获得1.9%的额外GDP增长[2]。美国麦肯锡预计到2020年美国大数据应用带来的增加值将占2020年GDP的2%~4%。中国信息通信研究院采用华沙经济研究所相同的模型测算,2014年大数据对我国GDP的增量贡献约为0.53%~1.25%,2020年的增量贡献高将达到1.9%。大数据的应用对社会治理水平的提升也能起到明显的推动作用。
  
  3、避免盲目跟风,大数据热潮还需冷思考
  
  身处大数据热潮中,既要充分认识大数据的潜力,积极把握技术进步带来的机遇,也要认清大数据的局限性,警惕大数据论。一些被广泛传播的经典案例现在被证明是子虚乌有的,比如,啤酒与尿布的故事实际上是Teradata公司的工程师Thomas Blischok在1992年杜撰的,从来没发生过;而Netflix号称用大数据分析帮助自制剧《纸牌屋》取得成功,而实际上是把大数据作为公关活动的噱头。笔者认为,至少有以下几点值得思考:
  
  ,大数据尚难对人的行为做出预测。在大数据是否能准确预测人类行为的问题上,还存在重大分歧。《黑天鹅》指出人类的行为不可预测,而《爆发》一书则根据对以往历史经验的总结,指出人类行为93%可预测。麻省理工学院教授罗伯特·莱格伯恩(Roberto Rigobon)称,虽然华尔街一直重视数据分析,但基于海量数据分析的对冲基金在都是失败的。“对于人和事件,如果放到越大的空间和时间范围,则是越可以预测的。如果放到越小的空间和时间范围,则是越不可以预测的。例如,我们几乎可以在100%的程度上预测一个人在24小时的时间范围内会吃饭;但若到某一分钟,则几乎不可能预测准确。”大数据无法预测人类行为,归根结底还是因为人具有“自由意志”,人会根据预测结果(如下个月的股票价格、明天的交通拥堵情况)改变自身行为,从而使得预测失效。
  
  第二,大数据相关关系不能替代因果关系。舍恩伯格在《大数据时代》[9]中说:“我们没有必要非得知道现象背后的原因,而是要让数据自己发声”,“相关关系能够帮助我们更好地了解这个世界”。追寻相关关系和因果关系,是人类思维的两种重要方式,而用大数据进行预测往往依靠相关性,也就是说,很多情况下知道“是什么”即可,不必知道“为什么”。相关关系的运用在互联网推荐、广告等方面得到了实际应用。然而,在很多时候,如疾病诊断、工厂故障分析等场景下,需要根据确定的(或置信度非常高的)结论来决策,仅凭相关关系是远远不够的。换言之,大数据中的相关关系应用,需要区分场景,有时候数据无法自己说话,需要追本溯源。
  
  第三,大数据来源不均衡会让数据“说谎”。有人说数据不会撒谎。实际上,如果忽视数据来源的不均衡性,数据分析结果就会“骗人”。中国互联网络信息中心2015年的统计数据显示,我国网民城乡分布严重不均,农村网民虽然迅猛增长,但仍不及城市新增网民数量的1/10。社交网络用户的性别分布也同样有很严重的倾斜,腾讯公司2015年年初的报告显示,微信用户的男女比例为1.8:1,男性用户约占了64.3%,而女性用户则只有35.7%。如果利用网络大数据进行民意调查,却不把样本分布的不均衡性考虑进去,就可能使得某些群体未得到充分代表,而某些群体因使用率高,其意见或特征被过分放大。这种不均匀的数据来源会导致分析结果存在偏见和盲区。
  
  第四,大数据无法消灭信息不对称现象。有人说,大数据有助于消灭信息不对称。虽然从全社会看,大数据的全面采集和融合应用有望在局部缓和信息不对称程度,但是在互联网世界中,马太效应很显著,拥有大数据资源和掌握大数据分析能力的企业,往往会在大数据时代占据更加有利的地位、占有更多数据,从而更容易形成一批数据寡头,产生新的不平等,造成新的信息不对称。因此,大数据无法消灭信息不对称,反而更有可能助推数据寡头的出现。如果这种数据垄断地位被企业滥用,将会威胁个人、企业甚至国家利益。因此,在大数据时代,如何进一步弥合数据鸿沟、防止数据“霸权”的滥用,将会成为一个重要的新课题。热潮之下,对大数据的反思,还需要不断深入,才能让我们保持清醒的头脑。
  
我要评论
  • 人工智能+大数据:2025年它们如何塑造企业

    “2025 年商业中的人工智能与大数据”如今已成为竞争优势的代名词。人工智能 (AI) 与大数据的融合正在通过预测分析、个性化服务和自动化运营重塑全球经济的各个领域。
    人工智能大数据
    2025-09-16 10:29:40
  • 中国大数据规模未来5年增速世界第一 全球占比10%

    中国大数据市场表现格外亮眼,预计2029年中国大数据IT支出规模为730.2亿美元,全球占比约10%。
    大数据大数据技术
    2025-09-12 11:44:02
  • 新华三与广东电信深化战略合作 共拓数字经济新蓝海

    多年来广东电信与新华三一直保持着良好的合作关系,取得丰硕成果。期待双方在传统云网合作基础上,共同探索先进算力网络建设,协力深耕粤港澳大湾区数字化沃土。
    数字经济大数据
    2025-07-11 11:40:07
  • 物流智能转型新引擎:DeepSeek+物流

    DeepSeek 物流不仅是技术的革新,更是城市发展的重要推动力。它通过智能化手段提升物流效率、优化资源利用、减少环境影响,并为智慧城市建设提供支撑。未来,随着AI技术的不断进步,物流行业将迎来更深刻的变革。
    物流大数据服务平台
    2025-04-30 10:11:15
  • 2025年4月1日开始施行的重要新规一览

    四月,一系列新规定即将实施,包括《公共安全视频图像信息系统管理条例》、《车联网网络安全异常行为检测机制》等。
    大数据服务平台
    2025-04-02 09:31:36
  • 江波龙2024年营收175亿大增72%,净利润翻倍

    江波龙发布2024年年报,全年营收174.64亿元,同比增长72.48%;净利润4.99亿元,同比大增160.24%。公司高端存储产品占比提升带动毛利率显著改善,企业级存储和Lexar品牌业务成为增长新引擎。2025年将重点布局AI服务器存储、UFS高端产品及海外市场拓展。
    2024年业绩报告存储
    2025-04-01 10:35:36
版权与免责声明:

凡本站注明“来源:智能制造网”的所有作品,均为浙江兴旺宝明通网络有限公司-智能制造网合法拥有版权或有权使用的作品,未经本站授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:智能制造网”。违反上述声明者,本站将追究其相关法律责任。

本站转载并注明自其它来源(非智能制造网)的作品,目的在于传递更多信息,并不代表本站赞同其观点或和对其真实性负责,不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、平台或个人从本站转载时,必须保留本站注明的作品第一来源,并自负版权等法律责任。如擅自篡改为“稿件来源:智能制造网”,本站将依法追究责任。

鉴于本站稿件来源广泛、数量较多,如涉及作品内容、版权等问题,请与本站联系并提供相关证明材料:联系电话:0571-89719789;邮箱:1271141964@qq.com。

不想错过行业资讯?

订阅 智能制造网APP

一键筛选来订阅

信息更丰富

推荐产品/PRODUCT 更多
智造商城:

PLC工控机嵌入式系统工业以太网工业软件金属加工机械包装机械工程机械仓储物流环保设备化工设备分析仪器工业机器人3D打印设备生物识别传感器电机电线电缆输配电设备电子元器件更多

我要投稿
  • 投稿请发送邮件至:(邮件标题请备注“投稿”)1271141964.qq.com
  • 联系电话0571-89719789
工业4.0时代智能制造领域“互联网+”服务平台
智能制造网APP

功能丰富 实时交流

智能制造网小程序

订阅获取更多服务

微信公众号

关注我们

抖音

智能制造网

抖音号:gkzhan

打开抖音 搜索页扫一扫

视频号

智能制造网

公众号:智能制造网

打开微信扫码关注视频号

快手

智能制造网

快手ID:gkzhan2006

打开快手 扫一扫关注
意见反馈
我要投稿
我知道了