正在阅读:余凯:大数据加人工智能 决定未来智能水平发展

余凯:大数据加人工智能 决定未来智能水平发展

2016-12-19 09:14:11来源:网络大数据 编辑:沐子飞 关键词:大数据人工智能服务器阅读量:30160

导读:互联网典型特征就是大数据,大数据公司也是人工智能公司,以搜索引擎为例,搜索引擎一边给用户提供免费服务,这个服务背后还有一个非常精致的商业模型。
  【中国智能制造网 名家论谈】互联网典型特征就是大数据,大数据公司也是人工智能公司,以搜索引擎为例,搜索引擎一边给用户提供免费服务,这个服务背后还有一个非常精致的商业模型。

 
百度研究院副院长  余凯 
 
  由中国计算机学会(CCF)主办,CCF大数据专家委员会承办,中科院计算所与CSDN共同协办,以推进大数据科研、应用与产业发展为主旨的2014中国大数据技术大会(Big Data Technology Conference 2014,BDTC 2014)暨第二届CCF大数据学术会议在北京新云南皇冠假日酒店盛大开幕。下面是百度研究院副院长,深度学习实验室主任,图片搜索部总监余凯发表的演讲“大数据人工智能”。
 
 
  以下为演讲实录:
 
  下面,我可能更多从实践的方面去跟大家分享一下百度在大数据、人工智能我们近的一些工作,包括我们对这些方面的一些思考。
 
  2014年8月14日,麻省理工学院科技评论杂志介绍百度的人工智能之梦,文章题目叫《一个中国互联网的巨人开始有梦想》,主要内容是介绍百度在近两年在人工智能和大数据这些领域的的投入,包括在人才方面的一些举措。
 
  互联网公司:“得人心者得天下”
 
  用户免费使用服务的同时,贡献数据给平台。另外一边,我们拿这个数据做商业化的变现,实现数据的价值。从数据到价值中间需要技术,需要基于大数据的人工智能。比如说大规模的机器学习,移动互联网中的语音识别、图像识别,还有用户建模等,这些技术能帮助你读懂用户心里想什么。以前我们说“得人心者得天下”,而在大数据时代的今天,对于互联网公司,只要读懂人心,就一览无余。
 
  从学术层面到高科技公司,再到政府层面都对人工智能越来越关注,人工智能机器人可能是下一个产业革命的爆发点,比如像自动驾驶,自动问答,虚拟现实等都跟人工智能有关,将来是科技创新的主战场。
 
  学习的能力是智能的本质
 
  那么什么是人工智能?应该包括哪几个方面,比如我们看到的机器人,首先他有眼睛,有感觉,能感知环境是怎么样,完成它任务怎么样做,通过感知把数据记录下来以后,要做思考,想想怎么做,后面你就可以行动。所以,感知、思考和控制是人工智能几个重要的方面。
 
  我们看到很多科技公司推出各种各样的产品,比如说我们看到有智能手机、智能水杯、智能手环等等,还有百度推出的智能快搜,谷歌在做的智能汤勺,但是真正想一想这些产品是不是真的具有智能呢?我们把这些产品和60、70年代的老式收音机放在一边,他们的不同在什么地方?思考这些问题能帮我们想清楚未来方向,也可以区别现在的这些产品它到底是不是真的智能。真正的智能系统应该能随着经验演化越变越聪明,学习的能力,是智能的本质!
 
  经验就是数据
 
  那么什么叫经验?经验就是数据,所以我们到今天看到一个振奋人心的时代来临,这也是我们济济一堂来到这个会议的原因,这个时代是什么?就是大数据时代。
 
  从万物互联到万物智能
 
  今天在座每一位可能都跟我一样,身上带了至少两三个移动设备,平均每个人连到两到三个设备。半个多月前,在乌镇孙正义有一个更加疯狂的预测,预测2020平均每个人要连接到一千个设备,一千个设备包括你随身带的设备,你的wifi,甚至是监控摄像头。在移动互联网时代,我们看到的未来是万物互联,人跟环境,人跟物,物跟物之间都会发生连接。这种连接同时也意味着数据爆增,到达的广度和数量,大数据的时代使我们从万物互联到万物智能。
 
  深度学习与大数据
 
  很多拥有大数据的互联网公司,包括谷歌、脸谱和百度,都在成立研究机构,这个机构主要的研究方向就是大规模的深度学习,聚焦点就是大数据驱动的人工智能。在百度内部,一个横跨各个产品线大项目获得了今年的百度高奖,这个项目就是百度大脑。拥有上千台PC服务器,和将近1000台GPU服务器,构建了世界上规模大的深度神经网络,百亿级的参数。我们基于这些基础设施,去研发世界上先进的深度学习算法,包括语音识别、图像识别、自然原理理解、广告竞争匹配、广告建模等等。
 
  深度学习其实它不是一个新事情,在30年前80年代末的时候,深度学习就已经是得到了广泛关注,而到了大数据时代的今天,它获得了更多的成功和影响力。为什么呢?
 
  方面,深度学习模拟了大脑的行为。一开始做深度学习这帮人,他们的想法受到卷积神经系统网络的影响,在80年代受到了神经科学家对于视觉神经系统理解的影响;
 
  第二,从统计和计算的角度来看,深度学习特别适合大数据;
 
  第三,深度学习是End-to-end学习;
 
  第四,深度学习提供一套建模语言。
 
  大数据时代传统深度学习的误区
 
  我具体给大家讲讲第二点,深度学习特别适合大数据下。在统计上面分析机器学习系统效果时,一个根本的角度叫推广误差,推广误差可以帮助我们找到误差来源,从而设计出更好的算法。一个经典的分解方法,把推广误差分解成两部分:
 
  Approximation error:数学模型不导致的误差;
 
  Estimation error:数据不,比如数据有限或数据有偏,导致的误差;
 
  Optimization error:算法不导致的误差。
 
  随着数据规模的扩大,从推广误差的角度来说,传统的深度学习研究中存在着一些误区:
 
  从Approximation error的角度来说,过去我们认为简单的模型就是好的,但实际上简单的模型是不够好的,随着机器的增多,参数越来越多,模型越来越复杂,是大趋势,过去认为简单的模型是好的这是错误的观念;
 
  从Estimation error的角度来说,为了保证数据的,应该收集充分的数据;
 
  从Optimization error的角度来说,通常是学术界的观点是,开发研究非常精致的优化算法,但是这些算法存在一个大问题:不能覆盖大数据。比如,SVM的复杂度是在数据二次方到三次方之间的复杂度,今天处理一万个训练样本没问题,但是如果变成十万个训练样本,你需要一百倍到一千倍的计算资源,这是灾难性的问题,所以在大数据的时代,工业界反而要倡导的是desgin “an OK algorithm”。
 
  深入百度大脑
 
  我给大家举一些百度大脑的例子:
 
  ♦ A deep model for image recognition
 
  ♦ DLmodelfor query-docrelevance
 
  ♦ Long-short term memory for time series
 
  ♦ 网上抢票验证码识别
 
  ♦ 运单手写电话号码识别
 
  ♦ 述说图片的故事,字幕用深度学习程序写成
 
  ♦ 同时理解图像和自然语言
 
  深度学习已经取得了关键性进展,首先在广告系统,这可能是世界上把深度学习成功应用于广告变现,并带来收入提升,在用了深度学习之后,我们跟竞争对手的差距是拉开了两倍还多。
 
  在物体检测模型上我们取得了世界上好的成绩,百度,谷歌第二。
 
  未来的展望
 
  人类大脑的平均重量是1.5公斤,占2%的身体体重,消耗20%的能量。近的一个报道显示,谷歌的服务器消耗美国用电量的百分之几,美国的所有互联网公司占美国耗电量的9%。在中国,三大互联网公司也占中国耗电量百分之几,智能计算是非常耗能量的。而人类大脑有一千亿个神经原有5000个的连接,每个连接触发每秒钟两次,做一个简单计算,人类大脑计算能力是10的17次方。在过去人工智能发展过程中,计算能力是非常强大的东西,我们今天的计算能力跟20年、30年前更是不可同日而语的,能构造更好的计算方法。
 
  未来计算决定着智能水平的发展,人工智能这个奇点临近连接了,谢谢大家!
 
  (原标题:大数据与人工智能,未来计算决定着智能水平的发展)
 
我要评论
  • 中国生成式人工智能用户规模达5.15亿人,普及率36.5%

    《生成式人工智能应用发展报告(2025)》显示,截至2025年6月,我国生成式人工智能用户规模达5.15亿人,普及率为36.5%。上半年,国产生成式人工智能产品取得显著进步,在春节期间成为社会关注热点,推动生成式人工智能快速渗透。
    人工智能生成式人工智能
    2025-10-20 09:07:04
  • 人工智能和物联网如何协作以实现更智能的技术

    人工智能与物联网的融合代表着科技发展的新方向。物联网通过分布在各处的传感器、设备和网络基础设施,持续生成海量的实时数据。而人工智能则通过机器学习与深度学习算法,对这些数据进行分析、建模与优化。
    人工智能物联网
    2025-10-20 10:57:54
  • OpenAI联合创始人:人工智能代理真正发挥作用还需10年

    OpenAI联合创始人预估,要系统解决上述所有问题,大约还需要十年时间。尽管众多投资者将2025年称为“智能体之年”,但现实发展仍面临显著挑战。广义上,AI智能体被定义为能够自主执行任务的虚拟助手,具备问题拆解、方案规划与自主实施的能力。
    OpenAI人工智能
    2025-10-20 10:58:05
  • 物联网和 Agentic AI 助力未来智能医院

    随着物联网(IoT)与新一代智能体人工智能(Agentic AI)的融合,这一复杂体系正在被重新定义。越来越多的医院开始引入基于实时数据的智能运营模式,使医疗体系逐步从“经验驱动”走向“数据驱动”,甚至是“自主优化”的新阶段。
    医疗应用方案人工智能
    2025-10-17 13:23:02
  • 快讯|HDL与海康威视达成战略合作;特斯联与新华三达成战略合作

    中国智能控制品牌河东科技HDL与安防企业海康威视宣布达成战略合作,双方产品实现互联互通,为海外用户提供更完整的智能生活解决方案;特斯联与新华三正式宣布达成战略合作,双方将集中优势资源,围绕AIoT算力平台打造及异构算力生态建设进行深度合作......
    AIoT算力人工智能
    2025-10-17 11:27:16
  • 网信办、发改委:政务领域人工智能大模型13大典型应用场景

    政务部门可围绕政务服务、社会治理、机关办公和辅助决策等工作中的共性、高频需求,因地制宜、结合实际,选择典型场景进行人工智能大模型探索应用。
    人工智能大模型
    2025-10-17 08:30:05
版权与免责声明:

凡本站注明“来源:智能制造网”的所有作品,均为浙江兴旺宝明通网络有限公司-智能制造网合法拥有版权或有权使用的作品,未经本站授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:智能制造网”。违反上述声明者,本站将追究其相关法律责任。

本站转载并注明自其它来源(非智能制造网)的作品,目的在于传递更多信息,并不代表本站赞同其观点或和对其真实性负责,不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、平台或个人从本站转载时,必须保留本站注明的作品第一来源,并自负版权等法律责任。如擅自篡改为“稿件来源:智能制造网”,本站将依法追究责任。

鉴于本站稿件来源广泛、数量较多,如涉及作品内容、版权等问题,请与本站联系并提供相关证明材料:联系电话:0571-89719789;邮箱:1271141964@qq.com。

不想错过行业资讯?

订阅 智能制造网APP

一键筛选来订阅

信息更丰富

推荐产品/PRODUCT 更多
智造商城:

PLC工控机嵌入式系统工业以太网工业软件金属加工机械包装机械工程机械仓储物流环保设备化工设备分析仪器工业机器人3D打印设备生物识别传感器电机电线电缆输配电设备电子元器件更多

我要投稿
  • 投稿请发送邮件至:(邮件标题请备注“投稿”)1271141964.qq.com
  • 联系电话0571-89719789
工业4.0时代智能制造领域“互联网+”服务平台
智能制造网APP

功能丰富 实时交流

智能制造网小程序

订阅获取更多服务

微信公众号

关注我们

抖音

智能制造网

抖音号:gkzhan

打开抖音 搜索页扫一扫

视频号

智能制造网

公众号:智能制造网

打开微信扫码关注视频号

快手

智能制造网

快手ID:gkzhan2006

打开快手 扫一扫关注
意见反馈
我要投稿
我知道了