您好,欢迎来到维库电子市场网 登录 | 免费注册

英特尔戴金权:AI算法需要与大数据分析工作流结合,才能更好创造价值

类别:行业访谈  出处:中国电子报  发布于:2018-07-03 14:43:09 | 218 次阅读

  

    英特尔高级首席工程师、大数据技术全球CTO戴金权今天在深圳举行的全球人工智能与机器人峰会(CCF-GAIR)上做主题为“大数据分析+人工智能”的演讲时谈到,我们的数据处理、机器学习,它的算法必须很好地和我们现有的大数据处理的工作流整合在一起。
  CCF-GAIR由中国计算机学会(CCF)主办,雷锋网、香港中文大学(深圳)承办,是国内人工智能和机器人学术界、工业界及投资界三大领域的顶级交流博览盛会。在当天的会议上聚集了全球诸多的人工智能领域的大佬。
  戴金权在会议上分享了他对人工智能与大数据分析的趋势判断。在他看来,未来的人工智能与大数据分析结合有三个重要趋势。
  第一个趋势是数据规模扩展,推动了深度学习发展。当今,深度学习如此的有效或者说成功,其中一个很重要的原因就是我们现在能够访问、处理的数据大大地超过了我们之前能够接触到的数据。随着数据的增长,当人们开发更多、更复杂的神经网络的时候,它就能够更好地利用我们所分析到的大量的数据,来提高模型的效率和有效性。从这个意义上来说,任何深度学习的系统、框架、应用都要能够处理大规模的数据,也就是说它能够处理我们所说的大数据。
  第二个趋势是Hadoop成为了“数据重力中心”(Center of Data Gravity)里面不仅是有Hadoop这样的系统,还包含了一系列以Apache Hadoop为生态系统的平台,成为数据处理的标准。大家可以想象你的数据就是一个一个球,当把它放在地上,它就会不可避免地往表面最低处滚动。在很多组织里面,不管它是互联网公司还是传统的企业,大家都基于Apache Hadoop建立了数据的平台。在这个过程中大量的数据,特别是大量的生产数据就会慢慢地向这样一个中心的平台聚集,所有的历史的数据,没有经过处理的原始的数据都会集中在这个平台上,从而你能够将各种数据的处理、分析等应用到这个平台上。从这个意义上说,任何数据处理和分析的框架、应用,包括深度学习的应用,都要能够非常好地和Apache Hadoop为标准的数据平台进行交互。
  第三个趋势是工业级机器学习/深度学习系统,是复杂的大数据分析流水线。现在大家说到深度学习、人工智能,第一个想到的是各种各样的模型,觉得模型非常重要。这是非常准确的,因为机器学习或者深度学习的模型,能够提供大家需要的功能。当构建一个大规模的、工业级的机器学习或者深度学习的应用或者系统的时候,特别是当要处理一个大规模、分布式系统的时候,需要有大量的数据处理工作流上的各种各样的组件,比如说数据的导入、数据清洗、特征提取,以及对整个集群的资源的管理,和各个应用之间对这个资源的共享等等。这些工作,事实上是占据了机器学习或者深度学习工业级应用开发的大部分的时间和资源。当我们要构建这样一个端到端应用的时候,这就是一个大数据处理的工作流。所以从某种意义上说,我们的数据处理、机器学习,它的算法必须很好地和我们现有的大数据处理的工作流整合在一起。
  他同时强调,目前深度学习专家,会不断有新的突破、新的模型,但大多数的普通用户,不管是数据工程师还是数据科学家,或者是分析师,他们想要处理数据,今天在深度学习的社区所提供的工具、框架,普通用户并不是非常适合的,出现了一个断层。英特尔希望做的是能够填补这个断层,所以了相应的框架、工具、平台,让大多数的普通工程师、普通用户也能将深度学习、人工智能技术非常方便地应用到他们的生产环境当中。
  比如,在一年多前,英特尔开源了BigDL项目,让用户可以轻松、简单地在大数据集群中进行深度学习应用,而且这一项目目前已经受到了AWS、京东、MasterCard等众多行业用户的欢迎。

关键词:AI算法 英特尔 

全年征稿 / 资讯合作

稿件以电子文档的形式交稿,欢迎大家砸稿过来哦!

联系邮箱:3342987809@qq.com

版权与免责声明

凡本网注明“出处:维库电子市场网”的所有作品,版权均属于维库电子市场网,转载请必须注明维库电子市场网,http://www.dzsc.com,违反者本网将追究相关法律责任。

本网转载并注明自其它出处的作品,目的在于传递更多信息,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品出处,并自负版权等法律责任。

如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系,否则视为放弃相关权利。

热点排行