中国科学院外籍院士樊文飞: 大数据分析在电池制造方面可以发挥大作用
大数据具有5V特征
樊文飞院士表示,大数据计算已经成为国际竞争的核心能力,具有5V特征(Volume规模庞大,Variety种类繁多,Velocity变化频繁,Veracity数据质量低,Value价值密度低)。
学术界和工业界大多关注数据的规模,对多样化、变化、可用性的理解只是冰山一角。大数据规模带来的挑战是指在处理大数据时,随着数据规模增大,过去易解的问题可能变得难解。针对这一问题,出现了许多并行图计算引擎,但是设计、调试和分析并行算法通常需要花费很高的代价,使得并行计算的受众受限。樊文飞和他的课题组提出了一种自动将顺序算法转换为并行算法的方法,根据输入的顺序算法自动生成并行算法并且保证正确性,让一些中小企业也能够负担起大规模并行图计算。
IT行业需进军国际
大数据分析有好的一面,也有坏的甚至是丑陋的一面,但是不管大数据分析带来的积极或消极影响,其作用和价值不容忽略。从我国当前大数据生态的状况来看,中国企业在现有国际大数据产业地图中逐渐崭露头角,大多聚焦在分析技术与应用领域,国际影响力不足;从事大数据应用企业多,掌握共性关键技术企业偏少。因此,在基础理论之上形成自主可控的技术系统成为应对挑战的重要突破口,也是国内IT行业进军国际的机遇。
大数据分析应用电池制造
樊文飞表示,大数据分析在电池制造方面也可以发挥重大作用。在制造过程中,一般是通过设置分容流程来判断电池是不是有风险,但是大数据分析的应用可以改变这种传统的方式。比如国轩高科采用了“钓鱼城”系统,改变了之前电池产品安全性测试的流程,通过缩短充放电时间来做数据分析,可以大大提升效率。
演讲最后,樊文飞围绕数据库、大数据计算、数据质量和数据分析等关键系统,介绍了深圳计算科学研究院研发的“崖山DB”数据库系统、“采石矶”数据质量系统、“钓鱼城”大数据分析系统等具备国际领先水平、拥有国内自主核心技术、在大数据系统前沿领域具有代表性的科研成果。