随着经济、科学技术的快速发展,全球已经进入大数据时代。有人可能会有这样的疑问“大数据不就是从量上来看,数据多而已嘛”,但这只是问题的表象。大数据可并非如此简单,这些数字代表的可不仅仅是一个个抽象的符号,它已经逐渐渗透在人们日常生活中的方方面面。通过对数据的研究和分析,可以将简单的数据和人们的生活很好的结合起来,有助于商家更好的为人们服务。
那面对如此浩瀚的数据海洋,该如何征服它来为人类做贡献呢?近期,来自百度大数据实验室的高级科学家夏粉,在中国科学院大学给学生们揭开了大规模机器学习的面纱,在座的所有学生听的津津有味,以至于讲座结束了大家还意犹未尽。而有些不能到现场的同学也表示感到很惋惜,但贴心的百度传课已经将此视频上线,希望所有学生在相约校园好课专题实现对大规模机器学习的愿望。
据悉,此次讲座主讲人夏粉从自己生活的角度出发,引出了讲座的主题--大规模机器学习概论。他主要就大规模机器学习理论、实战技术和总结展望多个层次展开讨论,让同学们可以清晰明了的理解最新大规模机器学习的主要特点、处理数据的方式、对大数据运用模型处理的优点,以及对于机器学习前景的一个理性认识。他以自己在百度工作的经验和百度自身拥有的庞大数据为例,谈论了大规模机器学习的特点。
他谈到:现如今的数据规模呈现爆炸性的增长,而随着数据量的增加,计算的复杂度会增加,计算成本也会随之加大,那么大规模机器学习的出现,就在很大程度上减少了耗时和成本。在大规模机器学习这个层次,他主要谈到了CTR预估的机器学习流程,主要包括特征生成、模型假设、模型训练和线上预测,并就此展开了详细的分析和讲解。
夏粉老师把大部分时间都放在了对于实战技术的讲解上,这也契合了他自身在这方面的实战经验,主要分为数据处理、特征处理、组合特征学习、模型算法和时效性。这里面不仅涉及到对于样本的精确采集,还引入百度的实例以及与其他搜索引擎的作为对比,从而将此部分的内容更清晰地呈献给学生们。在最后一个层次,夏粉总结了大数据点击率预测技术的发展,分析了现有大规模机器学习与以前传统机器学习的区别,分析了现有技术的优势:能处理千亿样本,从浅层模型到深层灵活模型的转变,可以实现模型分钟级别的更新。
夏粉老师用幽默的语气,将生活和知识紧密的结合起来,赢得很多学生的认可和好评。此讲座在传课平台上一经上线,就引来多数学生的关注和学习,尤其是各大高校的研究生们,有学生评论说:“通过此讲座,对大规模机器学习有有了更深刻的认识,值得推荐!”
百度传课在相约校园好课最新上线的大规模机器学习概论,从多个方面详细的阐述的大规模机器学习的时代背景、操作流程、优点以及它的前景,是一次很有意义、很有时代特点的课程。知识的世界大无边,数据的海洋深且宽,百度传课相约校园好课专题奉上大规模机器学习概论,带你了解数据世界的神秘以及大规模机器学习的神奇,领略更多知识!
我来说两句排行榜