本学期开学后一直忙着学习java,把java的原理以及类、对象等在堆栈中的存放、面向对象的全面思想、映射、异常、JVM等进行了梳理。
在此过程中,完成了以上几个大作业。
加强了对数据结构的学习,用C++实现顺序表,顺序存储和链式存储顺序表。实现了栈、队列,顺序栈、链式栈。队列,循环队列、双向队列。树,以及图的存储和操作。
为了准备机器学习的演讲,又开始学习《机器学习实战》这本书,本书用Python实现了一些机器学习的算法,自己准备将最有一章《大数据与MapReduce》,查阅了一些相关论文,像大数据相关的论文,Google03年发表的GFS,04年的MapReduce以及06年的BigTable等,用mac虚拟了4台Linux虚拟机,一个作为Master结点,另外3个Slave结点。并在此伪分布式的集群上跑了几个分布式计算程序,像自带的example.jar,可以运行Wordcount,计算pi等。像在MapReduce上的机器学习算法还是很多的,但是这些机器学习算法在单机上实现起来是比较容易的,但要在MapReduce上实现,就变得困难起来,而且并不是所有的机器学习算法都能在MapReduce上实现。跑了一个K-means均值聚类的算法。该算法的思想是先用Canopy算法大致模拟出k值,即想分成几类。然后计算任意两点的距离,将这些点划分为k类。
总结:总体来说,本学期还算是成功的,因为从5月份到7月份的学车,让自己分了很多精力,好在科二和科三都是一次通过啊。下学期要继续努力,确保每周有一天在看论文,一天在想关于课题的思路及实现,一天在加强基础知识学习,数据结构和算法包括机器学习算法,一天联系编程,像用java或C++实现数据结构以及算法,一天加强英语的学习,英语还是很有用的。另外一天自由学习,学自己感情去的事情,确保一天时间要玩,使劲玩。
加油 加油 加加油!!!!!