第四章 科研日常(1/1)
陈峰做的医学图像处理领域的数据集少得可怜,这个很容易理解,跟医药相关的数据大多都是各大医院的机密,论文作者不会轻易公开。
也就是因为陈峰的导师跟花城市第一人民医院有项目合作,所以才能拿到部分相关数据。但拿到数据只是个开始,还需要陈峰自己进行数据处理。
凌志就没这么幸运了,他的研究方向跟社交媒体中的舆情分析有关,具体而言就是找出社交网络中的水军,也就是属于同一个现实世界人类的不同账号。
他们通过多个账号发布垃圾评论扰乱社交网络秩序为乐,甚至有的商业机构会专门雇佣水军发表负面言论攻击竞争对手,影响十分恶劣。
水军自然不会告诉你自己是水军,而且社交网络的数据大多都很敏感,很少有人专门整理,所以这样的数据集很难弄到。
凌志在过去一年的时间里在数据集上花费了大量的时间,目前他所用的比较好的办法是将同一个人发布的推文分成2份,假装是2个账号发布的,虽然不够真实,但从做实验的角度看足够了。
凌志并不觉得有数据集和没有数据集这两种情况孰优孰劣,但凌志相信一句话,只要你付出,虽然不一定成功,但一定会有收获。
所以尽管凌志在科研上进展缓慢,但采集社交网络数据的过程让他掌握了数据采集、数据分析以及数据预处理等多项技能。
虽然他还算不上是处理数据领域的专家,但也算是积累了丰富的经验。
“唉,话虽这么说,但是内心还是很痛苦的呀,老哥。我自己觉得效果差不多了,但是我导并不放过我啊。”
“那算你倒霉,不过既然你导不满意,目前来看也只能在数据处理上再下下功夫了啊。”
“只能这样了,我回去再挑一挑数据,看看有没有不干净的。”
“那你努力,需要帮忙跟我说一声。”
“行,没问题。那我先走了,拜拜。”
“拜拜。”
陈峰去了学院楼五楼,而凌志的实验室在二楼,所以陈峰坐电梯上去,而凌志直接开11路走楼梯上去了。
时间还早,实验室只来了一个人,周敏师兄。
周敏师兄比自己大1届,预计明年毕业。研究方向是导师王海波的老本行,多目标车辆路径优化问题。
老王在这个领域深耕了多年,发表多篇论文。底下弟子也带过很多届了,一开始都是做这个方向。而从周敏师兄这一届开始,老王幡然醒悟,想要带领部分学生在其他研究领域开荒,所以就有了凌志现在的研究方向。
凌志并没有觉得有什么不好,做老王的老本行也不见得万事轻松,你的每一个实验细节不到位都可能会遭受到王导的火眼金睛。开荒虽然也有开荒的难处,但是胜在能学到更多新知识,也有一定自由度。
有自由度并不是说可以随意地编造实验结果,这属于学术造假,凌志是不会干这种事的。实际上说的是你数据采集的量,处理到的程度,代码的参数设置等。
而当你用自己采集到的数据集以及自己编写的代码跑出一个不错的实验结果时,即便这个实验再简单,你也会有无与伦比的成就感。
所以凌志对于自己的现状非常满足。
“早啊,周敏师兄。”
“早。”
边说着,师兄打了一个大大的哈欠。凌志也没在意,坐到自己的座位上,打开电脑,准备将一篇跟词向量相关的文章打印出来仔细看看。
实验室配备有一台专门的打印机,凌志拷好论文之后拿到打印机旁边那台电脑上插进去,可过了半天也没读出来盘。
“不对啊,应该不是我U盘坏了啊。”
凌志不知道哪里出了问题。
“师兄,打印机旁边这条电脑坏了吗?怎么读不出来我的U盘?”
凌志问道。
“哦,那台啊,我刚刚也想打印来着,也读不出来盘,我猜应该是卡住了吧。”
“哦,这样啊,那为什么不重启一下?”
“因为我想起你小欣师姐说她在跑一个多线程程序,需要用到咱们实验室平时闲置不怎么用的电脑的CPU来运算。我猜她应该是用到了那台电脑吧,等你师姐来了我问问她。”
“哦哦,怪不得。”
凌志按住键盘上的“Ctrl+Shift+ESC”,想打开任务管理器看看资源占用情况,结果电脑卡的连任务管理器也打不开。
凌志长叹一声,师姐跑个程序也太难了,多线程跑程序都这么卡。
默默替师姐默哀之后,凌志回到自己的位置,准备在电脑上看论文。虽然有点伤眼睛,但问题也不是太大。
过了一会儿,凌志大概已经掌握了论文的核心思想。于是创建了一个PPT文档,准备做个PPT,明天组会分享一下这篇论文。
这时候实验室已经来了一部分人了,凌志这个时候也想休息一下,顺便去倒杯水。这时候,小欣师姐刚好过来了。
“唉,小欣,你是不是在打印机那台电脑上跑了程序啊,那台电脑太卡了,我们都打印不了东西了,要不你看看程序跑得怎么样了?”
师姐叫张小欣,跟周敏师兄做的是同一个研究方向。
“啊!对不起对不起,都卡成这样了吗,我马上去看。”
师姐并没有跑到打印机那台电脑上去看,而是坐在自己的座位上用ssh远程命令尝试连接打印机那台电脑,结果连了半天都连不上。
“完了,彻底当机了啊。”
小欣师姐感叹道。所谓当机就是死机的意思。
师姐忍痛将打印机那台电脑重启。
“唉,程序又白跑了啊。”
“早跟你说了优化下代码,你看你这段别暴力求解……”
周敏师兄适时开始提出建议,凌志也乐见其成,他也不懂师兄师姐做的这个方向,也没去插嘴,自顾自地倒水去了。
“对了,老王今天来没来实验室?”
“昨天听他说他今天有事,明天组会应该会到吧。”
老王不来,那还算比较轻松。虽然他来不来,自己今天的计划都不会有什么改变,但至少不会有什么额外的事情打扰自己。
整个一天他基本都在做PPT的过程中度过,中间抽空运行了一下自己早就搭建好的一个简单的神经网络程序,看看在自己处理的数据集上运行效果如何。
“还是一样烂啊。”
水军账号的匹配准确率只有37%,没什么意义。在已有的论文中至少要跑到80%以上才算是比较好的结果。
“唉,相比陈峰,我这边也没好多少啊。算了,慢慢来,明天再说,回去了。”
凌志觉得自己就是个另类,别的研究生朝九晚十一,而他晚上独自待在宿舍干自己的事情。凌志一开始觉得有点内疚,不过时间久了也就给自己找好了理由。
“回去休息眼睛嘛,看一天电脑累不累得慌。”
虽然是很无聊的借口,但每天晚上花点时间看看纸质书,偶尔去球房练练球,他觉得并不是浪费时间,反而觉得很充实。
尤其是在读书的时候,每当自己白天实验不顺利时,晚上读一会儿书总会让自己内心平静下来。
书中人物各有各的喜怒哀乐。凌志体会着主人公们的心情,自己的那点小情绪也就微不足道了。
“实验做的怎么样了?”
凌志来到陈峰所在的实验室。
“唉,别提了,筛数据筛得我眼都花了。凌子,有空你帮帮我好不好,我实在是不行了。”
“行啊,你晚上把数据发给我,我抽空帮你筛一筛。”
“OK,走走走,吃饭吃饭,饿死了。”
两人走向食堂,一路上也没怎么聊天,偶尔陈峰说话,凌志不接,陈峰也不以为意,这也是凌志觉得和陈峰相处比较舒服的一个重要原因。
讲话少一直是凌志的一块心病,而身边有一个讲话多的人愿意与你为伍,而且又不在意你讲话少,凌志觉得这样的人自己应该珍惜。
即便是陈峰经常调侃自己,但他并没有恶意,并理解自己这种奇怪的人的存在,凌志觉得自己很幸运。
只不过这是他心里想的罢了,不可能对着陈峰说,要不然只会召来更加激烈的调侃。
“你今天想吃啥?凌子。”
“我就点个鸡蛋肉片盖饭吧,简单朴素,饭管够。”
“那我点茄子豆角吧,想吃点茄子,你那个太淡了,一会儿可以捡几个我盘子里的茄子补补油水。”
“行啊,那我就不客气了。”
两人风卷残云一般解决了晚饭,陈峰继续回实验室,凌志回到宿舍,拿起自己之前快看完的小说,是以前著名的悬疑推理作家东野圭吾写的科幻小说《秘密》。
故事主要讲的是妻子和女儿遇到车祸,妻子魂穿女儿肉体后,男主与拥有妻子灵魂的女儿生活的故事。
看完结尾,女儿开启了自己全新的人生,嫁为人妇,也不知道这结局是喜是悲啊。
凌志看书有很强的代入感,经常想如果自己是男主,又会做出什么样的选择呢?真的愿意放手让女儿过上全新的生活吗?凌志觉得自己不一定会比男主做得更好。
害,看个书而已,还伤感上了。
凌志笑着摇了摇头,合上书,打开了自己的电脑,找到了一段英式台球比赛录像,这是他长久以来的习惯,有台球比赛的时候就看看直播,没有的时候就看看录像。
而此时此刻他打开的这则录像,则是多年前在华夏举办的一场大师赛上,罗尼·奥沙利文与尼尔·罗伯逊的比赛。