数据与模型

Hero: 我在看WE大会,多好的大会啊。股票也涨的很好

Dong: 阿里巴巴你怎么预测?

Hero: 任何没有足够数据基础的预测都是耍流氓 - 三多

Dong: 三多这个流氓以为有数据就能预测了 - 三百

Hero: 有数据然后找三百看论文,就可以知道预测的置信度了 - 三多

Dong: ......

快十年了,我们再聊聊

Dong: http://oldblog.donghao.org/2007/09/euoo.html 
你说时间过得多快

Hero: ...那时怎么大家这么无聊
无聊得来有基情
http://oldblog.donghao.org/2008/02/io.html 唐唐是谁?

Dong: 唐勇,2008年我挪到他下面,就没有跟中中在杭州一起加班了
“要求英俊潇洒、玉树临风、还要懂c++、懂后台系统”,现在公司里满足这个要求的就多多了,
还是钱多雇得起啊

Hero: 哦哦

Dong: http://oldblog.donghao.org/2007/09/u.html
 这个才是境界

Hero: ...真无聊
关于我的有这么多?还有呢

Dong: 无聊的另一个意思就是:禅
。你计划书上要注意用词

Hero: 有道理,英文是zen

Dong: http://oldblog.donghao.org/2007/09/euoaee.html
 主要是你这位大师在制造zen

Hero: ...

Dong: 不过最近浏览论文才发现,CNN居然是多伦多大学的一位教授最早提出的,
此人现在还在从事深度学习方面的研究,论文也还在发。说真的,你顺路可能去拜访他吗?

Hero: 是啊,很棒的啊,人被 google 收购了
拜访他干嘛啊

Dong: 问得好,看来我得研究明白了,然后发两篇有价值的论文,然后让公司赞助我去多伦多开个学术会,
然后我就能当面请教和沟通了,比单纯的拜访有价值

Hero: 就是
拜访没意义,禅又对不上

Dong: zen这个东西,我们几个老熟人闲的蛋疼的时候搞搞就好了

交流会小结

上周五去北航参加了一个文件系统和存储的交流会,是华为牵头办的,小会议,参会不到30个人。本人水平有限,只能挑一些听懂的留个笔记。


陆游游/

首先是清华大学的陆游游同学讲一个全新设计的基于FLASH存储的文件系统。大概思路是将存储管理和SSD上的FTL合并在一起做成一层,还利用NAND片上每个PAGE的额外存储空间存放一些元数据以在机器断电重启后重新沿链接找回数据(这样就可以不用journal了,似乎也可以认为是把journal放在了PAGE的额外存储空间里),然后在上面架一个新的简化的文件系统做基本的namespace管理。这个思路跟DFS有点像,不过DFS只是上面那一层薄薄的namespace管理,下面就交给Fusionio的firmware了。

华为的谢美伦介绍了手机终端上几种常用文件系统的评测。Android上当然首推ext4,但是后起之秀f2fs更简单且随机写性能不输ext4(这点大家有争论,有人认为这个评测应该写满存储卡再全删掉,再重新测试,也就是要把FTL打乱了再测,会更公正),不过来自阿里云的刘铮表示:google倾向于在服务器和手机上使用统一的文件系统即ext4以方便维护。看来f2fs虽然更贴合NAND,但是大厂支持上还不够丰富。

来自百度的杨勇强介绍了百度的分布式存储和文件系统。这个,互联网的玩法太相似了,主从结构,erasure code,就不累述了。讲到中途的时候,来自华为存储部门的几个工程师问了很多分布式环境下锁的问题,发现互联网由于应用和底层都是自己写,所以可以玩很多花招,比如一个文件只允许一个写进程操作等等,而且,互联网公司不怕内核panic,反正是负载均衡,宕机一台重启就可以了,所以对底层软件的稳定性也没有太多要求。他们深感做企业存储不得不高效的实现整个POSIX,比互联网的分布式存储难做多了。也有工程师向百度提问为什么用ARM服务器?真的那么需要省电吗?百度的谢广军回答说省电是必要的,一台两路服务器光xeon CPU耗电就到了85瓦,换成ARM变成几瓦,还是挺明显的。

最后由来自华为的程菊生博士介绍已经广泛宣传的OceanStore 9000,最大40PB的存储集群。我们几个人马上提问:用的是以太网还是Infiniband?答曰Infiniband,大家相视而笑,这年头,高端一点的企业存储不用Infiniband根本不行,延时降不下来啊。OceanStore 9000里既有硬盘也有SSD,SSD用来做自动分层的缓存层(这大概是为了成本),其中硬盘用RAID 2.0的方式组织,以加快坏盘后的数据恢复速度。


交流会/

纯个人感受,做存储(泛泛而谈,不专指企业存储),底层和架构就是那些,Infiniband啊,主从结构啊,RAID啊,双控啊,各家的都差不太多。就看怎么拼在一起,怎么处理一系列细节问题了,换句话说,看的是各家的节操 🙂

自修DELL笔记本

家里有个DELL e6400的笔记本,最近用起来感觉越来越发烫,而且长时间浏览网页或干活儿后,就频频死机。一开始以为是今年夏天温度太高,于是把塑料瓶装上自来水冻成冰块,放到笔记本的背后降温。


dell笔记本

后来在 @唐僧_huangliang 的提醒下,仔细听了听散热口,确实一点风扇的声音都听不到。于是打开笔记本,才发现虽然里面的配件还很新,但是散热口的内侧已经堆积了厚厚的一层油灰,于是赶紧清除之。装好后重新开机,还是听不到风扇声,于是到DELL官网上下了个BIOS的更新程序,安装后提示要重启,重启后终于听到了轻微的风扇声。这次笔记本的后背不烫了,看来把热量从里往外吹是比较高效的,这么点风声就可以保持本子不升温了,都不用敷冰块了。

去哪儿

部门这几天在投票选六月份outing的地点,很多同事选了“泰国清迈”。

coly:咋那么多人选泰国啊!最近泰国这么乱,我又这把年纪了,万一穿着黄衬衫到泰国,被红衫军以为是黄衫军,痛打一顿,一身的血,结果又被黄衫军以为是红衫军,又被痛打....

我回到家,把消息告诉了家人,家里人也觉得泰国最近不太平。吃饭,看电视,正好新闻里演泰国的局势,里面大大的标题“泰国,去向何方?”

妈:你看,泰国自己都不知道该去哪儿,你们还去那儿干嘛?

1 2 3 14