26 Sep

【NASA每日一图】银河系中心

图片说明:银河系中心,版权:ESO / Stéphane Guisard & Stéphane Guisard

图片说明:银河系中心,版权:ESO / Stéphane Guisard & Stéphane Guisard

点击阅读全文...

5 Oct

美国3名科学家获诺贝尔生理学或医学奖

2009年度的诺贝尔奖评选开始了,从10月5日开始,诺贝尔奖的获选人将逐步揭开。今天17:00,诺贝尔生理学或医学奖的得奖者已经揭开,他们就是美国的——美国加利福尼亚旧金山大学的伊丽莎白·布莱克本(Elizabeth Blackburn)、美国巴尔的摩约翰·霍普金斯医学院的卡罗尔-格雷德(Carol Greider)、美国哈佛医学院的杰克·绍斯塔克(Jack Szostak)以及霍华德休斯医学研究所!他们的主要成就为发现了端粒和端粒酶保护染色体的机理

伊丽莎白·布莱克本(Elizabeth Blackburn)

伊丽莎白·布莱克本(Elizabeth Blackburn)

伊丽莎白·布莱克本(Elizabeth Blackburn)

点击阅读全文...

6 Oct

【NASA每日一图】GigaGalaxy Zoom-礁湖星云

图片说明:礁湖星云,版权:ESO

图片说明:礁湖星云,版权:ESO

点击阅读全文...

6 Oct

中国香港“光纤之父”获2009诺贝尔物理学奖!

中国网10月6日电,据诺贝尔基金会官方网站报道,瑞典皇家科学院诺贝尔奖委员会宣布,将2009年度诺贝尔物理学奖授予一名中国香港科学家高琨(Charles K. Kao)和两名美国科学家博伊尔(Willard S. Boyle)乔治-E-史密斯(George E. Smith)。科学家Charles K. Kao 因为“在光学通信领域中光的传输的开创性成就” 而获奖,科学家因博伊尔和乔治-E-史密斯因“发明了成像半导体电路——电荷藕合器件图像传感器CCD” 获此殊荣。

2009年诺贝尔物理学奖获得者高锟、博伊尔和史密斯(从左至右)

2009年诺贝尔物理学奖获得者高锟、博伊尔和史密斯(从左至右)

2009年诺贝尔物理学奖获得者高锟、博伊尔和史密斯(从左至右)

点击阅读全文...

8 Oct

【NASA每日一图】撞击目标:凯布斯月球坑

NASA月球探测器撞击目标——凯布斯(Cabeus )月球坑

NASA月球探测器撞击目标——凯布斯(Cabeus )月球坑

(图片说明:凯布斯(Cabeus )月球坑,版权:NMSU/MSFC Tortugas Observatory)

点击阅读全文...

31 Oct

沉痛,默哀!中国科学巨星钱学森逝世

1950年,美国海军次长金布尔说:“他无论走到哪里,都抵得上5个师的兵力,我宁可把他击毙在美国也不能让他离开!”

年轻钱学森

年轻钱学森

不论你是专注还是不专注科学,我相信您都会听过这句话。这是在1950年,处于美国的钱学森要回国的时候,美国海军次长金布尔竭力阻止尔说的话。钱学森是中国航天科技事业的先驱和杰出代表,被誉为“中国航天之父”和“火箭之王”。然而,现在要告诉一个让各位朋友痛心的消息:这颗中国科学科学巨星今天在北京陨落了!享年98岁。

点击阅读全文...

15 Nov

《当彩色的声音尝起来是甜的》电子版

内容来源于:http://www.verycd.com/topics/2777592/

站长注:虽然有电子版,但是还是建议没有购买纸版的读者到书店或者网上购买一本。一是为了支持科学松鼠会和中国科学出版事业,二是拿着一本纸版书细细品味的感觉是读电子书绝对感受不到的。

《当彩色的声音尝起来是甜的》

《当彩色的声音尝起来是甜的》

《当彩色的声音尝起来是甜的》是科学松鼠会出版的第一本书,站长在得到消息后的第一时间,就在卓越上购买了它。这本书由上海三联书店出版。本书不是一本博客集,出自松鼠会网站的文章只占了1/3。全书54篇文章,精选自百位松鼠近三年创作的上千篇文章,从口腔溃疡到国际空间站,从玫瑰花到数学思想实验,内容天马行空,文字灵动活泼,一改传统科普的严肃面孔。

点击阅读全文...

26 Oct

新词发现的信息熵方法与实现

在本博客的前面文章中,已经简单提到过中文文本处理与挖掘的问题了,中文数据挖掘与英语同类问题中最大的差别是,中文没有空格,如果要较好地完成语言任务,首先得分词。目前流行的分词方法都是基于词库的,然而重要的问题就来了:词库哪里来?人工可以把一些常用的词语收集到词库中,然而这却应付不了层出不穷的新词,尤其是网络新词等——而这往往是语言任务的关键地方。因此,中文语言处理很核心的一个任务就是完善新词发现算法。

新词发现说的就是不加入任何先验素材,直接从大规模的语料库中,自动发现可能成词的语言片段。前两天我去小虾的公司膜拜,并且试着加入了他们的一个开发项目中,主要任务就是网络文章处理。因此,补习了一下新词发现的算法知识,参考了Matrix67.com的文章《互联网时代的社会语言学:基于SNS的文本数据挖掘》,尤其是里边的信息熵思想,并且根据他的思路,用Python写了个简单的脚本。

点击阅读全文...