26 Oct

新词发现的信息熵方法与实现

在本博客的前面文章中,已经简单提到过中文文本处理与挖掘的问题了,中文数据挖掘与英语同类问题中最大的差别是,中文没有空格,如果要较好地完成语言任务,首先得分词。目前流行的分词方法都是基于词库的,然而重要的问题就来了:词库哪里来?人工可以把一些常用的词语收集到词库中,然而这却应付不了层出不穷的新词,尤其是网络新词等——而这往往是语言任务的关键地方。因此,中文语言处理很核心的一个任务就是完善新词发现算法。

新词发现说的就是不加入任何先验素材,直接从大规模的语料库中,自动发现可能成词的语言片段。前两天我去小虾的公司膜拜,并且试着加入了他们的一个开发项目中,主要任务就是网络文章处理。因此,补习了一下新词发现的算法知识,参考了Matrix67.com的文章《互联网时代的社会语言学:基于SNS的文本数据挖掘》,尤其是里边的信息熵思想,并且根据他的思路,用Python写了个简单的脚本。

点击阅读全文...

31 Dec

网站PR升到3了!

哈哈,在2009年最后一天,还发现了一件好事情:
Spaces.Ac.cn的Google PR已经升到了3了!

PR查询

建立“科学空间”网站,也可以算是2009年做的最重要、最成功的事情之一了。在“宇宙驿站”的支持下,慢慢地建立起来,然后经过多次转换,从原先的转载到现在的撰写,现在已经基本定型,保持每周至少更新一次。

点击阅读全文...

9 Jan

精确自由落体运动定律的讨论(二)

跳伞过程中的自由落体阶段.jpg

之前在这篇文章中,我们使用过一个牛顿引力场中的自由落体公式:
$t=\sqrt{\frac{r_0}{2GM}}{r_0 \cdot arctg \sqrt{\frac{r_0 -r}{r}}+\sqrt{r(r_0 -r)}}$——(1)

我们来尝试一下推导出这个公式来。同时,站长在逐渐深入研究的过程中,发现微分方程极其重要。以前一些我认为不可能解决的问题,都用微分方程逐渐解决了。在以后的文章里,我们将会继续体验到微分方程的伟大魔力!因此,建议各位有志研究物理学的朋友,一定要掌握微分方程,更加深入的,需要用到偏微分方程!

首先,质量为m的物理在距离地心r处的引力为$\frac{GMm}{r^2}$,根据牛顿第二定律F=ma,自然下落的物体所获得的加速度为$\frac{GM}{r^2}$。假设物体从距离地心r开始向地心自由下落,求位移s关于t的函数s=s(t).

点击阅读全文...

5 Dec

科学空间:2009年12月重要天象

由于备战考试,这篇预报姗姗来迟。现在,终于可以跟大家见面了。2009年最后一月的夜空,并没有因为严冬的到来而显得冷清。精彩天象将接踵而来,想必寒冷的天气挡不住天文爱好者的热情。当然,光有热情还不够,防寒的措施一定要做好,要是为了一夜观测而吊上一周的点滴,那就不大好了。

12月22日是冬至节气,意味着北半球到了黑夜最长的时段,可观测时间也达到了最长!在这里我也希望大家合理安排观测时间,注意休息,切勿过于疲劳。愿大家在最好的一个月中,能够更好地享受天文的乐趣,以此完美地结束这个天文年!

点击阅读全文...

20 Dec

哥本哈根没有“句号”,留下一个“逗号”

结束了,大会结束了。

多少记者、志愿者、领导人,都经过了N个不眠之夜。在此向他们致敬!

这次会议是否成功,还是读者自己来判断吧。

气候变化大会在发布《哥本哈根协议》后闭幕

气候变化大会在发布《哥本哈根协议》后闭幕

总之一切才刚刚开始,还没有出现“。”,只有“,”。这场气候战注定了会很艰辛。这一次会议通过了一份并通过《哥本哈根协定》(提供下载),而下一年的会议将会在墨西哥举行。

还是让我们来看看相关报道好了。

点击阅读全文...

26 Dec

新年新天象:2010年1月重要天象

带着鼓励与期待,科学空间迈入了新的一年。虽然天文年已经过去,但是天文不会过去。2010年仍将是精彩天象不断上演的一年,科学空间会一如既往地带给大家准确、丰富的天象信息,为大家的天文观测提供一点点有用信息。同时在此祝大家新的一年里更加开心快乐、更上一层楼!

点击阅读全文...

26 Dec

精确自由落体运动定律的讨论

比萨斜塔.jpg

在初中或高中,自由落体试验简单地用这个公式来描述出来:
$$s=1/2 g t^2$$
其中$g=9.8m//s^2$,等于1kg物体在地球表面所受的重力。
但是这个公式很明显有一个问题,就是实际上在地球,g不是恒定的,会随着距离(即海拔高度)的变化而变化,上述公式能够在一定范围内描述自然落体运动。但是当距离很大时,公式便失效了。

点击阅读全文...

15 Jan

科学空间论坛成立,正式开放!

为了让大家有一个更好的科学交流平台,本站特意弄了一个简洁的讨论社区。在观测日环食之际,正式对广大读者开放。

登录入口:http://bbs.spaces.ac.cn

点击阅读全文...