lucene 3的中文分词mmseg4j

我的日啊,昨天刚完成了lucene 2.9到3.0的迁移,今天就有lucene 3.0.1了!!!

很久没写点有代码的东西了,实在是没时间。最近,很意外的,我竟然又写起了Java。

我的主要任务是把网站(不是我这个blog)的全文检索由lucene 2.9升级到3.x版本,同时更新下mmseg4j。

lucene 3.x版本采用了全新的API,作为过渡的2.9中那些deprecated方法在3.0中已经彻底废弃了。不过我也没有太多东西要改,主要是修正了TokenStreams的相关代码,似乎TokenStream也是3.0中最大的革新。

A new TokenStream API has been introduced with Lucene 2.9. This API has moved from being Token-based to Attribute-based. While Token still exists in 2.9 as a convenience class, the preferred way to store the information of a Token is to use AttributeImpls.

lucene的中文分词是使用的mmseg4j 1.8.2,这个版本也是针对lucene 2.x的,因此首先对mmseg4j下手。

与lucene相关的代码全部位于com.chenlb.mmseg4j.analysis;中,可以看到要做修正的地方并不多,主要还是把MMSegTokenizer中的next()换作boolean incrementToken()

READ MORE>>

我这几天都在做WordPress主题了

我感觉自己似乎一直在浪费时间,一直都是在给别人做WP主题,当然也是为了赚点钱。每次一开电脑就要打开Netbeans,还有一个为了测试主题而安装的Windows虚拟机。。。

自己想学的都还没有学到,很多的事情都荒废了。不过也学到了点东西,至少更会做网页了,还会了点PHP,算是意外的收获。为了更好的写代码,还学习了一下使用Mercurial,之前我是从来没用过版本控制软件的,因为之前就没写过太多代码。本来想用git的,毕竟我最喜欢的RoR就是git上的,但是Netbeans不支持git也就只好选其他的了。

没有什么说的了,贴一点做主题时用到的简单的代码,说不定哪天有哪位与ABitNo一样菜的朋友会用到。不过想想也不知道哪些代码比较有用,就把我在sidebar里用的几个方法帖一下。

获取WordPress中评论最多的文章

function wp_get_most_commented_posts($limitclause="") {
    global $wpdb;
    $q = "SELECT ID, post_title, post_date,
COUNT($wpdb->comments.comment_post_ID) AS 'comment_count'
FROM $wpdb->posts, $wpdb->comments
WHERE comment_approved = '1' AND post_status = 'publish'
      AND $wpdb->posts.ID=$wpdb->comments.comment_post_ID 
GROUP BY $wpdb->comments.comment_post_ID
ORDER BY comment_count DESC $limitclause";
    return $wpdb->get_results($q);
}

READ MORE>>

咱也在Linux上JavaFX一下

话说在这个6月SUN发布了JavaFX 1.2,同时也有了Linux版本,ABitNo相当兴奋。不过在发布的当天并没有Linux上Netbeans的插件,出去玩了两天,回来发现Netbeans里已经有了JavaFX开发相关的Plugin了,小体验一下。。。

javafx-demo-mediabox

READ MORE>>

将JPetStore导入NetBeans 6.5.1

学习Java EE,学习了Spring,然后要研究下官方的Samples,先拿JPetStore开刀,这么大的一个项目不用IDE可不行(至少我是这么觉得),ABitNo可是一个真正的SUN迷,就用NetBeans了,写本文时NetBeans的最新稳定版本是NetBeans 6.5.1,到下个月NetBeans 6.7也就出来了。不多说,开始把JPetStore导入NetBeans:
1、首先要有NetBeans和JPetStore

2、在NetBeans中新建项目Java Web >>Web Application with Existing Sources
netbeans-jpetstore-1

READ MORE>>