初评百度的国学搜索
原来说百度的[国学搜索网站|http://guoxue.baidu.com]要等到1月12日才上线,可是今天发现已经可以访问了。于是好奇随便查了一些句子,但是结果并不是很让人满意,甚至不如网上已经有的一些资料。我随便搜索了一下“墨子”中的一些章节,发现百度不过是做了些纯文本的页面在那里,没有注疏,什么都没有,远不如[国学网站|http://www.guoxue.com]做的注解版的《史记》、《资治通鉴》等古籍,不论是搜索(与google或是古登堡计划相比)的方面看,还是国学(与已有的国学网站相比)的方面看,百度国学搜索的技术含量都很低,并且有一些明显的纰漏与错误,以[《墨子·备城门第五十二》|http://guoxue.baidu.com/page/c4abd7d3/13.html]为例,中间有些句子根本读不通,很多异体字要么用偏旁拼凑的七零八散,要么就不伦不类的杂糅在那里,譬如下面这句:
城四面四隅,皆为高磨衤斯,使重室子居亓上,亻侯適,视亓亻能状,与亓
进左右所移处,失亻侯,斩。
首先,排版有些问题,在不该换行的地方有硬换行,感觉像是从什么地方拷贝粘贴过来的。
其次,既然需要做国学搜索,就该做的专业些,显示不出来的字最好用图片表示,这样分开的(衤斯)字远不如 [http://www.kzeng.info/files/J010193AB.jpg] 看起来方便,而分开的(亻能)字也不如[http://www.kzeng.info/files/J010193AC.jpg]方便。这样字作起来并不难,不知道百度为什么不“勉为其难”?
再次,简体字、繁体字、异体字与通假字杂糅在一起,又不给注释,显得非常混乱,譬如“適“字,虽然它是敌(敵)的通假字,但是不知道为什么不简化为”适“?还有这个(亻侯)字,不知道为什么百度要加个单人旁,我在超星上查了清人孙诒让的《墨子间诂》,这里不过是一个普通的”候“字,不知道百度在这里卖得什么关子?
再再次,还是想强调注疏与训诂的重要性,这些古籍到了以考据为癖的清朝人那里,几乎都有了比较完备的集前朝历代考据之所成注本,如果能将这些书也汇入,那才更有意义。譬如上面的这句引文按照吴毓江的考证,本不该在《备城门》这里,而应该在《号令第七十》那里,[清华网站上的《墨子》中|http://rwxy.tsinghua.edu.cn/rwfg/ydsm/ydsm-qw/02-%C4%AB%D7%D3/015.htm]有较详细的注解。
总的来说,感觉百度的这个国学做得非常的一般,还没有达到[国学网站|http://www.guoxue.com]的水平。
Trackback URL for this post:
http://www.kzeng.info/trackback/1153
guenstig uebernachten in worms
from guenstig uebernachten in worms on Fri, 2010-03-12 22:48[...] We're helping our customers to become competitive.' ISS's customers range from multinationals, such as IBM, Philips and Monsanto, to the European Commission, and Vienna and Geneva airports. Cleaning budgets can be surprisingly large. Sometimes,te...
- kzeng's blog
- Quote
- 4773 reads
Comments
Post new comment