<?xml version="1.0" encoding="utf-8"?>
<feed xmlns="http://www.w3.org/2005/Atom">
  <title>寱语</title>
  <subtitle>kzeng's blog</subtitle>
  <link rel="alternate" type="text/html" href="http://www.kzeng.info/baidu_guoxue_search"/>
  <link rel="self" type="application/atom+xml" href="http://www.kzeng.info/node/1153/atom/feed"/>
  <id>http://www.kzeng.info/node/1153/atom/feed</id>
  <updated>2006-01-09T18:02:53-06:00</updated>
  <entry>
    <title>初评百度的国学搜索</title>
    <link rel="alternate" type="text/html" href="http://www.kzeng.info/baidu_guoxue_search" />
    <id>http://www.kzeng.info/baidu_guoxue_search</id>
    <published>2006-01-09T16:24:46-06:00</published>
    <updated>2006-01-09T18:02:53-06:00</updated>
    <author>
      <name>kzeng</name>
    </author>
    <category term="google" />
    <category term="国学" />
    <category term="国学搜索" />
    <category term="百度" />
    <category term="历史" />
    <category term="杂谈" />
    <summary type="html"><![CDATA[原来说百度的[国学搜索网站|http://guoxue.baidu.com]要等到1月12日才上线，可是今天发现已经可以访问了。于是好奇随便查了一些句子，但是结果并不是很让人满意，甚至不如网上已经有的一些资料。我随便搜索了一下“墨子”中的一些章节，发现百度不过是做了些纯文本的页面在那里，没有注疏，什么都没有，远不如[国学网站|http://www.guoxue.com]做的注解版的《史记》、《资治通鉴》等古籍，不论是搜索（与google或是古登堡计划相比）的方面看，还是国学（与已有的国学网站相比）的方面看，百度国学搜索的技术含量都很低，并且有一些明显的纰漏与错误，以[《墨子·备城门第五十二》|http://guoxue.baidu.com/page/c4abd7d3/13.html]为例，中间有些句子根本读不通，很多异体字要么用偏旁拼凑的七零八散，要么就不伦不类的杂糅在那里，譬如下面这句：    ]]></summary>
    <content type="html"><![CDATA[原来说百度的[国学搜索网站|http://guoxue.baidu.com]要等到1月12日才上线，可是今天发现已经可以访问了。于是好奇随便查了一些句子，但是结果并不是很让人满意，甚至不如网上已经有的一些资料。我随便搜索了一下“墨子”中的一些章节，发现百度不过是做了些纯文本的页面在那里，没有注疏，什么都没有，远不如[国学网站|http://www.guoxue.com]做的注解版的《史记》、《资治通鉴》等古籍，不论是搜索（与google或是古登堡计划相比）的方面看，还是国学（与已有的国学网站相比）的方面看，百度国学搜索的技术含量都很低，并且有一些明显的纰漏与错误，以[《墨子·备城门第五十二》|http://guoxue.baidu.com/page/c4abd7d3/13.html]为例，中间有些句子根本读不通，很多异体字要么用偏旁拼凑的七零八散，要么就不伦不类的杂糅在那里，譬如下面这句：
  城四面四隅，皆为高磨衤斯，使重室子居亓上，亻侯適，视亓亻能状，与亓
  进左右所移处，失亻侯，斩。

首先，排版有些问题，在不该换行的地方有硬换行，感觉像是从什么地方拷贝粘贴过来的。

其次，既然需要做国学搜索，就该做的专业些，显示不出来的字最好用图片表示，这样分开的（衤斯）字远不如 [http://www.kzeng.info/files/J010193AB.jpg] 看起来方便，而分开的（亻能）字也不如[http://www.kzeng.info/files/J010193AC.jpg]方便。这样字作起来并不难，不知道百度为什么不“勉为其难”？

再次，简体字、繁体字、异体字与通假字杂糅在一起，又不给注释，显得非常混乱，譬如“適“字，虽然它是敌（敵）的通假字，但是不知道为什么不简化为”适“？还有这个（亻侯）字，不知道为什么百度要加个单人旁，我在超星上查了清人孙诒让的《墨子间诂》，这里不过是一个普通的”候“字，不知道百度在这里卖得什么关子？

再再次，还是想强调注疏与训诂的重要性，这些古籍到了以考据为癖的清朝人那里，几乎都有了比较完备的集前朝历代考据之所成注本，如果能将这些书也汇入，那才更有意义。譬如上面的这句引文按照吴毓江的考证，本不该在《备城门》这里，而应该在《号令第七十》那里，[清华网站上的《墨子》中|http://rwxy.tsinghua.edu.cn/rwfg/ydsm/ydsm-qw/02-%C4%AB%D7%D3/015.htm]有较详细的注解。

总的来说，感觉百度的这个国学做得非常的一般，还没有达到[国学网站|http://www.guoxue.com]的水平。    ]]></content>
  </entry>
</feed>
