庖丁解牛(paoding) 如何定制自己的字典 (摘自官方配置文件)

qipei

浏览: 10038 次
性别:
来自: 北京

最近访客更多访客>>

jiadianyan

vegetalol

帅气逗比LEO

壹千零一句谎言

博主相关

博客

微博

相册

留言

关于我

文章分类

全部博客 (2)

社区版块

存档分类

Solr Linux IDE Google 应用服务器

本人用(Solr + paoding)

庖丁中文分词需要一套词典，这些词典需要统一存储在某个目录下，这个目录称为词典安装目录。词典安装目录可以是文件系统的任何目录，它不依赖于应用程序的运行目录。将词典拷贝到词典安装目录的过程称为安装词典。增加、删除、修改词典目录下的词典的过程称为自定制词典。

在linux下，我们可以考虑将词典安装在一个专门存储数据的分区下某目录，以笔者为例，笔者将/data作为系统的一个独立分区，笔者便是将词典保存在/data/paoding/dic下。

在windows下，我们可以考虑将词典安装在非系统盘的另外分区下的某个目录，以笔者为例，笔者可能将词典保存在E:/data/paoding/dic下。

使用者安装辞典后，应该设置系统环境变量PAODING_DIC_HOME指向词典安装目录。

在linux下，通过修改/etc/profile，在文件末尾加上以下2行，然后保存该文件并退出即可。

PAODING_DIC_HOME=/data/paoding/dic

export PAODING_DIC_HOME

在windows下，通过“我的电脑”属性之“高级”选项卡，然后在进入“环境变量”编辑区，新建环境变量，设置“变量名”为PAODING_DIC_HOME；“变量值”为E:/data/paoding/dic

第3步，把paoding-analysis.jar拷贝到应用运行时的类路径(classpath)下。使用集成开发环境(IDE)开发应用的使用者，需要把paoding-analysis.jar拷贝到工程中，然后使用IDE向导引入该Jar包，以便开发应用时IDE能够认识它。

在dic目录下加一个xxx.dic文件,或在别的文件中添加词语就可以了
文件里面随便你写什么，每行一个词

但是注意：
   1.每次词典修改后，要删掉dic下面的“.compiled ”文件夹，重起solr所在服务器
   2.字典必须是UTF-8编码
   3.不要用记事本打开(我是用Editplus把字典保存成UTF8的)

分享到：

htmlparser 自定义标签的扩展注册

2009-04-10 17:37
浏览 7471
评论(8)
查看更多

8 楼 zyslovely 2010-04-28

lz能给个例程么？
zyslovely@163.com

7 楼 qipei 2009-07-27

yang7229693 写道

楼主您好，我是直接下载google上的beta版，培植了环境变量就可以运行了，我向dic文件夹下添加了新的dic文件，删除了.compiled文件夹，然后点击analyzer.bat跟build.bat，dic文件夹下都没有生成.compiled文件夹，而且庖丁也无法正常工作了，卧式一个新手，希望楼主能够解答，谢谢了

我的情况是：在启动容器之后会自动生成.compiled

6 楼 yang7229693 2009-07-26

5 楼 qipei 2009-06-02

配置文件是这样的：(

wwwmmmbird 写道

qipei 写道
内容不是我写的我之前在配置的时候遇到这些问题上面大部分内容是官方配置文件里的呵呵。我今天查了一些资料，增加字典启动容器之后，会在classes目录中自动生成一个目录，叫“.compiled"，里买你有一个目录，叫“most-words-mode",里面7个文件，而且网上很多资料都说要删除这个文件夹，才能建立索引。但是问题来了，删除了之后，在启动容器，还会在生成，无语了～

就是每次启动容器的时候还会生成，但是没有关系，只要是在你修改了字典之后生成的就行了

4 楼 qipei 2009-06-02

文件夹才

wwwmmmbird 写道

每次词典修改后，要删掉dic下面的“.compiled ”文件夹才管用

你说的对，我之前就是没有删除所以每次对字典修改后，都没有起作用

3 楼 wwwmmmbird 2009-06-01

补充说明一下，如果你的字典是UTF-8编码，请不要用记事本打开，否则的话，第一行的词会无效

因为记事本会在文件头写下一个bom标记位,不知道你的问题跟这个有没有关系。

2 楼 wwwmmmbird 2009-06-01

每次词典修改后，要删掉dic下面的“.compiled ”文件夹才管用

1 楼 wycrabbit 2009-05-11

能不能给发一个demo,谢谢！！我的邮箱wycheng2829@126.com

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论