Xapian 初体验之 hello xapian

文件夹结构:

~/helloxapian

~/helloxapian/indexfiles.py

~/helloxapian/search.py

~/helloxapian/test

~/helloxapian/test/hello.txt

~/helloxapian/test/world.txt

~/helloxapian/test/abc.txt

hello.txt文件world.txt文件abc.txt文件是三个文本文件,内容是一段英文文章。

indexfiles.py文件:

#!/usr/bin/env python

#coding=utf-8

import sys

import xapian

import string

from os import listdir

import re

rex=re.compile('[a-zA-Z0-9]+') #给英文内容进行简单的分词,暂时不涉及中文

MAX_TERM_LENGTH = 64 #设置一个关键词的最大长度

DBPATH='indexdb' #索引文件目录

if len(sys.argv) < 2:

try:

except Exception, e:

现在打开终端窗口,到~/helloxapian目录中执行python indexfiles.py test

就可以把test目录下的所有.txt文件都建立索引。

此时在~/helloxapian下会多出一个indexdb目录,这就是存储索引文件的目录。

search.py文件内容:

#!/usr/bin/env python

#coding=utf-8

import sys

import xapian

if len(sys.argv) < 2:

执行python search.py hello world或其它关键词,即可搜索到对应文件

头太晕

xapian004 (last edited 2009-12-25 07:15:29 by localhost)