| 日本語全文検索エンジン |
|---|
| Full-text Retrieval Engine for Your Archives |
- (今後出てくるであろう)バグをとる
- マニュアルを整備する/HTML化する
- FDIF配送ツールを作成する
- 簡易ロボットも配付する (libwww-perl-5使用)
- 関連語表示
- 関連検索エンジン推薦機能を実装する
- fsearch.cgiに検索結果のキャッシュ機能をつける
- fsearch.cgiのセキュリティを真面目に考える
- fsearch.cgiの検索結果でミラーページの重複を判別する
- 検索エンジンデーモンを作り,クライアント・サーバー型のコマンドをつける
- Apache用のmoduleを作成する
- 複数の索引から同時に検索できるようにする
- 索引から特定の文書を削除できるようにする
- もっと初心者に使いやすいインターフェースを持ったCGIプログラムを用意する
- AND検索をデフォルトにできるようにする
- signalをまともに処理する
- エラー処理をまともに行なう(disk fullのときなど)
- 排他制御を行なう(索引作成時,キャッシュ保存時など)
- メールなどもCGIから検索できるようにする
- fsearch(1)を呼び出すEmacs Lispを添付する
- ICOT形態素辞書はカタカナ語に弱いので,何とかして追加する
- /robots.txt に対応したHTMLファイル一覧作成ツールを添付する
- FRAMEに対応する
- man2fdif, texi2fdif, setext2fdif, italk2fdif などを作る (随時募集中。:-) )
- news2fdif が重要かな。
- ????2fdif をライブラリ化する
- <meta name="ROBOTS">に従うようにする
- Dublin Coreのサブセットをサポートする
- 検索式で ( ) を使えるようにする
- 検索式でOR演算子 '|'を使えるようにする
- OR検索・AND検索の際にフレーズ検索を加味したランキングを行なう
- 検索を実行する前に質問の最適化を行なう
- フィールドが6種類しか出来ないのを増やす
- .lexの先頭部分を圧縮する
- Lexiconをprefix B+*treeで書き直す
- 高速化する(Lexiconの検索,ランキング(ソート)とδコードの展開が遅そう)
- qsort(3)を使っている部分はC++的に直す
- ランキング時のソートは上位の部分だけでいい
- まじめにXMLに準拠する?
- パトリシアをテンプレート化する
- パトリシアのsave(),load()をもっと真面目に実装する
- デザインパターンを勉強してクラス設計をなんとかする
- ソースにまじめにコメントをつける(英語で)
- バイトオーダーを統一する
- 64bit UNIXに対応する
- IRIX5.3付属のCCでmakeできるようにする
- Configureスクリプトを用意する
- FreeBSD2.2用バイナリpakcage,RedHat Linux用rpmを用意する(誰か作ってー(^^;)
- manを用意する
- 英語のmanを用意する(つらいものが…(^^;)
- メーリングリストを立ち上げる(ユーザーが増えたら…)
- Win32に移植する
- Wordや一太郎はマクロでテキスト部分を抽出…できるかな?
- PostScript,PDFに対応する
- 全部Javaで書き直し,Unicode3.0に対応する(!?)