整列済み索引を作成する
FILE
それぞれの整列済み索引 (permutated index)
を標準出力に書く。
FILE
が一つも与えられないと標準入力から読み込む。また
FILE
が
` - '
だった場合には、そのファイルには標準入力が用いられる。
結果は結合されるが、各
FILE
はそれぞれ独自のコンテクストを持ち、
自動参照を使うときには別々に参照される。
IN-FILE
から読み、
OUT-FILE
に書く。後者が省略されると標準出力に書く。
-b FILE, --break-file=FILE
FILE
から取得する (このファイルは
break file
と呼ばれる)。
デフォルトのモードでは、
FILE
にある全ての文字が (改行文字も含めて) 考慮される。
過去互換モードでは、空白・タブ・改行の各文字は、常に
FILE
からは捨てられる。
-f, --ignore-case
-g NUMBER, --gap-size=NUMBER
NUMBER
に設定する (デフォルトは 3)。
-i FILE, --ignore-file=FILE
FILE
から取得する (このファイルは
ignore file
と呼ばれる。デフォルトは /usr/local/lib/eign)。
各行には単語を一つだけ指定する。
ignore file
にある単語は
only file
にある単語を上書きする。
-o FILE, --only-file=FILE
FILE
から取得する (このファイルは
only file
と呼ばれる)。インデックスを生成するとき、
このリストにない単語は無視する。各行には単語を一つだけ指定する。
-r, --references
-w NUMBER, --width=NUMBER
NUMBER
桁を越えないように切り捨てる。
--right-side-refs
の分は含まれないので注意。これを用いた場合は指定桁を越えることがある。
-A, --auto-reference
-F STRING, --flac-truncation=STRING
STRING
(デフォルトは `\') を出力する。
STRING
中では、(C プログラムで使うような)
バックスラッシュを用いたエスケープシーケンスの多くも認識され、
適切な文字に変換される。
-M STRING, --macro-name=STRING
STRING
をマクロ名に使う (デフォルトは
` .xx ')。
-O, --format=nroff
TAIL BEFORE KEYWORD_AND_AFTER HEAD REF
-R, --right-side-refs
-S REGEXP, --sentence-regexp=REGEXP
REGEXP
を行末または文末の評価に用いる。
GNU モードで
--references
オプションが指定されていない場合のデフォルトは以下:
[.?!][]\')}]*\$\\t \\)[ \t\n]*
\n
-T, --format=tex
\xx {TAIL}{BEFORE}{KEYWORD}{AFTER}{HEAD}{REF}
-W REGEXP, --word-regexp=REGEXP
REGEXP
にマッチする単語をキーワードにする。
--break-file
に指定されている単語も出力する。 GNU モードでのデフォルトは:
\w+
[^ \t\n]+
REGEXP
が空の場合はデフォルトを用いる。
-F
と同じく、バックスラッシュを用いたシーケンスも認識・変換される。
-C, --copyright
--help
--version
>> /I've had a look at the source, and I still *** >> /or what is a permutated index, and what it ***
> ptx merely produces a sorted list of the vocabulary you > used, with some context for each, so I can study your > writing style, for example. Whenever you use the word > and, it is preceded by a comma :-).
[ptx は君の使ったボキャブラリをソートしてリストを作り、 前後のコンテクストと共に示してくれるんだ。これを見ると、 例えば君の書き方のクセがわかるわけさ。君が and って いう単語を使う前には必ずコンマを入れる、とかね :-)]
lightside~% grep posts ^Path: |cut -b 7- > paths.txt
lightside!host2!host3!host4!host5!news lightside!host2!host3!host4!host6!news lightside!host7!host8!host9|host10|host4|host5!news lightside!host4!host5!news lightside!host11!news
lightside~% ptx --sentence-regexp=\n \ --word-regexp=[^\!]+.