ブロックタグは章や節など、複数行にまたがる大きな文章のまとまりを表すために使用します。%要素名
という記法で開始し、要素名なしの%
の記号でブロックの終了を表します。
%表紙
〜ブロックタグの中身〜
%
ブロックにはレベルがあります。開始・終了タグの%
の個数でレベルを表現します。レベルはブロック同士のネスト(入れ子)を表現するために使用されます(後述)。
%本文
〜レベル1のブロック〜
%
%%本文
〜レベル2のブロック〜
%%
%%%本文
〜レベル3のブロック〜
%%%
ブロックの終了を示す%
や%%
を省略することもできます。終点の%
が省略された場合、同じレベルのブロックが始まるまでがブロックの範囲になります。
%表紙
〜ブロックの中身〜
%本文
〜別のブロックの中身〜
同じレベルのブロックが存在しなかった場合は、テキストの最後までがブロックの範囲とみなされます。
%表紙
〜テキストの終了まで全範囲が表紙ブロック〜
レベルの大小を使って、ブロックのネスト(入れ子)関係を表現することができます。たとえばレベル1のブロックの範囲に置かれたレベル2、レベル3のブロックは、レベル1のブロックに含まれると見なされます。
たとえば次のテキストは、
%章
%%節
〜章に含まれる節の中身〜
%%節
〜章に含まれる節の中身〜
%%%段落
〜節に含まれる段落の中身〜
%%%段落
〜節に含まれる段落の中身〜
(ここまでが章ブロックの範囲)
%
このようにXMLに変換されます。
<text>
<div type="章">
<div type="節">
〜章に含まれる節の中身〜<lb/>
</div>
<div type="節">
〜章に含まれる節の中身〜<lb/>
<div type="段落">
〜節に含まれる段落の中身〜 <lb/>
</div>
<div type="段落">
〜節に含まれる段落の中身〜<lb/>
</div>
</div>
</div>
</text>
インラインタグは、振り仮名や割書や虫損箇所、または日時や地名など、数語程度の短いテキストをマークアップするために利用します。インラインタグの記法は次の通りです:
《タグ名:テキスト1|テキスト2|...》
タグ名を:
で区切った後には、任意数のテキストを|
で区切ってマークアップすることができます。それぞれのテキストがどのように解釈されるかは、タグによって異なります。
たとえば次の例では、テキスト1とテキスト2が割書はの1行目と2行目として解釈されます:
《割書:テキスト1|テキスト2》
漢字の左右に振り仮名がある場合は、次のように記述します:
《振り仮名:漢字|右ふりがな|左ふりがな》
ただし振り仮名のように文中に頻出する要素すべてに《タグ名:テキスト1|テキスト2|...》
というタグを付けるのは煩雑ですし、マークアップ後のテキストの可読性も落ちてしまいます。そこでいくつかの省略記法が用意されています(後述)。
HTMLタグと同様に、ブロックタグとインラインタグにはID、クラス属性を付与することができます。
半角または全角の#
で始まる英数字の文字列をタグ名の後につけると、その文字列はIDと見なされます。
《タグ名#ID_text:テキスト》
半角または全角の*
で始まる英数字の文字列は、クラス名と見なされます。
《タグ名*class1*class2》
IDはタグにつき1つだけ付与できますが、クラスは複数個付与することができます。
いくつかのインラインタグには《》
を使用せずに記述できる省略記法が用意されています。
連続する漢字の後に全角丸括弧()
で囲んだテキストは、振り仮名と見なされます。
豊臣(とよとみ)秀吉(ひでよし)
振り仮名の途中に|
を挿入すると、漢字の左側に振り仮名を付けることができます。
豊臣(とよとみ|ほうしん)
漢文の返り点は、全角アンダーバー_
の後に返り点を置くことで入力できます。送り仮名は、全角オーバーライン ̄
の後に平仮名または片仮名を置くことで入力できます。
`我知_下 ̄ル見_二美 ̄シキ鳥_一 ̄ヲ者_上`
漢文で複数の漢字を熟語としてまとめる竪点を使うには、全角ハイフン−
を使用します。次は「敬」と「祭」が竪点で結ばれている例です。
而敬−_二祭天神地祇_一
テキスト中の判読が難しい文字や、虫損等のため読み取れない文字は、それぞれ白抜き四角□
と黒四角■
で入力します。
読めない□□□箇所。虫損している■■箇所。
テキスト中に現れる人物名、日時、場所などの意味的に重要な情報をマークアップする際には、それぞれ中括弧{}
、大小括弧<>
、甲括弧〔〕
を利用できます。
<天正十年六月二日>に〔本能寺〕にて{明智光秀}は…