(もじさんしょう,英:character reference)
XML や HTML などの標記言語において,所定の記法で文字を間接的に表現する方法。
例えば HTML では,<
や >
のように構文上直接記述できない予約文字を <
,>
と書いて「<」「>」と表示させることができる。 このように予約文字を標記される対象として記述したい場合のほか,非図形文字や空白類のような視認しにくい文字,字形の紛らわしい文字,入力しにくい文字などを厳密に記述することに役立つ。
HTML では,ISO/IEC 10646(Unicode にほぼ相当)の符号点を十進数または十六進数で記述する「数値文字参照」と,予め定義された文字名で記述する「文字実体参照」の2種類の方法がある。前者(例:α
→ α)は直感性に劣るものの符号点で示せる文字は全て扱うことができ,後者(例:α
→ α)は直感性に優れるものの予め定義された少数の文字しか扱えない。
なお,HTML でいう文字実体参照は XML においては実体参照というマクロ的な仕組みの単なる応用で,定義済み文字も最小限であり,単に文字参照といえば HTML の数値文字参照に相当する方法を指す。
デライトの標記言語であるデラングでは,HTML の文字参照と互換性のある文字参照記法を実装している。