ISO/IEC 6937:2001, Information technology — Coded graphic character set for text communication — Latin alphabet(情報技術 — 文字コミュニケーションのためのコード化された図形文字集合 — ラテンアルファベット)は、ISO基本ラテンアルファベットにないラテン文字を表現するためにASCII(ISO/IEC 646)をマルチバイト拡張したものである。ITU-T(当時はCCITT)によってテレマティクスのために開発され、T.51として勧告された。1983年にISO標準となった。

特定のバイトコードが、ダイアクリティカルマークつきの文字のためのバイトとして使われる。第1バイトの値がダイアクリティカルマークの種別を表し、ASCIIの値を持つ第2バイトが、ダイアクリティカルマークがつく文字を表す。第1バイトと第2バイトは特定の組み合わせのみが許容され、第1バイトの解釈は第2バイトによって例外がある。ISO/IEC 6937ではダイアクリティカルマークつきの組み合わせ後の文字は1つもコード化されていない。ダイアクリティカルマークその物を表したい場合は、第2バイトにASCIIのスペースを入れる。

ISO/IEC 6937はヒュージ・マックレガー・ロス、ピーター・フェンウィック、ベルナルド・マルティ、レーク・ゼッケンドルフによって設計された。

ISO 6937/2ではラテン文字を使用する現代のヨーロッパの言語で使われている327の文字が定義されている。キリル文字・ギリシャ文字などのラテン文字ではない文字は含まれていない。ダイアクリティカルマークつきのラテン文字でも、ルーマニア語のȘ(Sコンマ)など一部は含んでいない。Sコンマについては、規格制定時にコンマビローとセディーユの区別をしていなかったので、コンマビローの代わりにセディーユを使用する。

IANAでは、ISO 6937/2のバージョンの違いに応じてISO_6937-2-25ISO_6937-2-addの2つの名称を与えている。ただし、この文字コードがインターネット上では使用されたことはない。

ISO/IEC 6937の右半分を指すISO/IEC 2022のエスケープシーケンスは ESC - R (十六進数 1B 2D 52)である。

1バイト文字

ISO 6937/2の基本文字(0x00-0x7f)はISO 646に基づいているが、国際通貨記号(¤)に割り当てられていた0x24をドル記号($)に変更している。

	!"#¤%&'()* ,-./0123456789:;<=>?@
	ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_`
	abcdefghijklmnopqrstuvwxyz{|}

補足文字(0x80-0xff)には、字幅のあるおよび字幅のないの図形文字、追加記号と、将来の追加のための予約領域が含まれている。

2バイト文字

基本文字に含まれないアルファベットは2バイトでコード化する。第1バイトは「字幅のないダイアクリティカルマーク」(non spacing diacritical mark)で、第2バイトの基本アルファベットにそのダイアクリティカルマークをつける。例えば、アキュート・アクセントつきの小文字のe (é)は「[字幅のないアキュート・アクセント] e」として表現される。

ISO 6937の「字幅のないダイアクリティカルマーク」は以下の13種類である。

符号表

UnicodeでU 0300—U 036Fの範囲にある結合文字は、ISO/IEC 6937では0xC1—0xCFにあり、第1バイト(lead byte)としてのみ使用される。この範囲にあるダイアクリティカルマークがついた文字は、組み合わせ済みの文字とさてはコード化されていない。ダイアクリティカルマークの組み合わせで表現できない文字については、コード化されている。

例外的に、「セディーユつきの小文字のg」はアキュート・アクセント(0xC2)を第1バイトとする。これは、「セディーユつきの小文字のg」は、Ģ ģのように「g」の上にカンマを逆にしたものを付けた形になるためである。

Unicodeでは大文字のĐ(ストローク付きD)とÐ(エズ)を区別しているが、ISO/IEC 6937では区別せずに0xE2を割り当てている。小文字は字形が異なるため、ストローク付きD(đ)に0xF2、エズ(ð)に0xF3と別のコードを割り当てている。


出典


DIN ISO/IEC 6937

DIN EN ISO 93772

ISO/IEC 6937 Semantic Scholar

ISO 693721983 Information processing — Coded character sets for

ISO/IEC 69371994 Information technology — Coded graphic character