正規表現で記載するときに調べるのが面倒なので一覧を作りました。
Javascriptやphpなどでは、コード内に16進数を書く場合には頭に「0x」を頭に付けます。
正規表現の場合は「0x」の代わりに「¥x」を頭につけます。
文字の範囲 | ASCIIコードの範囲(16進数) | 正規表現用にコピー |
---|---|---|
数字 | 0x30-0x39 | |
アルファベット小文字 | 0x61-0x7a | |
アルファベット大文字 | 0x41-0x5a | |
数字とアルファベット | 0x30-0x39 0x41-0x5a 0x61-0x7a | |
記号 | 0x21-0x2f 0x3a-0x40 0x5b-0x60 0x7b-0x7e | |
制御文字(スペースを含む) | 0x00-0x20 0x7f | |
数字とアルファベット以外 | 0x00-0x2f 0x3a-0x40 0x5b-0x60 0x7b-0x7e |
赤文字は制御文字なので表示されません。
表を分割して横に並べた表をよく見るのですが読みにくいので分割せず縦にしています。
文字 | 10進数 | 16進数 |
---|---|---|
NUL(null文字) | 0 | 0x00 |
SOH(ヘッダ開始) | 1 | 0x01 |
STX(テキスト開始) | 2 | 0x02 |
ETX(テキスト終了) | 3 | 0x03 |
EOT(転送終了) | 4 | 0x04 |
ENQ(照会) | 5 | 0x05 |
ACK(受信OK) | 6 | 0x06 |
BEL(警告) | 7 | 0x07 |
BS(後退) | 8 | 0x08 |
HT(水平タブ) | 9 | 0x09 |
LF(改行) | 10 | 0x0a |
VT(垂直タブ) | 11 | 0x0b |
FF(改頁) | 12 | 0x0c |
CR(復帰) | 13 | 0x0d |
SO(シフトアウト) | 14 | 0x0e |
SI(シフトイン) | 15 | 0x0f |
DLE(データリンクエスケープ) | 16 | 0x10 |
DC1(装置制御1) | 17 | 0x11 |
DC2(装置制御2) | 18 | 0x12 |
DC3(装置制御3) | 19 | 0x13 |
DC4(装置制御4) | 20 | 0x14 |
NAK(受信失敗) | 21 | 0x15 |
SYN(同期) | 22 | 0x16 |
ETB(転送ブロック終了) | 23 | 0x17 |
CAN(とりけし) | 24 | 0x18 |
EM(メディア終了) | 25 | 0x19 |
SUB(置換) | 26 | 0x1a |
ESC(エスケープ) | 27 | 0x1b |
FS(フォーム区切り) | 28 | 0x1c |
GS(グループ区切り) | 29 | 0x1d |
RS(レコード区切り) | 30 | 0x1e |
US(ユニット区切り) | 31 | 0x1f |
(スペース) | 32 | 0x20 |
! | 33 | 0x21 |
" | 34 | 0x22 |
# | 35 | 0x23 |
$ | 36 | 0x24 |
% | 37 | 0x25 |
& | 38 | 0x26 |
' | 39 | 0x27 |
( | 40 | 0x28 |
) | 41 | 0x29 |
* | 42 | 0x2a |
+ | 43 | 0x2b |
, | 44 | 0x2c |
- | 45 | 0x2d |
. | 46 | 0x2e |
/ | 47 | 0x2f |
0 | 48 | 0x30 |
1 | 49 | 0x31 |
2 | 50 | 0x32 |
3 | 51 | 0x33 |
4 | 52 | 0x34 |
5 | 53 | 0x35 |
6 | 54 | 0x36 |
7 | 55 | 0x37 |
8 | 56 | 0x38 |
9 | 57 | 0x39 |
: | 58 | 0x3a |
; | 59 | 0x3b |
< | 60 | 0x3c |
= | 61 | 0x3d |
> | 62 | 0x3e |
? | 63 | 0x3f |
@ | 64 | 0x40 |
A | 65 | 0x41 |
B | 66 | 0x42 |
C | 67 | 0x43 |
D | 68 | 0x44 |
E | 69 | 0x45 |
F | 70 | 0x46 |
G | 71 | 0x47 |
H | 72 | 0x48 |
I | 73 | 0x49 |
J | 74 | 0x4a |
K | 75 | 0x4b |
L | 76 | 0x4c |
M | 77 | 0x4d |
N | 78 | 0x4e |
O | 79 | 0x4f |
P | 80 | 0x50 |
Q | 81 | 0x51 |
R | 82 | 0x52 |
S | 83 | 0x53 |
T | 84 | 0x54 |
U | 85 | 0x55 |
V | 86 | 0x56 |
W | 87 | 0x57 |
X | 88 | 0x58 |
Y | 89 | 0x59 |
Z | 90 | 0x5a |
[ | 91 | 0x5b |
\ | 92 | 0x5c |
] | 93 | 0x5d |
^ | 94 | 0x5e |
_ | 95 | 0x5f |
` | 96 | 0x60 |
a | 97 | 0x61 |
b | 98 | 0x62 |
c | 99 | 0x63 |
d | 100 | 0x64 |
e | 101 | 0x65 |
f | 102 | 0x66 |
g | 103 | 0x67 |
h | 104 | 0x68 |
i | 105 | 0x69 |
j | 106 | 0x6a |
k | 107 | 0x6b |
l | 108 | 0x6c |
m | 109 | 0x6d |
n | 110 | 0x6e |
o | 111 | 0x6f |
p | 112 | 0x70 |
q | 113 | 0x71 |
r | 114 | 0x72 |
s | 115 | 0x73 |
t | 116 | 0x74 |
u | 117 | 0x75 |
v | 118 | 0x76 |
w | 119 | 0x77 |
x | 120 | 0x78 |
y | 121 | 0x79 |
z | 122 | 0x7a |
{ | 123 | 0x7b |
| | 124 | 0x7c |
} | 125 | 0x7d |
~ | 126 | 0x7e |
DEL(削除) | 127 | 0x7f |
ASCII(アスキー)コードとは、コンピュータの内部で扱われる数字と、人間側に表現される文字の対応を示したものです。例えば、コンピュータのメモリ上に10進数で65(16進数で41)が記憶されていた場合、人間は大文字の「A」として扱う、というように決められています。
なぜこのような割り当てになっているかというと、、、コンピュータの内部では記憶装置に電気が溜まっている状態を「1」溜まっていない状態を「0」(その逆に決められている電子回路もあります。)をたくさん集めて数字を記録できるようになっていて、数字だけだと人間から見てわかりずらいので、文字を扱えるようにするために、「記憶領域にこの数値が入っていたらこの文字とする」と決めたのが始まりです。
逆に言えば、人間側が「この文字(この制御記号)はコンピュータ内のこの数値だ」と決めた数値が「文字コード」と呼ばれるものです。文字コードの数値は、10進数(0~9を使う)表記と16進数(0~9とa~fを使う)表記で扱われることが多いです。
制御文字がかなり割り当てられていますが、昔はディスプレイが無く、紙にコンピューターの出力を印刷していました。この名残で、印刷に必要な制御記号も設定されています。「DEL」が一番最後に割り当てられているのも、コンピュータの出力を穴をあける紙に出力していた名残です。(DELはすべてのビットが1なので、パンチカードのすべての場所に穴が開く→それ以上情報を書き込めなくなる。)
ご希望の機能やご質問などありましたら、下記までどうぞ。(´∀`)
連絡先:株式会社オハナシヤ 担当:津田 seijitanp@gmail.com