»°ĖŽ½I—¹‚Ģ‚Ø’m‚ē‚¹
Unicode
„l‹C‹LŽ–ׯ·ŻøŽ
ųźŠT—v
UnicodeiÕĘŗ°ÄŽj‚Ķ¤•„†‰»•¶ŽšW‡‚ā•¶Žš•„†‰»•ūŽ®‚Č‚Ē‚š’č‚ß‚½¤•¶Žšŗ°ÄŽ‚Ģ‹ĘŠE‹KŠi‚Å‚ ‚锕¶ŽšW‡i•¶Žš¾Æāj‚Ŗ’Pˆź‚Ģ‘å‹K–Ķ•¶Žš¾ÆĂł ‚邱‚ʁi¢Uni£‚Ę‚¢‚¤–¼‚Ķ‚»‚ź‚É—R—ˆ‚·‚éj‚Č‚Ē‚Ŗ“Į’„‚Å‚ ‚é”

1980”N‘ć‚ɤStarÜ°ø½Ć°¼®Ż‚Ģ“ś–{Œź‰» (J-Star) ‚Č‚Ē‚šs‚Į‚½¾ŽŪÆø½ŽŠ‚Ŗ’ń„‚µ¤Ļ²øŪæĢĤ±ÆĢߣ¤IBM¤»Ż„Ļ²øŪ¼½ĆŃ½Ž¤Ė­°ŚÆÄ„Źßƶ°ÄŽ¤¼Ž¬½Ä¼½ĆтȂĒ‚ŖŽQ‰Į‚·‚éÕĘŗ°ÄŽŗŻæ°¼±Ń‚É‚ę‚čģ‚ē‚ź‚½”‘Ū‹KŠi‚ĢISO/IEC 10646‚ĘUnicode‹KŠi‚Ķ“Æ‚¶•¶Žšŗ°ÄŽ•\‚É‚Č‚é‚ꂤ‚É‹¦’²‚µ‚čō’č‚³‚ź‚Ä‚¢‚é[1]

ŠT—v[•ŅW]

Unicode ‚Ķ¢ŠE‚ÅŽg‚ķ‚ź‚é‘S‚Ä‚Ģ•¶Žš‚š‹¤’Ź‚Ģ•¶ŽšW‡‚É‚Ä—˜—p‚Å‚«‚é‚ꂤ‚É‚µ‚ꂤ‚Ę‚¢‚¤l‚¦‚ōģ‚ē‚ź¤Unix¤Windows¤macOS¤Plan 9[’Žß 1]¤Java‚Č‚Ē‚Å—˜—p‚³‚ź‚Ä‚¢‚锌»‘ć‚Ģ•¶Žš‚¾‚Æ‚Å‚Č‚­ŒĆ‘ć‚Ģ•¶Žš‚ā—šŽj“I‚Č•¶Žš¤”Šw‹L†¤ŠG•¶Žš‚Č‚Ē‚ąŠÜ‚Ž[2]

UnicodeˆČ‘O‚Ģ•¶Žšŗ°ÄŽ‚Ę‚Ģ‘ŠŒŻ‰^—p«‚ą‚ ‚é’ö“xl—¶‚³‚ź‚Ä‚Ø‚č¤—šŽjć„ŽĄ—pć‚ĢŽÆ•Ź‚Ŗ‹‚ß‚ē‚ź‚鏼‡‚É‚ĶŒŻŠ·—Ģˆę‚Ŗ‚Ę‚ē‚ź¤Œ³‚Ģŗ°ÄŽØUnicodeØŒ³‚Ģŗ°ÄŽ‚Ę‚¢‚¤‚ꂤ‚Č•ĻŠ·i׳ŻÄŽÄŲÆĢߕĻŠ·j‚É‚Ø‚¢‚ĤŒ³’Ź‚č‚É–ß‚é‚ꂤ”z—¶‚³‚ź‚Ä‚¢‚镶Žš‚ą‚ ‚锂µ‚©‚µ¤³‹K‚ĢJIS X 0208‚Ģ”ĶˆĶ“ą‚Å‚ ‚ź‚ĪÄ×ĢŽŁ‚Ķ­‚Č‚¢‚Ŗ¤•””‚Ģ•¶ŽšW‡‚Ŗ¬Ż‚µ‚½‚č¤Shift_JIS‚ĢŽĄ‘Ō‚Å‚ ‚éCP932‚āEUC-JP‚ĢˆŸŽķ‚Å‚ ‚éCP51932‚ĘeucJP-MS‚Č‚Ē¤‘Ī‰ž‚Ŗˆį‚¤‚½‚ß‚É•¶Žš‰»‚Æ‚š‹N‚±‚·‚±‚Ę‚Ŗ‚ ‚é”

Unicode•¶Žš•„†‰»ÓĆŽŁ[•ŅW]

•¶Žšŗ°ÄŽ‚Ķ¤Unicode•¶Žš•„†‰»ÓĆŽŁ[3]‚É‚ę‚é‚ĘˆČ‰ŗ‚Ģ4’iŠK‚É•Ŗ‚Æ‚ē‚ź‚é”

’ŠŪ•¶ŽšW‡iACRjF•„†‰»‚Ģ‘ĪŪ‚Ę‚·‚鏇˜‚Ģ‚Č‚¢•¶Žš‚ĢW‡”
•„†‰»•¶ŽšW‡iCCSjF’ŠŪ•¶ŽšW‡‚š”ń•‰®”‚É‘Ī‰ž‚³‚¹‚½‚ą‚Ģ”‚±‚Ģ”ń•‰®”‚Ģ”ĶˆĶ‚š•„†‹óŠŌ¤Še’l‚š•„†ˆŹ’u‚Ę‚¢‚¢¤’ŠŪ•¶Žš‚Ķ‘Ī‰žŒć¤•„†‰»•¶Žš‚Ę‚Č‚é[4]”’ŠŪ•¶Žš‚Ķ•””‚Ģ•„†‰»•¶Žš‚É‘Ī‰ž‚³‚ź‚邱‚Ę‚ą‚ ‚é[5]
•¶Žš•„†‰»Œ`Ž®iCEFjF•„†‰»•¶ŽšW‡‚Ģ”ń•‰®”‚š•„†’PˆŹ—ń‚É•ĻŠ·‚·‚é•ū–@”•¶Žš•„†‰»Œ`Ž®‚ĶŗŻĖß­°Ą’†‚ÉŽĄŪ‚ÉĆŽ°Ą‚Ę‚µ‚Ä•¶Žš‚š•\Œ»‚·‚邱‚Ę‚š‰Ā”\‚É‚·‚é”
•¶Žš•„†‰»•ūŽ®iCESjF•„†’PˆŹ—ń‚šŹŽ²Ä—ń‚É’¼—ń‰»‚·‚é•ū–@”•„†’PˆŹ‚Ŗ8ĖŽÆĂę‚č‘å‚«‚¢ź‡‚Ķ“ŻĆŽØ±Ż‚ŖŠÖŒW‚·‚é”
‚»‚ĢŒćŹŽ²Ä—ń‚š¤gzip‚Č‚Ē‚ň³k‚µ‚½‚č¤7ĖŽÆē`‘—˜H‚É’Ź‚·‚½‚ßBase64¤Quoted-printable‚Č‚Ē‚Å•ĻŠ·‚·‚邱‚Ę‚Ŗ‚ ‚é‚Ŗ¤‚±‚ź‚ē‚Ķ•¶Žšŗ°ÄŽ‚Ģ”ĶˆĶŠO‚Å‚ ‚é”

•¶ŽšW‡[•ŅW]

Unicode‚Ģ•¶ŽšW‡‚Ģ•„†‹óŠŌ‚Ķ0 - 10FFFF16‚Å111–œ4112•„†ˆŹ’u‚Ŗ‚ ‚é[6]”Unicode 12.1(2019”N5ŒŽ7“śŒö•\)‚Å‚Ķ13–œ7929ŒĀ(12%)‚Ģ•¶Žš[’Žß 2]‚ŖŠ„‚č“–‚Ä‚ē‚ź¤65ŒĀ‚š§Œä•¶Žš‚ÉŽg‚¢¤13–œ7468•„†ˆŹ’u(12%)‚šŽ„—p•¶Žš‚Ę‚µ‚ÄŠm•Ū‚µ‚Ä‚¢‚锂܂½¤2048•¶Žš•Ŗ‚šUTF-16‚Ģ‚½‚ß‚Ģ‘ć—p•„†ˆŹ’u‚ÉŽg—p‚µ‚Ä‚Ø‚č¤‰Į‚¦‚Ä66‚Ģ“Į•Ź‚Č•„†ˆŹ’u‚ĶŽg‚ķ‚ź‚Č‚¢”Žc‚č‚Ģ83–œ6536•„†ˆŹ’u(75%)‚Ķ–¢Žg—p‚Å‚ ‚é[7]

•¶Žš‚š“Į’č‚·‚鏼‡‚É‚ĶUnicode•„†ˆŹ’u‚āˆźˆÓ‚É‚Ā‚Æ‚ē‚ź‚½–¼‘O‚ŖŽg‚ķ‚ź‚é”—į‚¦‚Ī¢a£‚ĶU+0061 (LATIN SMALL LETTER A)¤¢ō£‚ĶU+266A (EIGHTH NOTE)‚Å‚ ‚é”Unicode•„†ˆŹ’u‚š•¶Ķ’†‚Č‚Ē‚É‹L‚·ź‡‚Ķ "U+" ‚ĢŒć‚ɏ\˜Zi–@‚Å•„†ˆŹ’u‚š4Œ…‚©‚ē6Œ…‘±‚Ƃ邱‚Ę‚Å•\‚·”‚Ü‚½¤•„†‹óŠŌ‚Ģ‚¤‚æ‘ć—p•„†ˆŹ’u‚šœ‚­•„†ˆŹ’u‚šUnicode½¶×’l‚Ę‚¢‚¤[8]

Žū˜^‚³‚ź‚Ä‚¢‚镶Žš‚Ķ¤Še‘‚Å•W€‚Ę‚µ‚Ä‹K’č‚³‚ź‚Ä‚¢‚镶ŽšW‡‚āŽĄŪ‚ÉŽg—p‚³‚ź‚Ä‚¢‚镶Žš‚šŽ‚æŠń‚č¤ˆĻˆõ‰ļ‚É‚ę‚čŽęŽĢ‘I‘š‚³‚ź‚Ä‚¢‚锓ś–{‚Ģ•¶Žš‚É‚Ā‚¢‚Ä‚Ķ“–‰‚ę‚č JIS X 0201¤JIS X 0208¤JIS X 0212‚š¤Unicode 3.1 ‚©‚ē‚Ķ JIS X 0213 ‚Ģ“ą—e‚ąŽū˜^‚µ‚Ä‚¢‚é”

‚Ü‚½Žū˜^‚É‚Ø‚¢‚ĤŒ³‚ĢŠe•¶ŽšW‡“ą‚Å•Ŗ—£‚³‚ź‚Ä‚¢‚镶Žš‚Ķ‘ød‚·‚é‚Ŗ¤ˆŁ‚Ȃ镶ŽšW‡‚ɓƈź‚Ģ•¶Žš‚ŖŽū˜^‚³‚ź‚Ä‚¢‚é‚Ę‚Ż‚Č‚³‚ź‚é‚ą‚Ģ‚Ķ¤“Æ‚¶•„†ˆŹ’u‚ÉŠ„‚č“–‚Ä‚é•ūj‚šŽę‚Į‚Ä‚¢‚锂±‚ĢŪ‚ɏW‡‚Ŗ–c‘å‚Å‚ ‚é‚Ę‚¢‚¤——R‚ŤŠæŽš‚É‚Ā‚¢‚Ĥ’†‘¤“ś–{¤ŠŲ‘‚ĢŠe‹KŠi‚ĢŠæŽš‚š“‡i‰pŒź”Łj‚µCJK“‡ŠæŽš‚Ę‚µ‚½‚±‚Ę‚Ķ‘å‚«‚Č‹c˜_‚Ę‚Č‚Į‚½”

Unicode‚ÉŽū˜^‚³‚ź‚Ä‚¢‚镶Žš‚É‚Ā‚¢‚Ä‚Ķ¤¢ĢŽŪÆø‚Ģˆź——£‚šŽQĘ”

•¶Žš•„†‰»Œ`Ž®[•ŅW]

Unicode‚Å‚Ķ•¶Žš•„†‰»Œ`Ž®‚Ę‚µ‚ÄUTF-8¤UTF-16¤UTF-32‚Ģ3Žķ—Ž‚Ŗ’č‚ß‚ē‚ź‚Ä‚¢‚é”

UTF-8‚Ķ1•„†‰»•¶Žš‚š1`4•„†’PˆŹ‚Å•\‚·‰Ā•Ļ••¶Žš•„†‰»Œ`Ž®‚Ť1•„†’PˆŹ‚Ķ8ĖŽÆĂł ‚é”

UTF-16‚Ķ1•„†‰»•¶Žš‚š1`2•„†’PˆŹ‚Å•\‚·‰Ā•Ļ••¶Žš•„†‰»Œ`Ž®‚Ť1•„†’PˆŹ‚Ķ16ĖŽÆĂł ‚锊ī–{‘½Œ¾Œź–Ź‚Ģ•¶Žš‚š•„†’PˆŹˆź‚Ā‚Ť‚»‚Ģ‘¼‚Ģ•¶Žš‚š»Ū¹Ž°ÄĶß±i‘ć—p‘Īj‚Ę‚¢‚¤Žd‘g‚Ż‚šŽg‚¢•„†’PˆŹ“ń‚Ā‚Å•\Œ»‚·‚é”

UTF-32‚Ķ1•„†‰»•¶Žš‚š1•„†’PˆŹ‚Å•\‚·ŒÅ’č••¶Žš•„†‰»Œ`Ž®‚Ť1•„†’PˆŹ‚Ķ32ĖŽÆĂł ‚锂½‚¾‚µ¤Unicode‚Ģ•„†‹óŠŌ‚ŖU+10FFFF‚Ü‚Å‚Å‚ ‚邽‚ߤŽĄŪ‚ÉŽg‚ķ‚ź‚é‚Ģ‚Ķ21ĖŽÆĂ܂łł ‚é”

•¶Žš•„†‰»•ūŽ®[•ŅW]

Unicode‚Å‚Ķ•¶Žš•„†‰»•ūŽ®‚Ę‚µ‚ÄUTF-8¤UTF-16¤UTF-16BE¤UTF-16LE¤UTF-32¤UTF-32BE¤UTF-32LE‚Ģ7Žķ—Ž‚Ŗ’č‚ß‚ē‚ź‚Ä‚¢‚锂»‚ź‚¼‚ź‚Ģ•„†‰»Œ`Ž®‚É‘Ī‰ž‚·‚é•„†‰»•ūŽ®‚Ķ•\‚Ģ’Ź‚č”

•¶Žš•„†‰»Œ`Ž®‚Ę‚Ģˆį‚¢‚Ķ¤•¶Žš•„†‰»Œ`Ž®‚ŖĢßŪøŽ×ѓą•”‚Å•¶Žš‚šˆµ‚¤ź‡‚É•„†‚Č‚µ®”‚Ę‚µ‚Ä•¶Žš‚š•\Œ»‚·‚é•ū–@‚Č‚Ģ‚É‘Ī‚µ¤•¶Žš•„†‰»•ūŽ®‚Ķ“üo—ĶŽž‚ÉŹŽ²Ä—ń‚Ę‚µ‚Ä•\Œ»‚·‚é•ū–@‚Å‚ ‚é”UTF-8‚Ķ•„†’PˆŹ‚Ŗ8ĖŽÆĂł ‚邽‚ß‹ę•Ź‚·‚éˆÓ–”‚Ķ‚Č‚¢”

‚Č‚Ø¤UTF-8‚Ķ‚ą‚Ę‚ą‚Ę8ĖŽÆĂš•„†’PˆŹ‚Ę‚·‚邽‚ßBOMiŹŽ²Ä‡Ļ°øGŒćqj‚Ķ•K—v‚Č‚¢‚Ŗ¤UTF-8‚Å‚ ‚邱‚Ę‚ŖŽÆ•Ź‚Å‚«‚é‚ꂤ¤ĆŽ°Ą½ÄŲ°Ń‚Ģę“Ŗ‚É EF BB BFiU+FEFF‚ĢUTF-8‚Å‚Ģ•\Œ»j‚Ģ3ŹŽ²Ä‚Ŗ•t—^‚³‚ź‚邱‚Ę‚Ŗ‚ ‚é”UTF-8‚ĢBOM‚ĶŹŽ²Ä‡‚š•\‚·‚ą‚Ģ‚Å‚Ķ‚Č‚­¤UTF-16•„†‰»•ūŽ®“™‚ɂ؂Ƃ颐^‚ĢˆÓ–”‚Å‚ĢBOM£‚Ę“Æ‚¶ŗ°ÄŽĪß²ŻÄ‚š—˜—p‚µ‚Ä‚¢‚é‚Ŗ‚䂦‚ÉŠµ—p“I‚É‚±‚¤ŒÄ‚Ī‚ź‚Ä‚¢‚é‚ɉ߂¬‚Č‚¢”UTF-8‚Å‚ĢBOM‚ĢŽg—p‚Ķ”ń„§[9]
ł UTF-16
RFC 2781 ‚Å‚ĶBOM‚Ŗ•t‚¢‚Ä‚¢‚Č‚¢UTF-16•¶‘‚ĶĖŽÆøŽ“ŻĆŽØ±Ż‚Ę‚µ‚ĉšŽß‚·‚邱‚Ę‚É‚Č‚Į‚Ä‚¢‚é”Windows‚ĢŅӒ ‚ōģ¬‚µ‚½¢UnicodeĆ·½Ä£‚ĶBOM‚Ŗ•t—^‚³‚ź‚é‚ꂤ‚É‚Č‚Į‚Ä‚¢‚é”ĖŽÆøŽ“ŻĆŽØ±Ż‚Ģ•„†‰»•ūŽ®‚šUTF-16BE¤ŲÄŁ“ŻĆŽØ±Ż‚Ģ•„†‰»•ūŽ®‚šUTF-16LE‚Ę‚µ‚Ä‹ę•Ź‚·‚邱‚Ę‚ą‚ ‚é”ĢßŪÄŗŁ‚ą‚µ‚­‚Ķ±ĢßŲ¹°¼®Ż‚ĢŻ’č‚Č‚Ē‚ĢŽč’i‚Å•„†‰»•ūŽ®‚ÉUTF-16BE‚āUTF-16LE‚šŽw’肵‚Ä‚¢‚鏼‡‚É‚ĶBOM‚š•t—^‚·‚邱‚Ę‚Ķ‹–—e‚³‚ź‚Č‚¢”Windowsć‚Ģ•¶‘‚É‚Ø‚Æ‚é¢UnicodeĆ·½Ä£‚Ķ“Į‚É–¾‹L‚Ģ‚Č‚¢ź‡¤ŲÄŁ“ŻĆŽØ±Ż‚ĢUTF-16•„†‰»•ūŽ®‚Ģ‚±‚Ę‚šŽw‚·”TCP/IPČÆÄÜ°ø‚Å‚Ķ¤ĢßŪÄŗŁĶÆĄŽ‚āMIME“™‚ĢŽč’i‚Å•„†‰»•ūŽ®‚ŖŽw’č‚³‚ź‚øBOM‚ą•t—^‚³‚ź‚Č‚¢ź‡¤ĖŽÆøŽ“ŻĆŽØ±Ż‚Ę‚µ‚Ĉµ‚¤‚ĘŒˆ‚ß‚ē‚ź‚Ä‚¢‚é”
ł UTF-32
’Pƒ‚Č•„†‰»•ūŽ®‚Å‚ ‚é‚Ŗ¤Ć·½ÄĢ§²Ł‚Č‚Ē‚Å‚ĶĢ§²Ł‚Ģ»²½Ž‚Ŗ‘å‚«‚­‚Č‚éi‚·‚ׂÄBMP‚Ģ•¶Žš‚©‚ē‚Ȃ镶Ķ‚Ģź‡‚ĶUTF-16•„†‰»•ūŽ®‚Ģ2”{¤‚·‚ׂÄASCII•¶Žš‚Ģź‡‚ĶASCII/UTF-8‚Ģ4”{‚Ģ»²½Ž‚Ę‚Č‚éj‚½‚ߤ½ÄŚ°¼Ž—p‚Ę‚µ‚ÄŽg‚ķ‚ź‚邱‚Ę‚Ķ‹H‚Å‚ ‚锂»‚Ģ‚½‚ß‚©¤Microsoft Office‚Å‚Ģ¢“Żŗ°ÄŽ‚³‚ź‚½Ć·½ÄĢ§²Ł£‚Ģ“Ē‚Ż‘‚«‚Å‚Ķ¤Office 2016 ‚Å‚ą‚¢‚Ü‚¾‚É•„†‰»•ūŽ®‚É‚Ķ‘Ī‰ž‚µ‚Ä‚¢‚Č‚¢”ĢŲ°³Ŗ±¼Ŗ±³Ŗ±‚ĢĆ·½Ä“ĆŽØĄ‚Ģ‚¤‚摽”‚Ģ•„†‰»•ūŽ®‚É‘Ī‰ž‚µ‚Ä‚¢‚é‚ą‚Ģ‚Å‚ą¤‚±‚Ģ•„†‰»•ūŽ®‚É‚Ķ‘Ī‰ž‚µ‚Ä‚¢‚Č‚¢‚ą‚Ģ‚Ŗ‘¶Ż‚·‚é”
‚½‚¾‚µ¤‚·‚ׂĂĢUnicode•¶Žš‚šˆ—‚·‚鏼‡‚É‚Ķ¤‚·‚ׂĂĢ•¶Žš‚š’Pˆź‚Ģ•„†’PˆŹ‚Å•\Œ»‚µ‚½‚Ł‚¤‚Ŗˆ—‚É“K‚·‚邽‚ߤ“ą•”‚Ģˆ—‚Å‚ĶUTF-32•„†‰»Œ`Ž®i‚ ‚é‚¢‚ĶUCS-4j‚ňµ‚¤‚±‚Ę‚ą‚ ‚锎Ą—į‚Ę‚µ‚ĤLinux ć‚ĢCŒ¾ŒźŠĀ‹«‚Å‚Ķ wchar_t ‚Ķ32ĖŽÆĐ®”Œ^‚Å‚ ‚é”
UTF-16•„†‰»•ūŽ®‚Č‚Ē‚Ę“Æ—l‚ÉUTF-32•„†‰»•ūŽ®‚É‚ąBOM‚Ŗ‚ ‚č¤ĆŽ°Ą½ÄŲ°Ń‚Ģę“Ŗ‚É•t‚³‚ź‚锐ę“Ŗ‚Ģ4ŹŽ²Ä‚ŖFF FE 00 00‚Č‚ēŲÄŁ“ŻĆŽØ±Ż¤00 00 FE FF‚Č‚ēĖŽÆøŽ“ŻĆŽØ±Ż‚É‚Č‚é”UTF-16‚ĢŲÄŁ“ŻĆŽØ±Ż‚ĘUTF-32‚ĢŲÄŁ“ŻĆŽØ±Ż‚ĶÅ‰‚Ģ2ŹŽ²Ä‚Ŗ“™‚µ‚¢‚½‚ߤ4ŹŽ²Ä‚Ü‚Å“Ē‚ń‚Å”»’f‚·‚é•K—v‚Ŗ‚ ‚é”

‚»‚Ģ‘¼[•ŅW]


ˆČ‰ŗ‚Ķ“²ĢßŲŁĢ°Ł‚ÉŒöŠJ‚³‚ź‚½¼Ž®°øRFC‚Å‚ ‚é (RFC 4042)”UTF-9‚ÉŠÖ‚µ‚Ä‚Ķ“Æ–¼‚Ģ‹KŠi‚ŖŽĄŪ‚ÉŒŸ“¢‚³‚ź‚Ä‚¢‚½i‚½‚¾‚µ¤“ą—e‚Ķ‘å‚«‚­ˆŁ‚Č‚éj‚Ŗ¤ÄŽ×ĢĒiŠK‚Å”jŠü‚³‚ź‚Ä‚¢‚邽‚ߏd•”‚É‚Ķ‚Č‚ē‚Č‚¢”

‰Ā•Ļ’·‚Ģ9ĖŽÆĕ„†’PˆŹ‚Å•\Œ»‚·‚é•„†‰»•ūŽ®”1ŹŽ²Ä‚Ŗ8ĖŽÆāiµøĆÆāj‚Å‚Ķ‚Č‚­9ĖŽÆāiÉČÆāj‚Å‚ ‚é‚ꂤ‚ČŠĀ‹«‚Å‚Ģ—˜—p‚š‘z’肵‚Ä‚¢‚é”UTF-8‚Ę”äŠr‚µ‚½ź‡¤Latin-1—Ģˆę‚Ŗ1ŹŽ²Ä¤CJK“‡ŠæŽš—Ģˆę‚Ŗ2ŹŽ²Ä‚Å•\Œ»‚Å‚«‚é“Į’·‚Ŗ‚ ‚č¤ĆŽ°Ą—Ź‚Ŗ­‚Č‚­‚Č‚é”Ü°ÄŽ’·‚Ŗ9‚Ģ”{”‚ĢŗŻĖß­°ĄiPDP-10‚āACOS-6‚Č‚Ēj‚Å‚ ‚ź‚ĪŒvŽZŗ½Ä‚ą’į‚¢”
ł UTF-18
Unicode•„†ˆŹ’u‚š’Pˆź‚Ģ18ĖŽÆĕ„†’PˆŹ‚Å•\Œ»‚·‚é•„†‰»•ūŽ®”UTF-8‚É‘Ī‚·‚éUTF-16‚Ģ‚ꂤ‚Č‚ą‚Ģ‚¾‚Ŗ¤RFCŒöŠJŽž“_‚ĢUnicode‚Å•¶Žš‚Ŗ’č‹`‚³‚ź‚Ä‚¢‚½4‚Ā‚Ģ–ŹiBMP¤U+1xxxx¤U+2xxxx¤U+Exxxxj‚š—]‚Į‚½2ĖŽÆĂŎƕŹ‚·‚邽‚ߤ‘ć—p•„†ˆŹ’u‚ĶŽg‚ķ‚Č‚¢” ˆČ‰ŗ‚ĶÄŽ×ĢĒiŠK‚Å”jŠü‚³‚ź‚½‹KŠiˆÄ”

‘Ū‰»ÄŽŅ²Ż–¼‚Å‚Ģ—˜—p‚š‘z’肵¤0-9¤A-V‚Ģ32•¶Žš‚Å•\Œ»‚·‚镶Žš•„†‰»•ūŽ®”‘Ū‰»ÄŽŅ²Ż–¼‚É‚ĶPunycode‚ŖĢ—p‚³‚ź‚½‚½‚ߤ—˜—p‚³‚ź‚Ä‚¢‚Č‚¢” ‰Ā•Ļ’·i1-5ŹŽ²Äj‚Ģ8ĖŽÆĕ„†’PˆŹ‚Å•\Œ»‚·‚镶Žš•„†‰»Œ`Ž®‚Ü‚½‚Ķ•¶Žš•„†‰»•ūŽ®”ISO-8859-1‚É‘Ī‚µ‚Ĉź•”ŒŻŠ·‚Å‚ ‚锂µ‚©‚µ¤UTF-8‚Ŗ•‹y‚µ‚Ā‚Ā‚ ‚褂»‚ź‚Ę”ä‚ׂȇ“_‚Ŗ‚¢‚­‚Ā‚©‚ ‚Į‚½‚½‚ߤ”jŠü‚³‚ź‚½”

Šg’£—Ģˆę[•ŅW]

1980”N‘ć‚Ģ“–‰‚Ģ\‘z‚Å‚Ķ¤Unicode‚Ķ16ĖŽÆÄŒÅ’č’·‚Ť216 = 6–œ5536 ŒĀ‚Ģ•„†ˆŹ’u‚É•K—v‚Č‘S‚Ä‚Ģ•¶Žš‚šŽū˜^‚·‚餂ʂ¢‚¤‚ą‚­‚ė‚Ż‚Å‚ ‚Į‚½”‚µ‚©‚µ¤Unicode 1.0Œö•\Œć¤Šg’£‰Ā”\‚Č‹ó‚«—Ģˆę2–œŽš•Ŗ‚š„‚褊e‘‚©‚ē•¶Žš’Ē‰Į—v‹‚Ŗ‹N‚±‚Į‚½”‚»‚Ģ“ą—e‚Ķ’†‘¤“ś–{¤‘ä˜p¤ĶŽÄÅѤ¼Ż¶ŽĪß°Ł‚Ģ’Ē‰ĮŠæŽš–ń1–œ5ēŽš¤ŒĆŹŻøŽŁ–ń5ēŽš¤–¢“o˜^Œ¾Œź‚Ģ•¶Žš‚Č‚Ē‚Å‚ ‚锂±‚Ģ‚ꂤ‚É‚µ‚ÄUnicode‚Ģ¤16ĖŽÆĂĢ˜g“ą‚É‘S¢ŠE‚Ģ•¶Žš‚šŽū˜^‚·‚é‚Ę‚¢‚¤Œv‰ę‚Ķ‘X‚É”j’]‚µ¤1996”N‚ĢUnicode 2.0‚ĢŽž“_‚ÅŠł‚ɤ•¶ŽšW‡‚Ģ‹óŠŌ‚š16ĖŽÆĂ©‚ēL‚°‚邱‚Ę‚ŖŒˆ‚Ü‚Į‚½”‚±‚ĢŽž¤‚»‚ź‚Ü‚Å‚Ģ16ĖŽÆĂš‘O’ń‚Ę‚µ‚Ä‚·‚łɐŻŒv‚³‚ź‚Ä‚¢‚½¼½Ćсi‚½‚Ę‚¦‚ĪJava‚ĢcharŒ^‚ā¤Windows NTWindows 95‚ĢAPIj‚š‚Č‚é‚ׂ­‚»‚Ģ‚Ü‚Ü‚É‚µ‚½‚܂ܤL‚°‚ē‚ź‚½‹óŠŌ‚É‚ ‚é•„†ˆŹ’u‚š•\Œ»‚·‚é•ū–@‚Ę‚µ‚Ĥ»Ū¹Ž°ÄĶß±‚Ŗ’č‹`‚³‚ź‚½”

»Ū¹Ž°ÄĶß±[•ŅW]

»Ū¹Ž°ÄĶß±(‘ć—p‘Ī)‚Ķ16ĖŽÆÄUnicode‚Ģ—Ģˆę1024•¶Žš•Ŗ‚š2‚ĀŽg‚¢i‘O”¼ U+D800 ` U+DBFF¤Œć”¼ U+DC00 ` U+DFFFj¤ŠeX1ŒĀ‚ø‚Ā‚©‚ē‚Č‚éĶß±‚Å1024 ~ 1024 = 1,048,576•¶Žš‚š•\‚·”‚±‚ź‚Ķ‚æ‚傤‚Ē16–Ź•Ŗ‚Å‚ ‚褑ę1–Ź`‘ę16–ŹiU+10000 ` U+10FFFFj‚Ģ•¶Žš‚š‚±‚ź‚Å•\‚·‚±‚Ę‚Ę‚µ‚½”‰Į‚¦‚Ä‘ę0–ŹiŠī–{‘½Œ¾Œź–Źj‚ąŽg—p‰Ā”\‚Č‚Ģ‚ŤUnicode‚É‚Ķ‡Œv‚Å 1,048,576 + 65,536 - 2,048 = 111–œ2,064•¶Žš•Ŗ‚Ģ‹óŠŌ‚ŖŠm•Ū‚³‚ź‚½‚±‚Ę‚É‚Č‚é”Unicode‚Ģ•„†‹óŠŌ‚Ŗ10FFFF16‚Ü‚Å(»Ū¹Ž°Ä—Ģˆę‚šœ‚¢‚Ä111–œ2064•¶Žš)‚Ę‚³‚ź‚Ä‚¢‚é‚Ģ‚ĶUTF-16‚Ŗ•\Œ»‰Ā”\‚ČŒĄŠE‚¾‚©‚ē‚Å‚ ‚é”

»Ū¹Ž°Ä‚ĶUnicode‚Ģ•„†ˆŹ’u‚Ģ U+10000 ` U+10FFFF ‚Ģ”ĶˆĶ‚š16ĖŽÆÄÕĘÆĂĢĶß±i2‚Āj‚Å•\Œ»‚·‚éW‡‚ŤÅ‰‚Ģ16ĖŽÆÄÕĘÆĂš‘O”¼»Ū¹Ž°Ä‚ą‚µ‚­‚ĶŹ²»Ū¹Ž°Ä¤“ń”Ō–Ś‚šŒć”¼»Ū¹Ž°Ä‚ą‚µ‚­‚ĶŪ°»Ū¹Ž°Ä‚ʏĢ‚·‚锏²»Ū¹Ž°Ä‚Ķ U+D800 ` U+DBFF ‚Ģ”ĶˆĶ¤Ū°»Ū¹Ž°Ä‚Ķ U+DC00 ` U+DFFF ‚Ģ”ĶˆĶ‚Å‚ ‚é”

»Ū¹Ž°ÄĶß±‚ĶUTF-16‚Å‚Ģ‚ŻŽg‚ķ‚ź[10]¤UTF-8¤UTF-32‚Å‚Ķ‚·‚ׂĂĢ•„†ˆŹ’u‚š•„†‰»‚Å‚«‚邽‚ß‚±‚Ģ‚ꂤ‚Č“Į•Ź‚ȏˆ—‚Ķ•K—v‚Č‚¢”

ŗ°ĆŽØŻøŽ[•ŅW]


»Ū¹Ž°Ä‚Ģ“Żŗ°ĆŽØŻøŽ‚Ķ¤

       $hi = ($uni - 0x10000) / 0x400 + 0xD800;       $lo = ($uni - 0x10000) % 0x400 + 0xDC00;
ĆŽŗ°ĆŽØŻøŽ‚Ķ¤

       $uni = 0x10000 + ($hi - 0xD800) * 0x400 + ($lo - 0xDC00);
‚Ę‚Č‚é”

ŗ°ÄŽ•ĻŠ·—įF

¢?£U+20BB7 (‰ŗ‚Ģ–_‚Ŗ’·‚¢¢‹g£”‚Ā‚æ‚ꂵ”) ‚Ģ“Żŗ°ÄŽ‚šl‚¦‚Ä‚Ż‚é”

 0x20BB7 (0010 0000 1011 1011 0111) ‚©‚ē 0x10000 (0001 0000 0000 0000 0000) ‚šˆų‚­‚ʤŒ‹‰Ź‚Ķ 0x10BB7 (0001 0000 1011 1011 0111) ‚Ę‚Č‚é” 
‚±‚ź‚šćˆŹ10ĖŽÆĒl‚ʉŗˆŹ10ĖŽÆĒl‚É•ŖŠ„‚·‚é” 0001 0000 10 (0x0042) + 11 1011 0111 (0x03B7)
Ź²i‚ˆŹj»Ū¹Ž°Ä‚šŒ`¬‚·‚邽‚ß‚ÉćˆŹĖŽÆĂÉ0xD800‚š‰Į‚¦‚é” 00 0100 0010 (0x0042) + 1101 1000 0000 0000 (0xD800) = 1101 1000 0100 0010 (0xD842)
Ū°i‰ŗˆŹj»Ū¹Ž°Ä‚šŒ`¬‚·‚邽‚߂ɉŗˆŹĖŽÆĂÉ0xDC00‚š‰Į‚¦‚é” 11 1011 0111 (0x03B7) + 1101 1100 0000 0000 (0xDC00) = 1101 1111 1011 0111 (0xDFB7)
Œ‹‰Ź: D842 DFB7 iUTF-16 •„†’PˆŹ—ńj D8 42 DF B7iUTF-16BE‚Å‚Ģ•„†‰»ŹŽ²Ä—ńj 42 D8 B7 DFiUTF-16LE‚Å‚Ģ•„†‰»ŹŽ²Ä—ńj
ŽŸ‚Ģ•\‚Ķ¤‚±‚Ģ•¶Žš•ĻŠ·‚Ę‘¼‚š‚Ü‚Ę‚ß‚½‚ą‚Ģ‚Å‚ ‚é” F‚Ķ¤ŗ°ÄŽĪß²ŻÄ‚©‚ē‚ĢĖŽÆĂŖUTF-16ŹŽ²Ä‚É‚Ē‚Ģ‚ꂤ‚É•Ŗ”z‚³‚ź‚é‚©‚šŽ¦‚µ‚½” ‚Č‚Ø¤UTF-16“Żŗ°ĆŽØŻøŽĢßŪ¾½‚É‚ę‚Į‚Ä’Ē‰Į‚³‚ź‚½’Ē‰ĮĖŽÆĂĶ•‚ÅŽ¦‚³‚ź‚Ä‚¢‚é”

–Ź[•ŅW]

ˆź‚Ā‚Ģ–Ź‚Ķ6–œ5536ŒĀ‚Ģ•„†ˆŹ’u‚Ŗ‚ ‚é”

“ś–{‚Å‚Ķ2000”N‚ÉJIS X 0208‚šŠg’£‚·‚é–Ś“I‚ÅJIS X 0213i‚¢‚ķ‚ä‚éJIS‘ę3„‘ę4…€j‚Ŗ§’č‚³‚ź‚½‚Ŗ¤‚±‚ĢŪ¤V‚½‚ɍĢ—p‚³‚ź‚½•¶Žš‚ÅUnicode‚É‚Č‚©‚Į‚½‚ą‚Ģ‚Ģˆź•”‚Ķ¤BMP‚ÉŽū˜^‚Å‚«‚ø¤‘ę2–Ź‚Ö‚ĢŽū˜^‚Ę‚Č‚Į‚½iUnicode‚ŖÅI“I‚ÉJIS X 0213‚Ö‚Ģ‘Ī‰ž‚šŠ®—¹‚µ‚½‚Ģ‚Ķ2002”N‚Å‚ ‚éj”‚±‚Ģ‚½‚ߤJIS X 0213Žū˜^•¶Žš‚šUnicode‚ÅŠ®‘S‚É»Ī߰Ă·‚é‚É‚Ķ¤’Ē‰ĮŠæŽš–Ź‚š»Ī߰õ‚½OS¤Ģ«ŻÄ¤±ĢßŲ¹°¼®Ż‚Ŗ•K—v‚Ę‚Č‚é”Shift_JIS‚Č‚Ē¤Unicode‚É‚Ä‹K’č‚³‚ź‚é‚ą‚ĢˆČŠO‚Ģ“Żŗ°ĆŽØŻøŽ‚š—˜—p‚·‚鏼‡‚Å‚ ‚Į‚Ä‚ą¤JIS X 0213‚É‘Ī‰ž‚·‚éĢ«ŻÄ‚ā±ĢßŲ¹°¼®Ż‚Ŗ•K—v‚Å‚ ‚é”

ķ—pŠæŽš‚Ģ2010”N‰ü’č‚Å’Ē‰Į‚³‚ź‚½Žš‚Ģ‚¤‚æ¢𠮟£‚ĶU+20B9F‚Ť’Ē‰ĮŠæŽš–Ź‚ÉŠÜ‚Ü‚ź‚锂»‚Ģ‚½‚ߤ‰ü’čŒć‚Ģķ—pŠæŽšŠ®‘S»Ī߰ùꐂ¤ź‡¤Unicode‚É‘Ī‰ž‚µ‚Ä‚¢‚čX‚É‚±‚ĢŠg’£—Ģˆę‚É‚ą‘Ī‰ž‚µ‚Ä‚¢‚é•K—v‚Ŗ‚ ‚é‚ĘŒ¾‚¦‚锂½‚¾¤Œ»ó‚Å‚Ķ‚±‚ĢŽš‚Ķ¤JIS X 0208‚ÉŠÜ‚Ü‚ź‚éi“–‘R¤Unicodeō’č“–‰‚©‚ēBMP‚ÉŽū˜^‚³‚ź‚Ä‚¢‚éjˆŁ‘ĢŽš‚Ģ¢Ž¶£(U+53F1) ‚Å‘ć—p‚³‚ź‚邱‚Ę‚Ŗ‘½‚¢”

—šŽj[•ŅW]

1984”N¤ISO‚Ģ•¶Žšŗ°ÄŽ‹KŠiˆĻˆõ‰ļ (ISO/TC 97/SC2) ‚Ķ•¶Žš¾ÆĂĢŲ‚č‘Ö‚¦‚šs‚ķ‚ø‚ɐ¢ŠE’†‚Ģ•¶Žš‚š’Pˆź‚Ģ•¶ŽšW‡‚Ę‚µ‚Ĉµ‚¦‚镶Žšŗ°ÄŽ‹KŠi (ISO 10646) ‚šģ¬‚·‚邱‚Ę‚šŒˆ’肵¤ź–å‚Ģģ‹ĘøŽŁ°Ģß (ISO/TC 97/SC 2/WG 2) ‚šŻ’u‚µ¤ģ‹Ę‚šŽn‚ß‚Ä‚¢‚½”1980”N‘ćŒć”¼‚É‚Ķ‚±‚Ģģ‹ĘøŽŁ°Ģ߂ɂ؂¢‚Ä‚³‚Ü‚“‚Ü‚Č’ńˆÄ‚ŖŒŸ“¢‚³‚ź‚Ä‚¢‚é”1990”N‚É‚Č‚Į‚ďo—ˆ‚ ‚Ŗ‚Į‚½ISO/TC 97/SC 2/WG 2ģ¬‚ĢISO 10646‚Ģ‰”ÅÄŽ×ĢāiDIS 10646#DIS 10646‘ę1”Łj‚Å‚Ķ¤ŠæŽšŗ°ÄŽ‚Ķ32ĖŽÆĂŕ\Œ»‚³‚ź¤Še‘‚ĢŠæŽšŗ°ÄŽ‚Ķ‚»‚Ģ‚Ü‚Ü“ü‚ź‚邱‚Ę‚É‚Č‚Į‚½”‚µ‚©‚µ’†‘‚ĶŠæŽš‚šŠe‘‚Å‚Ī‚ē‚Ī‚ē‚É•„†‰»‚·‚é‚Ģ‚Å‚Ķ‚Č‚­¤‚ ‚­‚Ü‚Å“ˆź‚µ‚Ĉµ‚¤‚±‚Ę‚š‹‚ß‚Ä‚±‚ĢÄŽ×ĢĂɂĶ“–‰‚©‚ē”½‘Ī‚µ‚Ä‚Ø‚č¤”Œć‚ĢŠæŽšŗ°ÄŽ‚Ģ•ūj‚šŒˆ‚߂邽‚ߤWG 2‚Ķ CJK-JRG (Joint Research Group) ‚ĘŒÄ‚Ī‚ź‚éøŽŁ°Ģ߂š•Ź“rŻ’u‚µ¤‚»‚±‚ňų‚«‘±‚«ŒŸ“¢‚·‚邱‚Ę‚É‚µ‚½”

‚±‚Ģ‚ꂤ‚ČŒö“I‹@ŠÖ‚Ģ“®‚«‚Ę‚Ķ•Ź‚ɤ1987”N ‚©‚ēXerox‚ĢJoe Becker‚ĘLee Collins‚Ķ¤Œć‚ÉÕĘŗ°ÄŽ‚ĘŒÄ‚Ī‚ź‚é‚ꂤ‚ɂȂ餐¢ŠE’†‚Ģ•¶Žš‚š“ˆź‚µ‚Ĉµ‚¦‚镶Žšŗ°ÄŽ‚šŠJ”­‚µ‚Ä‚¢‚½”1989”N9ŒŽ‚É‚Ķ¢Unicode Draft 1£‚Ŗ”­•\‚³‚ź‚½”‚±‚±‚Å‚Ķ‚»‚ĢŠī–{•ūj‚Ę‚µ‚Ĥ2µøĆÆāi16ĖŽÆājŒÅ’č’·‚Å‘S‚Ä‚Ģ•¶Žš‚šˆµ‚¦‚邱‚Ę‚š–ŚŽw‚µ‚Ä‚Ø‚č¤‚»‚Ģ‚½‚ß‚É“ś–{„’†‘„ŠŲ‘‚ĢŠæŽš‚š“ˆź‚·‚邱‚Ę‚Å2–œŽć‚ĢŠæŽšŗ°ÄŽ‚š“ü‚ź¤‚³‚ē‚ɏ«—ˆ‚ĢŠg’£—p‚ɤ3–œ’ö“x‚ĢŠæŽš‚Ģ‹ó‚«—Ģˆę‚Ŗ•Ź‚É—pˆÓ‚³‚ź‚Ä‚¢‚½”‚±‚ĢÄŽ×ĢĂĶ­‚µ‚ø‚Ā‰ü—Ē‚š‰Į‚¦‚ē‚ź‚Č‚Ŗ‚ē1990”N4ŒŽ‚ÉUnicode Draft 2¤“Æ”N12ŒŽUnicode Final Draft‚Ę‚Č‚Į‚½”‚³‚ē‚É1991”N1ŒŽ‚É‚Ķ‚±‚ĢUnicode Final Draft‚ÉŽ^“Æ‚·‚éŠé‹Ę‚É‚ę‚Į‚ĤÕĘŗ°ÄŽŗŻæ°¼±Ń‚ŖŻ—§‚³‚ź‚½”

1991”N6ŒŽ¤ISO/IEC 10646‚É‚ę‚é4µøĆÆÄŒÅ’č’·ŗ°ÄŽ‚šŽå‘Ģ‚Ę‚µ‚½ÄŽ×ĢÄ¢DIS 10646‘ę1”Å£‚Ķ¤2µøĆÆÄŒÅ’č’·ŗ°ÄŽ‚Å‚ ‚éUnicode‚Ę‚Ģˆź–{‰»‚š‹‚ß‚éŠe‘‚É‚ę‚č”ŪŒˆ‚³‚ź¤ISO 10646‚ĘUnicode‚Ģˆź–{‰»‚Ŗ}‚ē‚ź‚邱‚Ę‚É‚Č‚Į‚½”‚Ü‚½’†‘‚Ø‚ę‚ŃUnicodeŗŻæ°¼±Ń‚Ģ—væ‚É‚ę‚č¤CJK-JRG‚É‚Ø‚¢‚ĤISO 10646‚ĘUnicode‚Ģˆź–{‰»‚Ŗ}‚ē‚ź‚邱‚Ę‚É‚Č‚Į‚½”CJK-JRG‚ĶŠe‘‚ĢŠæŽšŗ°ÄŽ‚ÉŠī‚Ć‚«“ĘŽ©‚Ģ“‡‹K€‚š’č‚ߤISO 10646 / Unicode—p‚Ģ“‡ŠæŽšŗ°ÄŽ•\‚šģ¬‚·‚邱‚Ę‚É‚Č‚Į‚½”CJK-JRG‚Ģ‰ļ‡‚Ķ‘ę1‰ń‚Ŗ7ŒŽ22“ś‚©‚ē24“ś‚É‚©‚Æ‚Ä“Œ‹ž‚Ť‘ę2‰ń‚Ģ‰ļ‡‚Ŗ9ŒŽ17“ś‚©‚ē19“ś‚É‚©‚Æ‚Ä–k‹ž‚Ť‘ę3‰ń‚Ŗ11ŒŽ25“ś‚©‚ē29“ś‚É‚©‚Ƃ聍`‚ÅŠJĆ‚³‚ź‚½”‚±‚ź‚ē‚Ģ“¢‹c‚ĢŒ‹‰Ź¤1991”N––‚É‚Č‚Į‚Ä¢ISO 10646Unicode£—p‚Ģ“‡ŠæŽšŗ°ÄŽ•\‚Ŗ Unified Repertoire and Ordering (URO) ‚Ģ‘ę1”Å‚Ę‚µ‚ÄŠ®¬‚µ‚½”

Unicode‚ĢÅ‰‚Ɉóü‚³‚ź‚½ÄŽ·­ŅŻÄ‚Å‚ ‚éUnicode 1.0‚Ķ¤“‡ŠæŽš•\‚ĢŠ®¬‚ɐęs‚µ‚Ċ掚•”•Ŗ‚šœ‚¢‚½Unicode 1.0, Vol.1‚Ŗ1991”N10ŒŽ‚ɏo”Å‚³‚ź¤Œć‚É1992”N‚É‚Č‚Į‚Ċ掚•”•Ŗ‚¾‚Æ‚ĢUnicode 1.0, Vol.2‚Ŗo”Å‚³‚ź‚½”

1992”N¤CJK“‡ŠæŽšURO‘ę“ń”Å‚ŖŠ®¬‚µ¤‚±‚ź‚šŽę‚荾‚ń‚¾i‚½‚¾‚µ¤URO‚É‚ĶŽįŠ±‚ĢŠŌˆį‚¢‚Ŗ”­Œ©‚³‚ź‚Ä‚Ø‚č¤‚»‚ź‚ē‚ĢC³‚Ŗs‚ķ‚ź‚Ä‚¢‚锁jDIS 10646‘ę2”Å‚Ŗ¤5ŒŽ30“ś‚Ģ‘Ū“Š•[‚ʼnĀŒˆ‚³‚ź‚½”

1993”N5ŒŽ1“ś ¢ISO/IEC 10646-1: 1993 Universal Multiple-Octet Coded Character Set (UCS) -- Part 1: Architecture and basic Multilingual Plane£‚Ŗ§’č‚³‚ź‚锓ƔN—‚6ŒŽ‚ÉUnicode 1.0‚Ķ ISO/IEC 10646-1:1993‚É‚ ‚ķ‚¹‚½•ĻX‚šs‚¢Unicode 1.1‚Ę‚Č‚č¤ˆČŒćÕĘŗ°ÄŽ‚ĘISO/IEC 10646‚Ę‚Ķ•ą’²‚š‡‚ķ‚¹‚ĉü’ł‚³‚ź‚Ä‚¢‚­‚±‚Ę‚É‚Č‚é”

ÕĘŗ°ÄŽ‚ĢŹŽ°¼Ž®Ż[•ŅW]

ÕĘŗ°ÄŽ‚ĢŹŽ°¼Ž®Ż‚Ķ¤Ņ¼Ž¬°ŹŽ°¼Ž®Ż (the major version)¤Ļ²Å°ŹŽ°¼Ž®Ż (the minor version)¤±ÆĢßĆŽ°ÄŹŽ°¼Ž®Ż (the update version) ‚Ģ3‚Ā‚Ģ•”•Ŗ‚©‚ē\¬‚³‚ź¤ĖßŲµÄŽ‚Å‚Ā‚Č‚°‚Ä•\Ž¦‚³‚ź‚é[12]”‚½‚¾‚µ¤Ļ²Å°ŹŽ°¼Ž®Ż‹y‚ѱÆĢßĆŽ°ÄŹŽ°¼Ž®Ż‚É‚Ā‚¢‚Ä‚Ķ0‚Ģź‡‚É‚ĶČ—Ŗ‚µ‚Ä•\Ž¦‚³‚ź‚邱‚Ę‚ą‚ ‚é”Ņ¼Ž¬°ŹŽ°¼Ž®Ż‚ĶŚŹß°ÄŲ°‚Ģ’Ē‰Į‚Ģ‚ꂤ‚ȏd—v‚Č•ĻX‚Ŗs‚ķ‚ź‚½‚Ę‚«‚ɉü’č‚³‚ź‚é”ÕĘŗ°ÄŽ‚ĢÄŽ·­ŅŻÄ‚Ķ‘ŠŒ`‘Ō‚Ę“dŽq”ÅÄŽ·­ŅŻÄŒ`‘Ō‚Ģ—¼•ū‚ÅŒö•\‚³‚ź¤‚Ē‚æ‚ē‚ąÕĘŗ°ÄŽ‚É‚Ā‚¢‚Ä‚Ģ³Ž®‚ČÄŽ·­ŅŻÄ‚Å‚ ‚é‚Ę‚³‚ź‚Ä‚¢‚锐V‚½‚ČŹŽ°¼Ž®Ż‚ŖŲŲ°½‚³‚ź‚½‚Ę‚«‚ĶV‚½‚ČÄŽ·­ŅŻÄ‚ŖŒö•\‚³‚ź‚é‚Ŗ¤‘Š‚Ę‚µ‚ÄŠ§s‚³‚ź‚é‚Ģ‚ĶŅ¼Ž¬°ŹŽ°¼Ž®Ż‚Ŗ‰ü’č‚³‚ź‚½ź‡‚Ø‚ę‚яd—v‚ČĻ²Å°ŹŽ°¼Ž®Ż‚Ģ‰ü’č‚Ŗ‚ ‚Į‚½ź‡‚Ģ‚Ż‚Å‚ ‚锏‘Š”Å‚ĢŹŽ°¼Ž®Ż1.0‚Ķ¤2ŠŖ‚É•Ŗ‚Æ‚ÄŠ§s‚³‚ź¤“‡ŠæŽš•”•Ŗ‚šœ‚¢‚½‘ę1ŠŖ‚Ķ1991”N10ŒŽ‚ɤ“‡ŠæŽš•”•Ŗ‚Ģ‘ę2ŠŖ‚Ķ1992”N6ŒŽ‚ÉŠ§s‚³‚ź‚½”‚»‚Ģ‚½‚ß‘ę1ŠŖ‚Ģ‚Ż‚Ģ‚ą‚Ģ‚šUnicode 1.0.0¤‘ę2ŠŖ‚šŠÜ‚ß‚½‚ą‚Ģ‚šUnicode 1.0.1‚ĘŒÄ‚Ō‚±‚Ę‚Ŗ‚ ‚é”

ŠeŹŽ°¼Ž®Ż‚Ę‚»‚Ģ“Į’„[•ŅW]

ÕĘŗ°ÄŽ‚Ģ‚»‚ź‚¼‚ź‚ĢŹŽ°¼Ž®Ż”Ō†‚Ę‚»‚Ģ§’č”NŒŽ“ś¤Žū˜^•¶Žš”‘¼‚Ģ“Į’„‚ĶˆČ‰ŗ‚Ģ’Ź‚č‚Å‚ ‚é”

\¬—v‘f‚ĢŹŽ°¼Ž®Ż[•ŅW]

ÕĘŗ°ÄŽ‚ĢŹŽ°¼Ž®Ż‚É‚Ķ¤ć‹L‚Ģ‚ꂤ‚Č¢ÕĘŗ°ÄŽ‚Ģ‹KŠi‘S‘Ģ‚É•t‚Æ‚ē‚ź‚½ŹŽ°¼Ž®Ż£‚Ģ‘¼‚É¢ÕĘŗ°ÄŽ‚š\¬‚·‚éŒĀX‚Ģ—v‘f‚Ģ‹KŠi‚É•t‚Æ‚ē‚ź‚½ŹŽ°¼Ž®Ż£‚Ŗ‘¶Ż‚·‚锂±‚ź‚ÉŠY“–‚·‚é‚ą‚Ģ‚Ę‚µ‚Ä‚Ķ¤ÕĘŗ°ÄŽ‚š\¬‚·‚éŠe–Ź‚²‚Ę‚É•t‚Æ‚ē‚ź‚½ŹŽ°¼Ž®Ż‚ā¤ÕĘŗ°ÄŽ‚ÉŽū˜^‚³‚ź‚Č‚¢‚±‚Ę‚Ę‚³‚ź‚½½øŲĢßĂĢŲ½Ä (NOR = Not The Roadmap) ‚É•t‚Æ‚ē‚ź‚½ŹŽ°¼Ž®Ż¤‹KŠi‚Ģˆź•”‚š\¬‚·‚éUnicode Technical NoteiUnicode‹Zpɰāj¤Unicode Technical ReportiUnicode‹Zp•ńj¤Unicode Technical StandardiUnicode‹Zp•W€j‚ĢŹŽ°¼Ž®Ż‚Č‚Ē‚Ŗ‘¶Ż‚·‚é”

Unicode‚Ģ”–ā‘č[•ŅW]

ŹŽ°¼Ž®Ż‚²‚Ę‚Ģ”ńŒŻŠ·«[•ŅW]

Unicode‚Ķ“ƈź‚Ģŗ°ÄŽ‚Å‚ąŹŽ°¼Ž®Ż‚Ŗ•Ļ‚ķ‚Į‚½‚Ę‚«Š®‘S‚ɈŁ‚Č‚Į‚½•¶Žš‚š’č‹`‚µ’¼‚µ‚½‚±‚Ę‚Ŗ‚ ‚é”

‚»‚Ģ‚¤‚æÅ‘å‚Ģ‚ą‚Ģ‚ŖUnicode 2.0‚Å‚Ģ¢ŹŻøŽŁ‚Ģ‘åˆŚ“®£‚Å‚ ‚锂±‚ź‚ĶUnicode 1.1‚Ü‚Å‚Å’č‹`‚³‚ź‚Ä‚¢‚½ŹŻøŽŁ‚Ģ—Ģˆę‚š”jŠü‚µ¤V‚µ‚¢ŹŻøŽŁ‚Ģ—Ģˆę‚š•Ź‚ĢˆŹ’u‚ɐŻ’肵¤”jŠü‚³‚ź‚½—Ģˆę‚É‚Ķ•Ź‚Ģ•¶Žš‚Ģ—Ģˆę‚šŠ„‚č“–‚Ă邱‚Ę‚Ę‚Č‚Į‚½”‚»‚ĢŒć¤Unicode 3.0‚Å‚Ķ¤]—ˆŹŻøŽŁ‚ŖŠ„‚č“–‚Ä‚ē‚ź‚Ä‚¢‚½—Ģˆę‚ÉCJK“‡ŠæŽšŠg’£A¤‚Ā‚¢‚ÅUnicode 4.0‚ŘZ\ŽlŒT‚ŖŠ„‚č“–‚Ä‚ē‚ź‚½”‚±‚Ģ‚ꂤ‚ɤUnicode 1.1ˆČ‘O‚ÅŹŻøŽŁ‚š‹Lq‚µ‚½•¶‘‚ĘUnicode 2.0ˆČ~‚ÅCJK“‡ŠæŽšŠg’£A‚š‹Lq‚µ‚½•¶‘‚É‚ĶŒŻŠ·«‚Ŗ‚Č‚¢[293]”JCSˆĻˆõ’·‚ĢŽÅ–ģkŽi‚ĶUnicode‚É“ś–{Œź‚ĢŠæŽš‚šŽū˜^‚³‚¹‚é‹c˜_‚Ģ’†‚ŤŹŻøŽŁ‘åˆŚ“®‚É‚Ā‚¢‚Ä¢ŠŲ‘‚Ģ‚Ę‚Į‚½–Å’ƒ‹ź’ƒ‚ȍs“®£‚ʏq‚ׂĂ¢‚é[294]

“ś–{ŒźŠĀ‹«‚Å‚ĢUnicode‚Ģ”–ā‘č[•ŅW]

YEN SIGN –ā‘č[•ŅW]


Shift_JIS ‚Å‚Ķ JIS X 0201 ‚É‚Ø‚Æ‚é‰~‹L† "" ‚Ŗ 0x5C ‚É’u‚©‚ź‚Ä‚¢‚锂±‚ź‚š Unicode ‚ĢĻÆĖ߯øŽ‚ɍ‡‚ķ‚¹‚é‚Ę YEN SIGN (U+00A5) ‚ÉĻÆĢ߂³‚ź‚锂µ‚©‚µ¤0x5C ‚Ķ ASCII ‚Å‚ĶŹŽÆø½×Ƽ­ "\" ‚É‘Š“–‚µ¤CŒ¾Œź‚Č‚Ē‚Å“½¹°Ģߕ¶Žš‚Ę‚µ‚ÄŽg‚ķ‚ź‚鎖‚©‚ē¤‚±‚Ģ•¶Žš‚Ģŗ°ÄŽ‚š•ĻX‚·‚é‚Ę–ā‘č‚Ŗ‹N‚«‚锋ɒ[‚Č—į‚Ę‚µ‚Ĥ0x5C ‚Ŗ‰~‹L†‚Ę“½¹°Ģߕ¶Žš‚Ģ—¼•ū‚Ģ–Ś“I‚ÅŽg‚ķ‚ź‚Ä‚¢‚é¹°½i‚½‚Ę‚¦‚Ī printf("%dn", price); ‚Č‚Ēj‚ąl‚¦‚ē‚ź‚é”

‚»‚Ģ‚½‚ߤUnicode ‚š—˜—p‚·‚é±ĢßŲ¹°¼®Ż‚Å‚Ķ¤U+007F ˆČ‰ŗ‚Ģŗ°ÄŽ‚ÉŠÖ‚µ‚Ä‚ĶˆŚ“®‚³‚¹‚Č‚¢‚Ę‚¢‚¤ˆĆ–Ł‚ĢŁ°Ł‚Ŗ‚Å‚«‚Ä‚¢‚é”

‚»‚¤‚Č‚é‚ʤUnicode ŠĀ‹«‚Å‚Ķ‰~‹L†‚ŖŹŽÆø½×Ƽ­‚Ģ•\Ž¦‚É•Ļ‚ķ‚Į‚Ä‚µ‚Ü‚¤‚ꂤ‚ÉŽv‚ķ‚ź‚é‚Ŗ¤‚±‚ź‚Ķ“ś–{Œź—p‚ĢĢ«ŻÄĆŽ°Ą‚Ģ 0x5C ‚ĢˆŹ’u‚É‚Ķ‰~‹L†‚ĢŽšŒ`‚š“–‚Ä‚Ä‚µ‚Ü‚¤‚±‚Ę‚Å‘Īˆ‚µ‚Ä‚¢‚锂±‚ź‚É‚ę‚Į‚Ĥ“ś–{ŒźŠĀ‹«‚Å‚Ģ•\Ž¦ć‚Ķ 0x5C ‚ĢˆŹ’u‚ʼn~‹L†‚š—p‚¢‚邱‚Ę‚Ŗ‚Å‚«‚é”

‚±‚Ģ–ā‘č‚Ķ“ś–{ŒźŠĀ‹«‚ÉŒĄ‚Į‚½‚±‚Ę‚Å‚Ķ‚Č‚¢”‚ą‚Ę‚ą‚Ę ISO 646 ć‚Å‚Ķ¤0x5C ‚šŠÜ‚Ž”Žķ‚Ģ•¶Žš‚ĶŽ©—R—ĢˆęiŹŽŲ±ŻÄj‚Ę‚µ‚ÄŠe‘‚Å‚Ģ’č‹`‚š”F‚ß‚Ä‚¢‚½”‚»‚Ģ‚½‚ߤ“ś–{ŒźˆČŠO‚Å‚ą ASCII ‚ÅŹŽÆø½×Ƽ­‚É‘Š“–‚·‚éŗ°ÄŽ‚ɈŁ‚Č‚é‹L†‚š“–‚Ä‚Ä‚¢‚é¹°½‚Ŗ‘½‚¢”—į‚¦‚Ī¤ŠŲ‘‚Å‚Ķ³«Ż‹L† (WON SIGN, U+20A9, "")¤ĆŽŻĻ°ø‚āÉŁ³Ŗ°‚Å‚Ķ½ÄŪ°ø•t‚«O (LATIN CAPITAL LETTER O WITH STROKE, U+00D8, "Ø") ‚Č‚Ē‚Å‚ ‚锁iŒćŽŅ‚ĶŒć‚ĢŽž‘ć‚É‚Ķ¤0x5C ‚ĶŹŽÆø½×Ƽ­‚Ģ‚Ü‚Ü‚Ę‚µ¤ISO 8859 ¼Ų°½Ž‚š—p‚¢‚邱‚Ę‚Ŗˆź”Ź‰»‚µ‚½”j

”gĄŽÆ¼­„‘SŠpĮŁĄŽ–ā‘č[•ŅW]


JIS X 0221 ‹K’č‚Ģ JIS X 0208 ‚Ę JIS X 0221 ‚Ģ‘Ī‰ž•\‚Å‚Ķ¤”gĄŽÆ¼­‚Ķ WAVE DASH (U+301C, "`") ‚É‘Ī‰ž‚³‚¹‚Ä‚¢‚é‚Ŗ¤Ļ²øŪæĢĂĶ Windows ‚Ģ Shift_JIS ‚Ę Unicode ‚Ģ•ĻŠ·Ć°ĢŽŁ‚šģ¬‚·‚éŪ‚ɤJIS X 0208 ‚É‚Ø‚¢‚Ä 1 ‹ę 33 “_‚ÉŠ„‚č“–‚Ä‚ē‚ź‚Ä‚¢‚é”gĄŽÆ¼­ "`" ‚š¤Unicode ‚É‚Ø‚Æ‚é‘SŠpĮŁĄŽ (FULLWIDTH TILDE, U+FF5E, "~") ‚ÉŠ„‚č“–‚Ä‚½‚½‚ß•s®‡‚Ŗ¶‚¶‚锂±‚ĢŒ‹‰Ź¤macOS “™‚Ģ JIS X 0221 €‹’‚Ģ Shift_JIS Ģ Unicode •ĻŠ·Ć°ĢŽŁ‚š‚ą‚Āˆ—Œn‚Ę Windows ‚Ę‚ĢŠŌ‚Å Unicode ĆŽ°Ą‚š‚ā‚čŽę‚č‚·‚鏼‡¤•¶Žš‰»‚Æ‚š‹N‚±‚·‚±‚ʂɂȂ锂»‚±‚Å Windows ˆČŠO‚Ģ OS ć‚Å“®‚­±ĢßŲ¹°¼®Ż‚Ģ’†‚É‚Ķ¤CP932 ‚Ę‚¢‚¤–¼‘O‚ÅĻ²øŪæĢĎd—l‚Ģ Shift_JIS ŗ°ÄŽ‘ĢŒn‚š•Ź“r—pˆÓ‚µ‚Ä‘Ī‰ž‚µ‚Ä‚¢‚é¹°½‚Ŗ‘½‚¢”‚±‚ĢŒ“ˆö‚Ę‚³‚ź‚Ä‚¢‚é Unicode Žd—l‘‚Ģ—įŽ¦ŽšŒ`‚Ģ–ā‘č‚ÉŠÖ‚µ‚Ä‚Ķ¤”gĄŽÆ¼­#Unicode‚ÉŠÖ˜A‚·‚é–ā‘č‚šŽQĘ‚·‚邱‚Ę”

ć‹L‚ɉĮ‚¦¤Ļ²øŪæĢĎd—l‚Ķ•ĻŠ·Žž‚É‚ą–ā‘č‚Ŗ‹N‚±‚镶Žš‚šˆČ‰ŗ‚ÉŽ¦‚·”

‚±‚Ģ‚¤‚æ¾ŻÄ„Ī߯Ď„”Ū’č‚É‚Ā‚¢‚Ä‚Ķ¤IBM‚ĢŅ²ŻĢŚ°Ń‚Å‚ĶShift_JIS‚šŠg’£‚µ‚Ä‚±‚ź‚ē‚Ģ”¼Šp”Å‚šŗ°ÄŽĪß²ŻÄ 0xFD-0xFF ‚ÉŠ„‚č“–‚Ĥ•Ź“rJIS X 0208‚©‚ēĻÆĢ߂³‚ź‚½ˆŹ’u‚É‘SŠp”Å‚šŽū˜^‚µ‚Ä‚¢‚½‚½‚ߤWindows‚šIBMŅ²ŻĢŚ°Ń‚Ģ’[––‚Ę‚µ‚Ä—p‚¢‚é¹°½‚š‘z’肵‚½‚Ę‚¢‚ķ‚ź‚Ä‚¢‚é

‚Č‚Ø¤Windows Vista ‚ā Microsoft Office 2007 ‚É•t‘®‚·‚é IME ŹßÆÄŽ‚Ģ•¶Žšˆź——‚É‚Ø‚Æ‚é JIS X 0213 ‚Ģ–Ź‹ę“_‚Ģ•\Ž¦‚Ķ¤ć‹L‚Ģ•¶Žš‚É‚Ā‚¢‚Ä‚ą JIS ‚Å‹K’č‚³‚ź‚Ä‚¢‚é‚ą‚Ģ‚Ę“Æ‚¶ĻÆĖ߯øŽ‚šŽg—p‚µ‚Ä‚¢‚é[295]

ĢŽŪÆø‚Ģˆź——[•ŅW]

‹r’[•ŅW]

’Žß[•ŅW]

o“T[•ŅW]

ŽQl•¶Œ£[•ŅW]

—pŒź‚Ģ“ś–{Œź•\‹L‚ĶŒ“‘„‚Ę‚µ‚ÄŽŸ‚É‚Č‚ē‚Į‚½”gUnicode Terminology English - Japaneseh. Unicode, Inc. 2010”N1ŒŽ1“ś‰{——”
The Unicode standard worldwide character encoding, Version 1.0. Vol.1. The Unicode Consortium. Addison-Wesley Pub.. (1991). . 
The Unicode standard worldwide character encoding, Version 1.0. Vol.2. The Unicode Consortium. Addison-Wesley Pub.. (1992). . 
The Unicode standard, Version 1.1. The Unicode Consortium. (1993). 
The Unicode standard, Version 2.0. The Unicode Consortium. Addison-Wesley. (1996). . 
The Unicode standard, Version 3.0. The Unicode Consortium. Addison-Wesley. (2000). .  - •t‘®FCD-ROM”
The Unicode standard, Version 4.0. The Unicode Consortium. Addison-Wesley Professional. (2003). .  - •t‘®FCD-ROM”
The Unicode standard, Version 5.0, Fifth Edition. The Unicode Consortium. Addison-Wesley Professional. (2006). .  - •t‘®FCD-ROM”
øŽ×ŹŃ, ÄĘ°wUnicode•W€“ü–åxŠ£˜aŽu„ŠC˜V’Ė“O–ó¤ŠÖŒū³—TŠÄC¤ćĉjŽŠ¤2001”N5ŒŽ” - Œ“Ą²ÄŁFUnicode: a primer
¬—Ń—“¶wÕĘŗ°ÄŽķ‹L@•¶Žš•„†‚Ģ‘Ū•W€‰»ŹŽÄŁx“Œ‹ž“d‹@‘åŠwo”Å‹Ē¤2011”N6ŒŽ”
“cŠŪŒ’ŽO˜YwUnicode‚É‚ę‚éJIS X 0213ŽĄ‘•“ü–å@ī•ń¼½ĆтĢV‚½‚Č“ś–{Œźˆ—ŠĀ‹«x“śŒoBPæĢÄĢߌ½¤“śŒoBPo”žŻĄ°i”­”„jqĻ²øŪæĢČöŽ®‰šą‘ Ļ²øŪæĢÄITĢßŪĢŖƼ®ÅŁ¼Ų°½Žr¤2008”N8ŒŽ”
’†“‡–õw“ś–{Œź•¶Žšŗ°ÄŽ•\@Unicode‡13652Žš@For windows, internetxī•ńŠĒ—¤Æ‰_ŽŠi”­”„jqDesk side seriesr¤1998”N4ŒŽ”
Microsoft CorporationwŒöŽ®Win32 APIŲĢ§ŚŻ½xv.4¤±½·°‘Š•ŅW•”‚Ł‚©–󤱽·°qASCII booksr¤1999”N10ŒŽ”
wÕĘŗ°ÄŽŠæŽšī•ńŽ«“T@Sanseido's unicode kanji information dictionaryxÕĘŗ°ÄŽŠæŽšī•ńŽ«“T•ŅWˆĻˆõ‰ļ•Ņ¤ŽOČ“°¤2000”N6ŒŽ”
Lunde, KenwCJKV“ś’†ŠŲ‰zī•ńˆ—x¬¼Ķ„‹tˆäŽŒČ–ó¤µ×²Ų°„¼Ž¬ŹßŻ¤2002”N12ŒŽ”

ŠÖ˜A€–Ś[•ŅW]

ISO/IEC 10646
OpenType
Unicodeˆź——
UnicodeŽQĘ±ŁŗŽŲ½ŽŃ
‹@ŽķˆĖ‘¶•¶Žš
‘Ū‰»‚Ę’nˆę‰»
’†¼—ŗ
•¶Žšŗ°ÄŽ
ˆŁ‘ĢŽš¾ŚøĄ

ŠO•”ŲŻø[•ŅW]

The Unicode Consortium i‰pŒźj
DecodeUnicode i‰pŒźj
BabelMap - Unicode Character Map for Windows
o“T:Wikipedia
2020/02/21 22:00
łæl‹C‹LŽ–ׯ·ŻøŽ
2020/02/23 XV
 1ˆŹØ“ś–{
 2ˆŹØ…–ģ’©—z
 3ˆŹØŅ²Ģߣæ°Ģߎ–Œ
 4ˆŹŖ‘ę“ńŽŸ¢ŠE‘åķ
 5ˆŹØAV——D
£ć‚É–ß‚é
[9]WikipediaÄÆĢß
[0]gooÄÆĢß
”–ʐӎ–€
(C)NTT Resonant