約 5,330,790 件
https://w.atwiki.jp/mlnk/pages/38.html
文字コード 画像の横軸が上位1バイト、縦軸が上位1バイト。 CP932 Microsoft独自のShift_JIS拡張。 シングルバイトは0x00~0x7Fおよび0xA1~0xDF。(unsigned char)((code^0x3F)-0xE0) 0xBF 第一バイトは0x81~0x9Fおよび0xE0~0xFC。(unsigned char)((code^0x20)-0xA1) =0x3B 第二バイトは0x40~0x7Eおよび0x80~0xFC。((unsigned char)(code-0x40) =0xBC) (code!=0x7F) http //unicode.org/Public/MAPPINGS/VENDORS/MICSFT/WINDOWS/CP932.TXT CP932の文字コード分布 CP932をUnicodeに変換した場合の文字コード分布 『』
https://w.atwiki.jp/drip122/pages/42.html
Postgres、Oracle CREATE DATABASE単位で文字コードを設定できる 例)postgresの場合 CREATE DATABASE postgres WITH OWNER = postgres ENCODING = UTF8 CONNECTION LIMIT = -1; SQLServer 使用するデータ型によって文字コードが指定されます。 データ型がchar、varchar、textの場合:MS932 データ型がnchar、nvarchar、ntextの場合:Unicode JDBCでSQLServerに接続する際の注意点 JDBC Driver Version 2.0 では、CHAR、VARCHAR、LONGVARCHAR の各 JDBC 型のパラメーター値を送信するときにのみ、sendStringParametersAsUnicode プロパティがチェックされます。JDBC 4.0 の新しい National Character メソッドである、SQLServerPreparedStatement クラスおよび SQLServerCallableStatement クラスの setNString、setNCharacterStream、setNClob などのメソッドでは、このプロパティの設定に関係なく、常に、サーバーに対してパラメーター値が Unicode で送信されます。 CHAR、VARCHAR、LONGVARCHAR などの JDBC データ型の使用に伴うパフォーマンスを最適に保つためには、JDBC ドライバーのバージョン 2.0 を使用するアプリケーションは、sendStringParametersAsUnicode プロパティを "false" に設定し、National Character メソッド以外のメソッドである、SQLServerPreparedStatement クラスおよび SQLServerCallableStatement クラスの setString、setCharacterStream、setClob を使用する必要があります。 アプリケーションで sendStringParametersAsUnicode プロパティが "false" に設定されていて、National Character メソッド以外のメソッドを使用してサーバー側の Unicode データ型 (nchar、nvarchar、ntext など) にアクセスする場合に、National Character メソッド以外のメソッドで渡される文字列パラメーターの文字がデータベース照合順序でサポートされていないときには、一部のデータが失われる可能性があります。 アプリケーションでは、NCHAR、NVARCHAR、LONGNVARCHAR の各 JDBC データ型に対して、SQLServerPreparedStatement クラスおよび SQLServerCallableStatement クラスの National Character メソッドである setNString、setNCharacterStream、および setNClob を使用する必要がある点に注意してください。 接続プロパティ:sendStringParametersAsUnicode sendStringParametersAsUnicode プロパティの既定値は "true" です。 sendStringParametersAsUnicode プロパティが "true" に設定されている場合、文字列パラメーターは Unicode 形式でサーバーに送信されます。 sendStringParametersAsUnicode プロパティが "false" に設定されている場合、文字列パラメーターは、Unicode ではなく ASCII/MBCS などの Unicode 以外の形式でサーバーに送信されます。 参考URL http //www.hitachi.co.jp/Prod/comp/soft1/manual/pc/d3M0360/EM030327.HTM http //msdn.microsoft.com/ja-jp/library/bb330962(SQL.90).aspx http //okwave.jp/qa3418167.html http //msdn.microsoft.com/ja-jp/library/ms378988.aspx
https://w.atwiki.jp/sakurawmemo/pages/15.html
エディタの内部コードはUTF-16です。サロゲートペアにはたいだい対応しています。 編集画面 サロゲートペアには対応しています。 2000, XP で、一部の言語の表示がおかしい場合、FontLinkの設定(レジストリ操作)が必要です。 プロポーショナルフォントには未対応です。 右書き(rtl)・合成文字・Unicode制御文字などには未対応です。 ファイルの読み込み Shift_JIS(CP932), EUC-JP 仕様によりNEC/IBM拡張漢字一部文字が双方向変換できないため、それらの文字が発見されると読み取り専用になります。 EUC-JPは、CP932に一度変換されてから、OSのコンバータでUTF-16LEに変換されます。 UTF-8 不正シーケンスは、U+D800からU+D8FFのサロゲート断片に変換されます。 CEUS-8 おそらくUTF-8に同じ。ただし、サロゲートペアは、CEUSの規則に従って変換されます。 UTF-16LE/UTF-16BE ファイルが奇数バイトの場合は、最後の文字の上位8bitに0を割り当てて、偶数バイトにするらしい IS-2022-JP 未調査 UTF-7 未調査 ファイルの書き出し Shift_JIS(CP932), EUC-JP 表現不能なワイド文字がある場合、?に変換されるらしい EUC-JPは、CP932に一度変換されてから、OSのコンバータでUTF-16LEに変換されます。 UTF-8 U+D800からU+D8FFのサロゲート断片は、元のバイトシーケンスに変換されます。 CEUS-8 UTF-8に同じ UTF-16LE/UTF-16BE ファイルが奇数バイトだったときでも、読み込み時の影響で偶数バイトになるらしい IS-2022-JP 未調査 UTF-7 未調査 不正データ類の保持 サクラ上のU+D800からU+D8FFのサロゲート断片は ?XX と表示され半角扱いになります。 正常なサロゲートペアはそれなりに扱います。(並び順依存) コードポイント表示 [共通設定]に、エンコードごとにステータスに表示されるコードポイントの指定オプションがあります。 デフォルトエンコード指定 [タイプ別設定]-[支援]に、タイプ別ごとのデフォルト指定があります。 ※Grepも、そのウィンドウに適用されているタイプ別設定に依存して文字コード判別をします。 関連 エンコーダー/デコーダー周りについて Rev 1553 PatchUnicode 2478365
https://w.atwiki.jp/freetool/pages/33.html
文字コードの変換・解析 HTMLソース日本語文字コードのオンライン変換 入力、出力HTMLのソースコードは Shift-JIS EUC-JP JIS(ISO-2022-JP) UTF-8 UTF-16 が可能です 「指定URL」か「ローカルHTMLファイル」のいずれかを指定して下さい。 文字コードの解析、変換(エンコード、デコード) 文字コードの変換や解析を行います。 文字化けを起こしたメッセージを読みたいときなどに効果があります。 TransEscape テキストエリアに文字列を入力してから、変換を押すと、下段のテキストエリアに escape エンコードされた文字列が出力されます。 Proxomitron用 文字コード変換 入力された文字列を「Proxomitron特有のエンコードされた文字列」に エンコード/デコード します。 Proxomitronはマルチバイト文字を認識しませんので、日本語にマッチさせるためにはエンコードする必要があります。
https://w.atwiki.jp/htmlwiki/pages/53.html
文字化けを防ぐために文書の文字コードを宣言しています。 文字コード一覧 !DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN""http //www.w3.org/TR/html4/strict.dtd" meta http-equiv="Content-Type" content="text/html charset=Shift_JIS" html head title /title /head body /body /html
https://w.atwiki.jp/worktip/pages/13.html
iconvでの文字コード変換 iconvを使用した文字コード変換ではまったので注記 UTF-8 = Shift-JIS 文字コードをUTF-8とShift-JISで相互変換する場合に特定の文字が処理系で違うコードに変換されるようです。(ソフト依存??) その他の文字についてはまだ調べてないが、「-」(IMEでは[全]マイナスと表記)をWindows上でUTF-8として入力すると、EF BC 8D(EFBC8D)となる。 しかし、調べてみると、正しくはE2 88 92(E28892)らしく、iconvで「UTF-8- Shift-JIS- UTF-8」の変換を行うと「Shift-JIS- UTF-8」のところで不可逆な変換となりバグってしまう。 とりあえず、IMEからの入力は無理っぽかったので、iconvでE2 88 92のコードに変換してからコピペした。 ほかにもこんな文字があるのかなぁ。。。 名前 コメント
https://w.atwiki.jp/micromag/pages/45.html
inputファイルを作成する際、文字コードと改行コードに気をつける必要があります。例えば、Windowsで作成したファイルをUbuntuで開く場合、文字コードが間違っていると文字化けを起こします。また、Ubuntuで作成したファイルをWindowsで開く場合、改行コードが間違っていると改行されずに全文が1行で表示されます。 WindowsとUbuntuでどの文字コード、改行コードが認識されるかを調べたのが下表です。 Windows Ubuntu UTF-8 ○ ○ Shift-JIS ○ × ▲文字コード対応表 Windows Ubuntu LF × ○ CR+LF ○ ○ ▲改行コード対応表 両方のOSに対応しているのは、文字コードがUTF-8、改行コードがCR+LFですので、これらを使うとよいと思います。このwikiでダウンロードできるinputファイルにはUTF-8およびCR+LFを使用しています。
https://w.atwiki.jp/anuban/pages/34.html
文字コード - Wikipedia charset=TIS-620 charset=windows-874
https://w.atwiki.jp/kubo/pages/30.html
・文字コード
https://w.atwiki.jp/system-ed/pages/11.html
文字コード Ascii code アスキー, 情報交換用米国標準コード American Standard Code for Information Interchange の頭字語 アスキーコード(0x00~0x7F)と、JIS X 0201で規定されている半角カタカナを含む文字コード表です。(2013年6月13日 追記) 00 10 20 30 40 50 60 70 80 90 A0 B0 C0 D0 E0 F0 00 DE 0 @ P p ー タ ミ 01 SH D1 ! 1 A Q a q 。 ア チ ム 02 SX D2 ” 2 B R b r 「 イ ツ メ 03 EX D3 # 3 C S c s 」 ウ テ モ 04 ET D4 $ 4 D T d t 、 エ ト ヤ 05 EQ NK % 5 E U e u ・ オ ナ ユ 06 AK SN & 6 F V f v ヲ カ ニ ヨ 07 BL EB ’ 7 G W g w ァ キ ヌ ラ 08 BS CN ( 8 H X h x ィ ク ネ リ 09 HT EM ) 9 I Y i y ゥ ケ ノ ル 0A LF SB * : J Z j z ェ コ ハ レ 0B HM EC + ; K [ k { ォ サ ヒ ロ 0C CL → , < L ¥ l | ャ シ フ ワ 0D CR ← - = M ] m } ュ ス ヘ ン 0E SO ↑ . > N ^ n  ̄ ョ セ ホ ゛ 0F SI ↓ / ? O _ o ッ ソ マ ゜ 制御コード一覧 ㈱システム電子設計へ戻る