約 3,189,404 件
https://w.atwiki.jp/alloy/pages/23.html
Unicode対応版Alloy 説明 Alloy4.1.10をUnicodeに対応させました。 Alloyの記述 (sig名とか、pred名など) で日本語などが使えます。 注意 Alloyのインターフェースはは英語のままです。 対応しているUnicode文字は、既存の文字のほかに0x0080~0xFFFFまでです。 注意 文字以外のコード(0xFFFF)などを入力したときに、何が起きるかは検証してません。 自己責任でご利用ください。 サロゲートペアは対応していません。 サロゲートペアの文字を含むUTF-8形式のファイルを読み込み、かつ対応しているフォントを指定すれば、エディタ上では表示され、コンパイルできます。 ただし、Visualizerの方では文字化けして表示されません。 ダウンロード Mac版 その他OS版 ソースコード 修正したファイルは、以下の2つです。 Alloy.flexオリジナルのファイルはAlloy.lexですが、JFlexで使えるように、拡張子を変えています。 CompLexer.javaAlloy.flexをJFlexでコンパイルし、ビルドが通るように修正したものです。 ご注意 このソフトウェアによって何が起きても責任は負いません。 Javaが動作する環境が必要です。 -
https://w.atwiki.jp/kakis3/pages/55.html
同位標目:PDIC for Win32の使い方 PDIC/Unicodeとは、2010年ごろからアルカの単語登録に用いられた辞書ソフトである。 当初は、前作のWin32版と比べて性能に劣るところがあったが、最近ではほとんど不便を感じないとのこと。 Unicode対応であるため、アラビア文字やタイ文字を使った人工言語の語彙も登録可能。国際音声記号の表示も容易である。 また、見出し語、訳語の欄に記入できる量が増るなど、一語あたりに入力できる文字数が増えている。 辞書グループに登録できる辞書数も16から30に増え、多数の言語を併用する異世界の構築もやりやすくなった。 用例欄の単語をクリックしたときに訳語がポップアップするようになるなど、閲覧機能は全体的に強化されている。 新しく、言語作者を目指す者はこちらを使った方が良いと思われる。 ○PDIC/Unicodeの使い方 インストール手順 新規辞書の作成 単語登録 検索 テキストへの変換 アップロード 辞書の展示 インストール手順 1. PDIC Home Page を開く 2. PDIC/Unicode -ダウンロードなどのところをクリック。 3. 最新版をダウンロード 4. 実行をクリック 5. 使用言語は「日本語」で「OK」 6. セットアップ画面以外のウィンドウを全消し。選択肢はひたすら「次へ」で。 デスクトップアイコンやクイックボタンを付けるかどうかは任意。 「インストール」や、「完了」が出てきたら押す。 新規辞書の作成 1. 右上タブ[File] → [辞書設定<詳細>(E)] 2.辞書設定画面が開いたら、[辞書グループ一覧(G)]の空欄を右クリック。 [辞書グループの追加(A)]をクリック。 ※キーボードの[Ins]ボタンを押すと一発作成 3.新規辞書グループである[Group 1]ができたので、適当に名前を付ける。 言語名推奨。 4.[使用辞書一覧]のところを右クリックして、[新規辞書の追加(N)]を選択。 5.辞書の新規作成ウィンドウが出るので[参照]を押す。 6.保存する場所で保存するファイルを選び、適当なファイル名を入力し、[保存(S)] 7. 辞書の新規作成ウィンドウに戻るので[OK] これで新規辞書の作成が完了する。 単語登録 1.Personal Dictionary ウィンドウ右上のボックスを押し、新規グループを選択。 デフォルトならサンプルと書いてあるところを押して、新しく作った辞書グループを選べばよい。 2.WORD欄に任意の文字列を入力し、Ctrl + Enter。 すると、登録語編集ウィンドウが出るので、各種必要項目を入力する。 改行はCtrl+Enterでできる。 入力が終わったら、[OK]またはEnter 3.単語が登録される。 間違った時は、Ctrl+Enterまたは、辞書の記述部分をダブルクリックでサイト登録語編集ウィンドウを出して修正。 そして、1~2を約3000回繰り返せば、最低限使える言語が出来上がる。 検索 1. 見出し語なら、WORD欄に文字列を入力して検索できる。 2. 見出し語、用例などの検索をする場合は、F3を押して、検索画面を出すと検索できる テキストへの変換 PDICの辞書ファイルである.dicはメモ帳では文字化けが酷くて読めないため、 PDICを持っていない人に読んでもらうためには、テキスト形式に変換する必要がある。 PDIC形式 一行テキスト形式 1. 右上タブ[File] → [辞書設定<詳細>(E)] 2.辞書設定ウィンドウの使用辞書一覧で変換する辞書ファイルを選択し、右クリック。 3.参照を押して、変換先辞書を保存する場所を指定し、末尾に".txt"と付いた名前を付けて開く。 変換先ファイル形式はPDIC一行テキスト形式にして、[OK]を押す。 すると、一行テキスト形式に変換されたテキストファイルが作成される。 アップロード 1.デスクトップで[右クリック]→[新規作成]→[圧縮(zip形式)フォルダ]で、新しいzipを作る。名前は適当に付ける。 2.そのzipに辞書ファイル(.dic形式)を入れる。 PDICを持っていない人のために、一行テキスト形式のテキストも同封するのが望ましい。 3.ネット上の適当なアップローダーにそのzipをupする。 アップ先は各々の持っているウェブサイトやブログ、@wikiでもよいし、 MSNのアカウントを取って、25GBと大容量のskydriveにupしてもよい。 画像・音声・動画など容量の重いデータをupする場合はお勧めである。 ただし、skydriveを使う場合、MSNアカウントに120日以上ログインしないなど放置すると、 自動的にアカウントが消滅し、データも消滅してしまうため、自分のハードディスクにデータを保存することが望ましい。 辞書の展示 アップロードした日付、辞書ファイル、語彙数と注記を書きいれるのが望ましい。 人工言語は、最初の数年は改定に次ぐ改定を繰り返すのが常であり、語彙編成は修正に次ぐ修正に見舞われる。 改定前の過去の辞書がなければ、古い時代に作った大型文学作品が解読不能になり、歴史の闇に消えてしまうなどということは、アルカ史ではよくあることである。 そのような事態を防ぐため、特に例文を多く作った時、文学作品を作った時にはその時の辞書データを保存しておくことが望ましい。 語彙数表示は、作者本人がその言語の成長を数値化し視覚化することで、モチベーションを高める効果を持つ。 注記は、その辞書がupするときにどのような改定があったかということを知る目安になる。 また、語彙数が1500語以下程度と少ないのならば、テキスト形式に変換した辞書データをそのまま貼り付けて参照できるようにするのも便利である。 例: 2012/01/21 feyas1780.zip フェヤス語/辞書/120121 61語 文法書の単語登録中 2012/01/22 feyas1781.zip フェヤス語/辞書/120122 170語 文法書の単語登録終了 2012/01/29 feyas1788.zip フェヤス語/辞書/120129 254語 グモソ語スレ1の単語登録中 2012/02/05 feyas1795.zip フェヤス語/辞書/120205 322語 グモソ語スレ1の単語登録中 2012/02/12 feyas1802.zip フェヤス語/辞書/120212 439語 グモソ語スレ1の単語登録中 同位標目:PDIC for Win32の使い方
https://w.atwiki.jp/shuei/pages/170.html
Latin-1 Supplement - Unicode U+0080 - U+00FF - (128-255) aacute = #225; = #xE1; = aacute agrave = #224; = #xE0; = agrave eacute = #233; = #xE9; = eacute egrave = #232; = #xE8; = egrave iacute = #237; = #xED; = iacute igrave = #236; = #xEC; = igrave oacute = #243; = #xF3; = oacute ograve = #242; = #xF2; = ograve uacute = #250; = #xFA; = oacute ugrave = #249; = #xF9; = ugrave uuml = #252; = #xFC; = uuml subtract 32 for upper case Latin Extended-A - Unicode U+0100 - U+017F - (256-383) #257; = #257; = #x101; #275; = #275; = #x113; #283; = #283; = #x11B; #299; = #299; = #x12B; #333; = #333; = #x14D; #363; = #363; = #x16B; subtract 1 for upper case Latin Extended-B U+0180 - U+024F (384-591) #462; = #462; = #x1CE; #464; = #464; = #x1D0; #466; = #466; = #x1D2; #468; = #468; = #x1D4; #470; = #470; = #x1D6; #472; = #472; = #x1D8; #474; = #474; = #x1DA; #476; = #476; = #x1DC; subtract 1 for upper case reference http //www.math.nus.edu.sg/aslaksen/read.shtml
https://w.atwiki.jp/keisks/pages/410.html
http //lab.hde.co.jp/2008/08/pythonunicodeencodeerror.html
https://w.atwiki.jp/ohden/pages/352.html
Unicode(UTF-16 LittleEndian)の使い方 ICUを使うらしい。 ICUはIBM製のlibraryで『International Components for Unicode』の略らしい。 ICU http //site.icu-project.org/ ICU4C http //site.icu-project.org/download/46#ICU4C-Download source取得。 wget http //download.icu-project.org/files/icu4c/4.6/icu4c-4_6-src.tgz 更新日: 2011年02月28日 (月) 16時41分31秒 http //www.nslabs.jp/icu.rhtml ICUの使い方 -- (s1n) 2011-02-28 21 30 49 名前 コメント すべてのコメントを見る
https://w.atwiki.jp/miracle_mikuru/pages/110.html
#include locale setlocale( LC_ALL, "japanese" );
https://w.atwiki.jp/sugawara/pages/60.html
Windows Programming Tips _UNICODEを定義しているプロジェクトで_RPTマクロを使うときにこのマクロは(このマクロから呼び出される_CrtDbgReport()は)引数の型がconst char*なのでTCHARの文字列をそのまま渡せない。 TCHAR uniStr[ uniLength ]; char str[ strSize ]; ... int ret = WideCharToMultiByte( CP_ACP, 0, uniStr, -1, str, strSize, NULL, NULL );
https://w.atwiki.jp/sampleisbest/pages/55.html
開発環境 Microsoft Visual C++ 2010 Express (SP1) 実行環境 Microsoft Windows XP Home Edition (SP3) プロジェクトの種類 Win32 コンソール アプリケーション プロジェクト名 test アプリケーションの種類 コンソール アプリケーション 追加のオプション 空のプロジェクト 文字セット Unicode Shift_JISに変換できないファイル名等を扱うためにUnicode対応が必要である。 また、セキュリティ強化関数の冗長化を防ぐためにC++のテンプレートオーバーロードを利用する。 C++でビルドするには拡張子をcppにする。 test.cpp #include fcntl.h // _O_WTEXT #include io.h // _setmode #include stdio.h // _fileno #include tchar.h // _tmain #include Windows.h int _tmain() { TCHARatcPath[_MAX_PATH]; TCHARatcDrive[_MAX_DRIVE]; TCHARatcDir[_MAX_DIR]; TCHARatcFName[_MAX_FNAME]; TCHARatcExt[_MAX_EXT]; _setmode(_fileno(stdout), _O_WTEXT); GetModuleFileName(NULL, atcPath, _countof(atcPath)); _tsplitpath_s(atcPath, atcDrive, atcDir, atcFName, atcExt); _tprintf(_T("[%s][%s][%s][%s]\n"), atcDrive, atcDir, atcFName, atcExt); return 0; } 実行 [C ][\hoge\][♥][.exe]
https://w.atwiki.jp/sevenlives/pages/2599.html
Java
https://w.atwiki.jp/fumiduki1985/pages/217.html
isinstanceを使うことで可能。 str文字列を判定したい場合は「str」、unicode文字列を判定したい場合は「unicode」を指定する。 記述例: s = hoge isStr = isinstance(s, str) # sがstr文字列かどうか判定する isUnicode = isinstance(s, unicode) # sがunicode文字列かどうか判定する このページのタグ一覧 Python プログラミング