Hatena::Groupmobilehacker

clouderの日記

 | 

2007-11-13

auの絵文字の文字コードまとめ

01:24 |  auの絵文字の文字コードまとめ - clouderの日記 を含むブックマーク はてなブックマーク -  auの絵文字の文字コードまとめ - clouderの日記

g:subtech:id:miyagawa:20071112:1194865208を自分なりに解釈してまとめてみる。

auでは次の2つの変換方法がある

  1. auの仕様書のマッピング(A) → 絵文字を&#xXXXX;(Unicodeのコードポイント)で書くと、表示するときに仕様書のマッピングに従ってsjisに変換する。
  2. 端末内での独自マッピング(B) → sjisのコード(&#XXXXX;の数字)から1792を引いた値をutf-8に変換する(らしい)。この変換方法は非公開。

絵文字を表示するには次の2つの方法がある

  1. 仕様書にあるUnicodeのコードポイントで「&#xXXXX;」と表記する。
  2. 仕様書にあるsjisを変換方法B(仕様書に書いてない独自マッピング)で変換したutf-8の文字で表記する。

で、miyagawaさんのところに書いてある結論としては、「auの仕様書にある絵文字のUnicodeのコードポイントは、softbankの絵文字のコードポイントとかぶるしい扱いづらいので、auで絵文字を保存する場合には上記で説明した変換方法Bで変換したutf-8で保存すべきした方がいいのかも」という話でした。


いままでauの仕様書にのっとったutf-8でデータを保存して運用している場合には、既存のデータをg:subtech:id:miyagawa:20071112:1194872156で紹介している関数を使って変換をすればよいですね。ちょとめんどうだけど。ちなみに、この変換する関数をみると上記の説明がわかると思います。

Encode::from_to($bytes, "utf-8" => "x-sjis-kddi");
Encode::from_to($bytes, "x-sjis-kddi-auto" => "utf-8");

まずauの仕様書の通りにutf-8sjisの変換をし、その後変換方法Bでsjisutf-8に変換をしています。


ということで間違っていませんかね?

BojanBojan2012/09/23 18:43I had no idea how to arpopach this before-now I'm locked and loaded.

hsovhsjhsovhsj2012/09/24 11:02oHMx0Q <a href="http://pqauebbuulhp.com/">pqauebbuulhp</a>

hchmoiynwhchmoiynw2012/09/25 16:33hfymEs , [url=http://wbfokbzhmcnw.com/]wbfokbzhmcnw[/url], [link=http://gfhsayrdoqbs.com/]gfhsayrdoqbs[/link], http://qmwvnxjncjbg.com/

jrrljipohjrrljipoh2012/09/27 08:04oNhjHq , [url=http://bpergbpfhtlv.com/]bpergbpfhtlv[/url], [link=http://ncsadhiudhxu.com/]ncsadhiudhxu[/link], http://gomymyqgcztq.com/

 |