hebohebo-mobileprogrammer-diary

 | 

2008-01-28

3キャリの絵文字変換表を作ってみました 05:26

http://mobilehacker.g.hatena.ne.jp/nihen/20080123

でいっていた絵文字変換表を作ってみた。

2iな部分はwillcomに転送ではなく、webにポストすりゃいいんじゃんと気づきそうしてみました。

http://coderepos.org/share/browser/lang/perl/Encode-JP-Mobile/branches/make-convert-map-myself/

でコミットしたです。

以下は作り方です。

(tools/scrape_convert/BUILD

とかで追加しといたほうがいいかなぁ。)

# make (s|e)2i
1. perl tools/scrape_convert/send-all-pictogram.pl kddi *****@ezweb.ne.jp ****@example.com 'http://example.com/post-pictogram.cgi'
2. perl tools/scrape_convert/send-all-pictogram.pl softbank *****@softbank.ne.jp ****@example.com 'http://example.com/post-pictogram.cgi'
3. (kddi | softbank)デバイス上でそれぞれ)*****@docomo.ne.jpに転送
(docomoデバイス上でそれぞれのメールで)
    4. <pict_map_from_*> から </pict_map_from_*> までコピー
    5. メールに記載されているhttp://example.com/post-pictgram.cgiにアクセス
    6. コピーしたpict_mapを貼り付けて送信
7. cp /tmp/*2i.yml dat/conv/


# make (i|s)2e
1. perl tools/scrape_convert/send-all-pictogram.pl docomo *****@docomo.ne.jp ****@example.com 'http://example.com/post-pictogram.cgi'
2. perl tools/scrape_convert/send-all-pictogram.pl softbank *****@softbank.ne.jp ****@example.com 'http://example.com/post-pictogram.cgi'
3. (docomo | softbank)デバイス上でそれぞれ)*****@ezweb.ne.jpに転送
4. kddiデバイス上でそれぞれのメールを*****@example.comに転送
5. 受け取ったメールを perl tools/scrape_convert/scrape_kddi_from_mail.pl < receive_mail 等で実行(aliasにpipeを設定しておくと楽)
6. cp /tmp*2e.yml dat/conv


# make (i|e)2s
1. perl tools/scrape_convert/send-all-pictogram.pl docomo *****@docomo.ne.jp ****@example.com 'http://example.com/post-pictogram.cgi'
2. perl tools/scrape_convert/send-all-pictogram.pl kddi *****@ezweb.ne.jp ****@example.com 'http://example.com/post-pictogram.cgi'
3. (docomo | kddi)デバイス上でそれぞれ)*****@softbank.ne.jpに転送
4. softbankデバイス上でそれぞれのメールを*****@yahoo.co.jpに転送(要Yahoo!アカウント)
5. Yahooメールにアクセスしてそれぞれのメールのhtmlを保存(e2s.html, i2s.html)
6. perl tools/scrape_convert/scrape_convert/scrape_softbank_from_yahoomail.pl < e2s.html > dat/conv/e2s.yml
7. perl tools/scrape_convert/scrape_convert/scrape_softbank_from_yahoomail.pl < i2s.html > dat/conv/i2s.yml

やってみるとなかなか面倒ですね・・・。

ちなみにdocomo以外がwebにポストする方式をとっていないのはうちの検証端末では

kddi,softbankともにコピーの容量に制限があり面倒だったからです・・・。

なぜかdocomoは大丈夫だった。

あー、最後に。convert-map-utf8.yamldiff

Index: dat/convert-map-utf8.yaml
===================================================================
--- dat/convert-map-utf8.yaml	(リビジョン 5755)
+++ dat/convert-map-utf8.yaml	(リビジョン 5756)
@@ -5667,10 +5667,10 @@
   F0A9:
     docomo:
       type: name
-      unicode: ' '
+      unicode:  
     softbank:
       type: name
-      unicode: ' '
+      unicode:  
   F0AA:
     docomo:
       type: name
@@ -8094,55 +8094,27 @@
     kddi:
       type: name
       unicode: 〓
-  E254:
-    docomo:
-      type: name
-      unicode: 〓
-    kddi:
-      type: name
-      unicode: 〓
   E255:
     docomo:
       type: name
-      unicode: 〓
+      unicode: ''
     kddi:
       type: name
-      unicode: 〓
+      unicode: ''
   E256:
     docomo:
       type: name
-      unicode: 〓
+      unicode: ''
     kddi:
       type: name
-      unicode: 〓
+      unicode: ''
   E257:
     docomo:
       type: name
-      unicode: 〓
+      unicode: ''
     kddi:
       type: name
-      unicode: 〓
-  E258:
-    docomo:
-      type: name
-      unicode: 〓
-    kddi:
-      type: name
-      unicode: 〓
-  E259:
-    docomo:
-      type: name
-      unicode: 〓
-    kddi:
-      type: name
-      unicode: 〓
-  E25A:
-    docomo:
-      type: name
-      unicode: 〓
-    kddi:
-      type: name
-      unicode: 〓
+      unicode: ''
   E301:
     docomo:
       type: pictogram
@@ -9599,52 +9571,3 @@
     kddi:
       type: pictogram
       unicode: F06A
-  E538:
-    docomo:
-      type: name
-      unicode: 〓
-    kddi:
-      type: name
-      unicode: 〓
-  E539:
-    docomo:
-      type: name
-      unicode: 〓
-    kddi:
-      type: name
-      unicode: 〓
-  E53A:
-    docomo:
-      type: name
-      unicode: 〓
-    kddi:
-      type: name
-      unicode: 〓
-  E53B:
-    docomo:
-      type: name
-      unicode: 〓
-    kddi:
-      type: name
-      unicode: 〓
-  E53C:
-    docomo:
-      type: name
-      unicode: '[v'
-    kddi:
-      type: name
-      unicode: '[v'
-  E53D:
-    docomo:
-      type: name
-      unicode: oda
-    kddi:
-      type: name
-      unicode: oda
-  E53E:
-    docomo:
-      type: name
-      unicode: 'fone]'
-    kddi:
-      type: name
-      unicode: 'fone]'

まぁ気にしなくていいレベルかな?

type: pictogramには差異がなかったのでucmには変化なかったです。

テンプレートに絵文字をどう書く? 21:21

SoozyConference4にいってきました。

刺激を受けるのを通り越して自分のへぼさに凹んでいたのですがそんなことはおいといて

懇親会の隅っこのほうでid:tomi-ruさんやid:tokuhiromさんとテンプレートに絵文字をどう記述する?なんて話をしていました。

自分はテンプレート自体がShift_JIS(CP932)で絵文字もDoCoMoの絵文字のShift_JISバイナリをi絵文字からはっつけているなんて話をしてたところテンプレートもUTF-8で絵文字は実体参照なんてのが主流っぽくて自分のやり方はださいのかー。とまた凹んでいました。

Shift_JISバイナリを埋め込むためにテンプレートだけShift_JISにしてる人おおいよね」(俺か)なんて話もあり。

コードはUTF-8なのにテンプレートはShift_JISってやっぱ気持ち悪いよね。たしかに。

自分も実体参照に移行しようかなぁなんて思ってたところ、ふとさっき気づいたことが。(前振り長すぎ)


DoCoMoの絵文字ってCP932の完全なサブセットじゃん。と。


いままでそのことを意識せず恩恵を受けてたわけで。x-utf8-docomoでencodeされたページをi-絵文字のフォントいれてるPCで見るとちゃんと絵文字みれていたのだ。そもそもi絵文字には「SHIFT-JISの形式で挿入」なんて選択肢になってるので騙されてたけど実際にはWindowsは内部的にはUnicodeなわけで。


というわけでどうなったか。

テンプレートをUTF-8にしてそこにi絵文字からUTF-8バイナリな絵文字をはっつけることできたよ><

ちゃんと絵文字フォントも表示されてるよ><

実体参照もいいけどやっぱり視覚的に確認したいよね><

というわけで、絵文字onテンプレートのベストプラクティスはUTF-8バイナリで記述だという主張をしてみる。


←ちなみにこれがDoCoMoの晴れマーク。(はてなはUTF-8

BulutBulut2012/09/23 19:42Woot, I will cetrailny put this to good use!

iplzkqvxlpeiplzkqvxlpe2012/09/24 11:08L1IYbX <a href="http://pbbtobruwdii.com/">pbbtobruwdii</a>

ztsdaujzvztsdaujzv2012/09/27 08:10DJ5jza , [url=http://fawbzydqjyvp.com/]fawbzydqjyvp[/url], [link=http://stofqmrmlhmx.com/]stofqmrmlhmx[/link], http://niugdrkbjwcd.com/

 |