Hatena::Groupmobilehacker

tokuhiromの日記 RSSフィード

 | 

2008-01-19

willcom と3キャリの絵文字変換マップについて 13:49 willcom と3キャリの絵文字変換マップについて - tokuhiromの日記 を含むブックマーク はてなブックマーク - willcom と3キャリの絵文字変換マップについて - tokuhiromの日記 willcom と3キャリの絵文字変換マップについて - tokuhiromの日記 のブックマークコメント

2008-01-22(Tue) から willcom と3キャリの間でメールでの絵文字相互変換がおこなわれます。

http://www.willcom-inc.com/ja/corporate/press/2008/01/17/index.html

これによって、

のあたりの表が22日には更新されるでしょう。

そうなったらば、PDF からデータをぬきだして YAML の表をつくる。予定。だれかが。

(ThirdForce は出遅れるらしいけど)

xdoc2txtの-n

【追記】

→ とおもったら、案の定というか、なんというか、docomoの絵文字に変換されてるね。

Moxy::Plugin::Pictogram を全面的に書き直した 13:09 Moxy::Plugin::Pictogram を全面的に書き直した - tokuhiromの日記 を含むブックマーク はてなブックマーク - Moxy::Plugin::Pictogram を全面的に書き直した - tokuhiromの日記 Moxy::Plugin::Pictogram を全面的に書き直した - tokuhiromの日記 のブックマークコメント

HTML::ReplacePictogramMobileJp をつかうようになおした。というか件のモジュールは、Moxy::Plugin::Pictogram をなおすためにつくったのだ。Moxy::Plugin::Pictogram は複雑なことやってるわりにテストコードがないし、utf8 対応させようとおもったら結構めんどかったので、モジュールとして分離させたのだ。

use Path::Class;
use strict;
use File::ShareDir 'dist_file';

my $f = dist_file 'Encode-JP-Mobile', 'docomo-table.pl';
my $dat = do $f;

for my $row (@$dat) {
    printf "mv assets/server/pictogram/i/%d.gif assets/plugins/Pictogram/image/I/$row->{unicode}.gif\n", hex $row->{sjis};
}

my $f = dist_file 'Encode-JP-Mobile', 'kddi-table.pl';
my $dat = do $f;

for my $row (@$dat) {
    print "mv assets/server/pictogram/e/$row->{number}.gif assets/plugins/Pictogram/image/E/$row->{unicode_auto}.gif\n";
}

for my $file (dir('assets/server/pictogram/v/')->children) {
    my $base = $file->basename;
    $base =~ s/\.gif$//;
    printf "mv $file assets/plugins/Pictogram/image/V/%X.gif\n", $base;
}

こんな感じのスクリプトで絵文字ファイルの位置を assets/server/pictogram/[iev]/ から assets/plugin/Pictogram/[IEV]/ に移動。ファイルの命名規則も適当でバラバラだったのを Unicode のコードポイント16進に統一。

もともと assets/server/pictogram/ にファイルがあるのは historical reason でしかない。ファイルの命名規則がバラバラなのは、バグの原因にもなるし、いつかかえようと思っていたのだった。

HTML-ReplacePictogramMobileJp-0.01 released 13:03 HTML-ReplacePictogramMobileJp-0.01 released - tokuhiromの日記 を含むブックマーク はてなブックマーク - HTML-ReplacePictogramMobileJp-0.01 released - tokuhiromの日記 HTML-ReplacePictogramMobileJp-0.01 released - tokuhiromの日記 のブックマークコメント

HTML-ReplacePictogramMobileJp-0.01 リリースしたよ。これはなにかっていうと、HTML 中に含まれる絵文字らしきものを置換できるっていうツール。

    use HTML::ReplacePictogramMobileJp;

    HTML::ReplacePictogramMobileJp->replace(
        carrier  => 'V',
        html     => "",
        charset  => 'sjis', # or utf8
        callback => sub {
            my ( $unicode, $carrier ) = @_;
            # なにかする
        },
    );

みたいにしてつかう。

Moxy::Plugin::Pictogram から機能をきりだした。Moxy::Plugin::Pictogram は結構複雑なことをやってるのにテストがまったく無くてメンテ不能だったので。

Encode::JP::Mobile をつかって、若干不正確ではあるけど、それなりに実用的なものにした。

 |