パスワードを忘れた? アカウント作成
263634 story
テクノロジー

Unicode 6.0で絵文字が採用される 96

ストーリー by hylom
これで携帯メールの文字化けも解消……されるのかな 部門より

cvmonto 曰く、

InternetWatchの記事によれば、Unicode ConsortiumがUnicode Version 6.0を策定し、携帯電話で利用される絵文字が「emoji」として取り入れられたそうだ。記事には絵文字用のCode Chartsが掲載されているが、スマイルなどの感情、様々な動物などが含まれていることが分かる。

絵文字のUnicode化にまつわる経緯についてはCNETの『絵文字が開いてしまった「パンドラの箱」』シリーズ記事が詳しい。また、今月18日より開催されるThe Internationalization and Unicode Conference (IUC) にて、GoogleやAppleの担当者らがこれについて講演を行うそうだ。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by manmos (29892) on 2010年10月14日 18時44分 (#1840473) 日記

    Summaryでは

    adds 2,088 characters, including
            * over 1,000 additional symbols—chief among them the additional emoji symbols, which are especially important for mobile phones

    なっておりますので、まさに絵文字のための拡張なんですね。ガラパゴス恐るべし。

    iPhoneもSMS/MMSにの時だけ絵文字キーパッドが現れるのですが、他のアプリでの入力でも絵文字キーパッドが現れることになるのでしょうか?

    • by Anonymous Coward

      >ガラパゴス恐るべし。
      むしろ「Googleおそるべし」だと思う。

      DoCoMoもSoftbankも、Googleという巨人の前には赤子同然なのではあるまいか。

      • by Anonymous Coward

        グローバルスタンダード化として「何でも取り込む」という方針を持って来られたら、ガラパゴス化で閉じこもる事はもう無理ですからね。

  • by Anonymous Coward on 2010年10月14日 19時52分 (#1840540)

    個人的発見としては,トランプのCカードなんてあったんだとか,歴史的な仮名って何これとか,
    干支が国によってこんなに違うのか,などがありました。

  • by Anonymous Coward on 2010年10月14日 19時03分 (#1840487)

    日本発のケータイ絵文字が世界標準に Unicode 6.0で [itmedia.co.jp]という題名にしておりますが、あくまでも過去のインフラとの相互運用性、互換性を確保するのが狙いであって、別に威張れるような話ではないと思うのですが。

    • 威張れはしないかも知れないけど、他の多バイト言語圏にはない独特の文化でしょう。
      テキストしか書けない入力領域に、絵を入れたい、という要求。
      それが携帯キャリアで実現しちゃう、という文化。
      AAも根っこは一緒な気がします。
      絵が好きな民族なんですよ、日本人って。

      親コメント
      • by nox_dot (11614) on 2010年10月14日 20時07分 (#1840555) 日記

        漢字自体が絵文字ですから、なじみやすいでしょうね。

        親コメント
      • by Anonymous Coward on 2010年10月14日 21時54分 (#1840657)

        とはいっても、☀☁☂☃☄という絵文字は元々割り当てられているんですけどね。

        親コメント
      • by Anonymous Coward on 2010年10月15日 0時06分 (#1840743)

        今回の件は例えれば、それぞれの藩で独自の方言でしゃべってたところ、
        海外から黒船が来航して司令官におまえらの国の標準語を作ってやったぞ、
        おまえらは、これからはコレを使えって言われた状態。

        それぞれの携帯会社が後先考えずにベンダー依存で拡張したのを
        歩み寄って統一の符号表を作り出さずということを怠り
        海外の組織であるGoogleが言い出し、
        やっと標準化に至ったという経緯は
        威張れないどころか穴があったら入りたいレベルの恥ずべきことだと思います。

        親コメント
      • by Anonymous Coward on 2010年10月14日 23時19分 (#1840708)

        なんで根拠もなく国民性や民族性のせいにするかなあ。

        日本に独特だってこと、本当なんですか?

        たとえばIBM-PCの文字セット [wikipedia.org]には、顔、トランプのマーク、音符などがありますよ。

        親コメント
      • 日本発、日本起源とは言えても、日本が主導して標準化したと言えないところに日本企業の閉鎖性を感じるんだな。
        日本の外の世界では「GoogleとAppleがまた変なこと始めた」としか思われないのではないでしょうか。

        そして絵文字の起源はいつの間にか韓国辺りにすり替わっていきそうになるも、60億人の人々はさして疑問に思わなかったりして。
        家電のシェアを考えたら、案外笑い事では済まんと思うが、絵文字の起源が日本じゃなくなっても、日本人が困ることはないか...。

        親コメント
      • Wingdings とか、 Webdings をみれば、
        「テキストしか書けない入力領域に、絵を入れたい、という要求。」
        が日本独自でないという風に思えますが。

        親コメント
    • by Anonymous Coward

      絵文字の中には串団子や麺類の丼が含まれているわけで、これを使って欧米人が日本人と同じ情報量をやり取りできるとは思えない。となると、将来の拡張は必至という恐ろしい未来予想図が待っている。

      一方で、現行バージョンの絵文字が日本人向けに特化していることは確かだから、これが現代日本の風俗を端的に捉えたスナップショットになっている、とも言える。その記録がずっと残るわけだから、やっぱり日本人にとっては得、なんじゃないかな。何にしても番号が若いってのはいいことだよ。

      欧米向けにはトランプが入っちゃったから、タロットはどうなるんだろう、とか気になるけれども。今回追加された片仮名の「衣」と平仮名の「江」よりは利用者が多いだろうし。

  • by t_mrc-ct (5292) on 2010年10月14日 21時33分 (#1840647) 日記

    1F5FE - SILHOUETTE OF JAPAN (日本列島のシルエット)

    こりゃ、フォントサイズを超巨大にして、隅っこにある点の数を数える奴らが一部地域で続出するな。

    # ちなみにUnicode.org本家版 [unicode.org]では、北方領土は入ってるようにみえる。

  • だけど個人的には採用されてほしくなかったなー

    # 文字集合,文字セット,文字エンコードについてOSI7層構造みたいな分割統治がうまくいってない気がするんだよなぁ

    まあ、これでますますUTF-8化が進んで、メールで問題減るなら、それはそれでいいか。

    --
    M-FalconSky (暑いか寒い)
    • by kappie (9734) on 2010年10月14日 23時50分 (#1840730) ホームページ 日記

      RFC 2130 [ietf.org]というのがあって、

      ユーザーインターフェイス

      • レイアウト
      • 文化
      • ロカール
      • 言語

      オンザワイヤ

      • 伝送文法
      • 文字符号化スキーム
      • コード化文字集合

      という7階層で分割統治されております。Unicodeはコード化文字集合、UTF-8は文字符号化スキーム、BASE64は伝送文法に相当します。

      to be to be ten made to be

      は、日本語だと指定するのが言語層、

      01/02/03

      が2001年2月3日だと指定するのがロカール層、みたいなことです。

      IAB発行とはいえ、informationalな文書なので規格とはいえず、まぁ、RFC作るときに参考にしようね、という程度ですかね。

      --

      /K
      親コメント
      • ああ、この規格は知りませんでした。
        まずは感謝を。

        その上での返信なのですが

        > という7階層で分割統治されております。Unicodeはコード化文字集合、UTF-8は文字符号化スキーム、BASE64は伝送文法に相当します。
        層としては大体はいいんですが、例えていうならTCP/IP上にHTTP/SMTP/...が上手く混ぜて通信できるみたいに
        UCS-2などの文字集合(TCP)に入れる言語セット(HTTPとか)は自由でそれぞれのバージョンあり、みたいなのができてないなと。

        Unicodeに含まれる日本語の改訂とかで揉めたりしますけど、できれば日本語は日本語として整備を進めれればいいし、それをある利用のための集合に入れる時に適切に互換をもちつつピックアップ&写像(射影か?)できれば、なんというか、多少は問題が減るんじゃないかとか思ってて。

        じゃないと、すべての*言語*を収録した...Unicodeに絵文字(言語的背景があんまりない)っていうのが座りが悪くて。

        XML文書に好きなスキーマ混在できる、みたいなのが近いかな?
        すべての文字表現物の集合ルールのVer.X.Yとかならあんまり違和感ないし、場合によって収録されてない字とか出ても、その時の表現能力の限界があったと思えばそれはそれでいいや、とも思えるんですけどねぇ...
        住基とかで必要ならEx-UCS-8とか互換ルール&日本語ローカルな内部規格使うぞーみたいなのが、うまく擦り合うことができるんじゃないかなとか。

        # ほぼグチです...御目汚し失礼

        --
        M-FalconSky (暑いか寒い)
        親コメント
  • 日本人的感性(つーかアニメ・漫画世代的感性)からすると、ちょっと使いたくないというか、文中にこんなシンボルが混ざってたらヤだなぁ、と思ってしまうようなのが混ざってますね。
    • 1F4A9のことか〜!

      と脊髄反射ののち念のためググってみたら1F4A9の原典は鳥山明ではない [bit.ly]らしい。

      そもそもこれ、一瞥してそれと認識できるほどの万国共通の普遍的なシンボルなの?
      だとしたらそっちのほうがこのニュースより衝撃なんですけど・・・。

      --
      Youthの半分はバファリンでできています。
      親コメント
      • by Anonymous Coward on 2010年10月14日 21時27分 (#1840639)
        例えば、ページのタイトルを、

        □□□ Welcome □□□

        というデザインのふりをして、

        💩💩💩 Welcome 💩💩💩

        と書いておくとか。実際に書くと(/.のシステムがこの書き方の実体参照を通してくれると仮定して)、

        💩💩💩 Welcome 💩💩💩

        こんな感じ。書き込み時点、Unicode 6.0未対応の間は、IEだと「□□」、Chromeだと「□」っぽくレンダリングされるのでぱっと見は問題のないページに見えます。 が、時間が経って、Unicode 6.0対応の環境でブラウジングするとあらどっきり。

        Webのデザインを他社に委託したりした場合には慎重な検収作業が求められますね。 まあ、そんな信用できない相手に仕事として委託する状況というのは分かりませんが・・・友人・親戚縁者からのお願いとかだと、仕込まずに済ませる自信がありません。

        ちなみに、FireFoxは「□」の中に文字コードを入れた表示になって、「これ、なんか謎の文字ですよ、気をつけて」と教えてくれるのでセキュアですね。
        親コメント
      • by tensu (34456) on 2010年10月14日 20時56分 (#1840609)

        「とりやま」でないなら「とりい」かもしれない。

        親コメント
  • 私がUnicodeへの絵文字の導入に反対する理由はたくさんあるのですが,一番致命的だと感じるのが以下の絵文字の導入です。

    • 1F499 BLUE HEART
    • 1F49A GREEN HEART
    • 1F49B YELLOW HEART
    • 1F49C PURPLE HEART

    これらは形は全く同一でありながら表示色が違うことを理由に別のコードポイントを与えられた絵文字です。これらの存在は「文字コードとは何か」「文字コードを表示するためのフォントの設計はどうあるべきか」という問題において深刻な影響をもたらします。Unicodeの設計思想が根本的に崩壊する危険すらあります。

    何故こんなものをいれてしまったのでしょうか?

    • んですよ。ガラケーがそれら文字を送ってくる限り、ガラケーが打ち出した絵文字が歴史から消えない限りUnicodeに収録しなければならないんです。ただUnicodeではそれらの「色」は文字の意図を示すもので、フォントの色とは関係がないということにしているようです。

      親コメント
      • >ガラケーがそれら文字を送ってくる限り、
        そう,それが諸悪の根源で,そもそも各キャリアは絵文字をインターネットの世界に垂れ流すべきではなかった。

        いまでも私は絵文字は「文字」に対応づけるのではなく「文字列」に対応づけるべきだった,思っています。つまり,ナルトの絵文字はU+1F365という「文字」ではなく[au:なると]のような「文字列」に変換されるべきです。

        そして,これらの変換はキャリアがGW上で実行するべきです。

        親コメント
    • 同様に,色の違いで異なる文字とされたモノ。

      • 1F4D7 GREEN BOOK
      • 1F4D8 BLUE BOOK
      • 1F4D9 ORANGE BOOK
      親コメント
  • 超漢字が持っている、iモード絵文字を表示できるという優位性が薄らいでしまいますね。
    http://www.chokanji.com/features/moji.html [chokanji.com] 超漢字Vで扱える文字
    ユニコード6.0 ←→ iモードの互換テーブルが早々に出てきそうです(絵文字の送受信を可能にするために)。
  • by Anonymous Coward on 2010年10月14日 19時42分 (#1840530)

    カード(トランプ)の絵柄とか、錬金術のシンボルとか増えてますね。

typodupeerror

皆さんもソースを読むときに、行と行の間を読むような気持ちで見てほしい -- あるハッカー

読み込み中...