Vim 6.0 正式リリース

Re:ロケール自動認識 (スコア:4, 参考になる)

by kubota (64) on 2001年09月28日 19時51分 (#25688) ホームページ日記

Unicode →　EUC-JP(および他の日本語系エンコード)
のマッピングにおいて、ポンドがいわゆる全角ポンドにマッピングされるようになっているんでしょうね。

えっと、きちんと説明しましょう。EUC-JP には、ポンド記号はひとつしかありません。JIS X 0208 に含まれているもので、通常は全角文字の扱いになります。

一方、Unicode には、通常の「ポンド記号」U+00A3 £ のほかに、｢全角ポンド記号」U+FFE1 ￡があります。EUC-JP のポンド記号「￡」をどちらに割り振るか、には、ふたとおりの考えができます。

EUC-JP のポンド記号は通常全角で使われるので、「全角ポンド記号」 U+FFE1 に変換すべきだ。
Unicode の互換領域の文字は、正規の文字がすでに別の文字からの変換で使われているときに、round-trip compatibility を保つためだけに存在するので、正規のポンド記号 U+00A3 が使われていないのならそちらに変換すべきだ。

ぼくがまとめたもの [debian.or.jp]を見てもらえるとわかるように、マイクロソフトは前者、ほかは後者の考えをとっているようです (実際には、変換テーブルの混乱が見られるのは Shift-JIS 系のコードですが、Shift-JIS と EUC-JP の JIS X 0208 部分は計算式で変換するものなので、EUC-JP もその混乱の影響を受けます)。ただし、これらの変換表は Unicode Consortium によって obsolete とされてしまいました。ちなみに、Unicode Consortium 公式と思われるこのコメント [unicode.org]は、前者の考え方に立っているようです。

次に、Unicode の各々の文字のどれを全角、どれを半角にするか、という問題ですが、Unicode Standard Annex #11 East Asian Width [unicode.org] という文書があります。それは、すべての Unicode 文字を、「半角｣｢全角」｢文脈依存」に分けます (ほんとはもっとたくさんに分けるのですが)。で、U+00A3 は「半角｣に分類されています。

｢文脈依存」に指定されている文字には、たとえば記号の多くやロシア文字があります。EUC-JP ではロシア文字や記号の多くは全角で表示されますから。

ところが、ポンド記号は、対応する全角ポンド記号が Unicode に定義されているために、半角に指定されています。これが問題のもとです。これを解決するには、

ポンド記号は半角で表示するものと、日本人が考えを改める
変換テーブルを改変し、｢全角ポンド記号」にマッピングするようにする
EastAsianWidth を改変し、U+00A3 を「文脈依存｣にする

の3とおりの解決法があります。いずれにしても、全世界で統一した解決法をとるべきです。

ところで (忘れてた)、現バージョンの XTerm は、｢ポンド半角問題」のような複雑な問題だけではなく、もっと単純な問題も抱えています。それは、｢文脈依存」に指定されている文字を必ず半角に割り振っている、ということです。Robert Brady さんが作ってぼくがちょっとだけ手直しした xterm-152-27 [debian.or.jp] では、ロケール自動認識に加え、文字幅モードも複数用意するなど、いちおう使える (ただしポンド半角問題は Unicode の定義と変換テーブルの問題なので、XTerm 単体では解決しない) ところまできていました。しかし、XFree86 に巣食う、UTF-8 以外は使いにくくなければならないという信念に基づいて行動しているとしか思えない人々のせいで、それは棚上げとなっています。

というわけで、XTerm では、ポンド記号以外にも、非常に多数の記号において、全角で表示したいものが半角になってしまうという問題があるのでした。

Re:ロケール自動認識 (スコア:3, すばらしい洞察)

by kubota (64) on 2001年09月29日 11時24分 (#25874) ホームページ日記

規格としては、変換表は規格外ということだろうと思いますが、実際にはみんなで合わせた方がいいに決まってます。まあ、｢世の中全部を一社の製品で統一したら幸せになれるよ」という意見の MS 以外は、それに賛同してくれると思います。

ところが、実情として、日本語に関する変換表の実装状況の混乱ぶりは、目に余るものがあります。過去の時点のことをいろいろと指摘することもできるでしょうが、いまや、この混乱ぶりは、自社製品の首尾一貫性を守りたいベンダー同士の激しい対立のために、ほとんど絶望的な状況にあるらしいです。

しかしそれはベンダーの思惑。こっちとしては、どうしても統一された変換表がほしい。というわけで、Unicode Consortium にこの文書 (Comments on the release of Unicode 3.1.1 の部分) を示して問い合わせたところ、11月の Unicode 技術委員会で議題にするとの返事をもらいました。まあ、問題が存在するという現状を公式に認識してくれるかどうかさえ、あまり期待できないとは思うのですが、どんな返事が返ってくるか、楽しみではあります。

というわけで、みなさん、「この問題を注目している人はたくさんいるのだ」ということを示すためにも、info＠unicode.org とか宛てに問い合わせをしてください。よろしくおねがいします。みなさん、「自分は英語が下手だし」とか「誰かがしているだろうから」と言わないでください。ぼくも最初はそう思っていたんです。こんな重大な問題は、ぼくが指摘するまでもなく有識者がすでに Unicode Consortium に問い合わせまくっていて、その結果が現状なのだと思っていたのです。それが、驚くべきことに、メールを出してみたらそれに対する動きがあったのです (このコメントとかのことを言っています)。ということは、Unicode 問題の有識者たちは日本国内で日本語で日本人相手に、Unicode Consortium には見えないところで影でこそこそとアジテーションしていただけだ、ということを意味するのではないかと思っています。

繰り返しますが、みなさん、Unicode に対して不満があれば、ここに書くだけではなくて (もちろん、ここに書くこと自体は歓迎だけど)、Unicode Consortium に直接言ってください。

ロケール自動認識 (スコア:2, 参考になる)

by kubota (64) on 2001年09月28日 8時55分 (#25469) ホームページ日記

最大の特徴 (とぼくが考えるもの) は、ロケール自動認識です。つまり、LANG=ja_JP.eucJP (Linux の場合) では、デフォルトの動作が EUC-JP を使った日本語になります。というか、これ基本でしょ。ぼくは、ロケールを認識しないソフトはすべてバグだと考えてるから、ようやく vim もバグがとれた、という考えです。

ちなみに、EUC-JP ロケールにおいて、いわゆる半角カナ、つまり、JIS X 0201 カナも使えます。うちの Debian GNU/Linux Sid では、JIS X 0212 文字はだめでした。ただしこれはシステムのほうのサポートがないからで、vim そのものとしては機能はあるはずだと思っています。 EUC を自力で実装したソフトウェアの多く (emacs や kterm を除く大部分) は、JIS X 0201 カナや JIS X 0212 はどうせ使わないからといって省略されているのが実状ですが (いや、実際ほとんど使わないので実状としてさほど間違ってはいないと思いますが)、 vim 6.0 は Unicode を内部コードとして使っているので、 JIS X 0208 をサポートするのも JIS X 0212 をサポートするのも同じ手間で済んでしまうのです。

ところで、Unicode ベースということで心配される、 JIS X 0208 のポンド記号などが半角になってしまう問題ですが、これは、問題なく全角で表示されています。といっても、半角になっても規格上は間違ってないのですが (そして、日本人の中でも意見が分かれるところだと思いますが)、これまでの運用の実績を考えると、少なくとも ja_JP.eucJP ロケールにおいては全角にするのが妥当でしょう。ちなみに、gtk 版でもきちんと全角になります。どうやって実装してるんでしょう... と思いきや、gtk 版は XFontSet を使っているようです。ちなみに、ja_JP.UTF-8 ロケールではどうか、ですが、 XFontSet を使っている関係上、gtk 版はうまく動いてくれません。ちなみに、xterm -u8 上では、xterm そのものがポンド記号を半角で表示してしまうので、vim がいくらあがいても無理です。

JIS X 0212 は使えます。 (スコア:2, 参考になる)

by kubota (64) on 2001年09月28日 11時00分 (#25484) ホームページ日記

あとで確認したら、ja_JP.eucJP ロケールで kterm 上で JIS X 0212 も使えました。14 ドットの JIS X 0212 フォントを持ってなかったので、24 ドットに切り替えての話ですが。

Debian な人は (スコア:2, 参考になる)

by kubota (64) on 2001年09月28日 11時09分 (#25486) ホームページ日記

vim パッケージのメンテナである Wichart Akkerman さんがテストパッケージを作っていますので試してみましょう。

って、よく読むと、もうじき Debian アーカイブにも現れるって書いてあるぞ。Woody には入れるつもりですか、って変な質問してしまったなあ (反省) (現時点ではまだウェブ上のメーリングリストアーカイブには現れてないけど)。

じゃあ Emacs の宣伝をしてよ (スコア:2, 興味深い)

by kubota (64) on 2001年09月28日 15時46分 (#25573) ホームページ日記

「そんなにいいもの？」っておっしゃいますが、ロケール自動認識はいいですよ。Rxvt もそうなりました。いま、同じ手法を使って Eterm もロケール自動認識にしたいなあと妄想中。Rxvt の該当部分のソースを流用するのもいいけど、ライセンス確認しなくちゃ。

GNU Emacs も 21 からロケール自動認識になるとか言う噂があります。というか、emacs-hogehoge＠gnu.org とかにメールして確認済み。ただ、emacs -nw 時にターミナルとのやりとりに使うエンコーディングはロケール自動認識になるそうですが、ファイルのエンコーディングについては、emacs 自身が持つ自動認識機能とのからみで、どうなるのか分かりませんが。

ついでに、X Window 上で走らせるときも、フォントセットがデフォルトになって日本語とかも設定なしで表示できるようになるらしいです。(というか、現状だと日本語はおろかロシア語もギリシャ語もポーランド語も表示できない。つまり、ISO-8859-1 しか表示されない。ダメすぎ)。

で、Emacs 派な方で、このへんとかをもうちょっと詳しく知っている方はいらっしゃいますか? 「GNU Emacs 21 はこんなにすごくなるんだから Vim なんか使うのやめなさい」とか :-)

少々ならいがみあうのも構わないとは思いますが、お互い高めあってほしいものです。

Re:じゃあ Emacs の宣伝をしてよ (スコア:2)

by mera (2504) on 2001年09月28日 16時24分 (#25598) ホームページ日記

ご説明ありがとうございます。

＞少々ならいがみあうのも構わないとは思いますが、お互い高めあってほしいものです。

同感ですね。私は Emacs にいいところがあるから好きというよりも、Emacs キーバインドが体に染み付いているので、Emacs キーバインドで vim が使えるなら多分使うでしょうね(笑)

--
すらど宴会SNS開放中 [e-meet.jp]

VIMを EMACS 風にするVIMスクリプト (スコア:2, 参考になる)

by lss (2577) on 2001年09月28日 19時44分 (#25685) ホームページ日記

http://www.vim.org/source/に、 VIMを Emacs 風にするVIMスクリプト「emacs.vim」というのがあります。
そういうものも活用してみてはいかがでしょう。

Re:ロケール自動認識 (スコア:2, 参考になる)

by numa (4467) on 2001年09月29日 8時29分 (#25850) ホームページ日記

ぼくがまとめたものを見てもらえるとわかるように、マイクロソフトは前者、ほかは後者の考えをとっているようです (実際には、変換テーブルの混乱が見られるのは Shift-JIS 系のコードですが、Shift-JIS と EUC-JP の JIS X 0208 部分は計算式で変換するものなので、EUC-JP もその混乱の影響を受けます)。ただし、これらの変換表は Unicode Consortium によって obsolete とされてしまいました。ちなみに、Unicode Consortium 公式と思われるこのコメントは、前者の考え方に立っているようです。

というか，Unicode Consortium 自体，既存のコードセットとの間の変換についてはあまり考えていなかったのではないかと思います．Round-trip conversion ができるように，文字だけは収録するけれど，変換表は勝手に自分で作れということで．

Microsoft のコード変換も，もともとは Windows 3.x の頃に Unicode Consortium で公開されていた変換表をそのまま使っただけのものですし，その後 JIS X 0221-1994 が出ると Unicode Consortium は自分の公開していた変換表を何のコメントもなくさっさと差し替えてしまいました． (ほとんど JIS に合わせておいて，なぜか「―」の所だけ変換ルールを変えるのが気持ち悪い．)

実際，コード変換表は "The Unicode Standard" の一部ではないというのが，今も昔も，Unicode Cosortium の公式なスタンスだと思います．公開している変換表は，あくまでも「参考」ということです．(でもなければ，上記のようなことはできないはず．)

ISO 8859 系の変換表でも，たとえば Kosta Kostis の ISO/IEC 8859 Character Encoding Information で指摘されているような問題があります．

Re:どうせなら (スコア:2)

by zeissmania (3689) on 2001年09月29日 17時39分 (#25937)

えーと？Solarisにはviありますよね？
viを立ち上げようとして、edモードに入ってしまった、ということでしょうか？ (^_^;;;;

Re:ロケール自動認識 (スコア:1)

by kubota (64) on 2001年09月28日 10時58分 (#25483) ホームページ日記

厳密に言うと、そのとおりです。ただ、困るバグとたいして困らないバグがあります。JIS X 0212 がサポートされていないといのはバグだって言ってあっちこっちの開発者を説得してまわったり、いろんなソフトウェアのパッチを書きまくったりするだけのモチベーションはない、というだけのこと。仕事でやってるんじゃないんだから。

<offtopic>
つまり、バグのことを「これはバグだ」と指摘するための発言行動をあえて実行する、ということは、単なる客観的な没価値的な事実の指摘ではなく、その事実に対して意味付けを行う行動なのです。(これはぼくの発言が、というだけではなく、すべての人のありとあらゆる意味のある発言がそうなっているはずです。たとえば、ぼくがここでいきなり今日の朝食について議論を始めたらオフトピックというか意図がわからなくて「はぁ？」って思うでしょう? それはつまりあなたが、発言には意図が必要だと思っているから、意図がわからないと「はぁ？」となるわけです)
</offtopic>

実際、JIS X 0212 まわりはよく知らないけど、JIS X 0213 とのからみでどうなってくるかわからないです。技術的な興味としては、JIS X 0213 が JIS X 0208 に対して包摂規準が変更になっている文字が多数あるというところが興味深そうだが、ぼく自身はそこまで細かいことを必要としないので、純粋な技術的興味にとどまっています。第一、ぼく自身、JIS X 0212 や JIS X 0213 の文字に対する需要を今のところは持っていないし。

このあたりの技術の動向は、どうなっているのでしょうか。JIS X 0212 と JIS X 0213 (の第3・第4水準) は排他的な関係にありますが、JIS X 0213 が普及して JIS X 0212 は死んでしまうのでしょうか。それとも、JIS X 0213 は普及せずに現状のまま (JIS X 0212 が細々と生きている) で終わってしまうのでしょうか。あるいは、JIS X 0213 は Unicode Consortium に「この文字を追加しろ」と要求する際の口実としての役割を終えたら舞台から消えるのでしょうか。

Re:ロケール自動認識 (スコア:1)

by dcdc (4077) on 2001年09月28日 11時23分 (#25488) ホームページ日記

アプリケーションレベルで、ある文字コード体系をきちんと認識して使えるかどうか(能力・機能があるか)と、
表示系，入力系なども考慮して、ある文字コード体系をきちんと使って運用できるかを分けて考えないと
どこで何を実装して欲しいのかがはっきりしないような。

UnicodeにしてもJIS X 0212にしても、サポートされたんなら追加された文字を便利に使えるように
入力系も良くなっているとイイなぁ、とか思いますし。

--

本当かい♪本当かい♪

Re:ロケール自動認識 (スコア:1)

by nitonito (2431) on 2001年09月28日 12時39分 (#25503)

このあたりの技術の動向は、どうなっているのでしょうか。JIS X 0212 と JIS X 0213 (の第3・第4水準) は排他的な関係にありますが、JIS X 0213 が普及して JIS X 0212 は死んでしまうのでしょうか。それとも、JIS X 0213 は普及せずに現状のまま (JIS X 0212 が細々と生きている) で終わってしまうのでしょうか。あるいは、JIS X 0213 は Unicode Consortium に「この文字を追加しろ」と要求する際の口実としての役割を終えたら舞台から消えるのでしょうか。

明日出荷されるMac OS X 10.1では、JIS X 0213サポートによる11,000文字対応を謳ってますので、そんなに簡単に消えられたら困るかも。Unicodeに入ってしまえば、消えてもいいのかも知れませんが。

そんないいいもの？ (スコア:1, フレームのもと)

by mera (2504) on 2001年09月28日 14時18分 (#25538) ホームページ日記

＞emacs? なにそれ？(とか言ってみる)

ま、冗談で言ってるんだろうけど　emacs なしには生きられない私にとって非常に不愉快極まりない一文だ、どうせならいいところをアピールして「んー、ちょっと使ってみようかな」と思わせる文章で締めくくった方がいいね。

vim?　なにそれ？

--
すらど宴会SNS開放中 [e-meet.jp]

Re:そんないいいもの？ (スコア:1)

by rug (55) on 2001年09月28日 14時44分 (#25552) 日記

> ま、冗談で言ってるんだろうけど　emacs なしには生きられない私にとって非常に不愉快極まりない一文だ
(中略)
> vim?　なにそれ？

こういうのをdouble standardというのでは?

まあでも、私も件の一文にはあまり感心しなかったね。挑発的な台詞を吐いて、その場を盛り上げようという意図があるのかもしれないけど、だとしても稚拙にすぎると思う。

Re:そんないいいもの？ (スコア:1)

by mera (2504) on 2001年09月28日 14時52分 (#25553) ホームページ日記

＞こういうのをdouble standardというのでは?

まぁ、それもあるけど「本当に知らない」ってのもありますね。余計な一言である事には違い無いですが。
ツールの選択肢が増えるのはありがたいのでどんなもんかチェックしてる最中だったりします。

--
すらど宴会SNS開放中 [e-meet.jp]

Vim and Migemo (スコア:1)

by rug (55) on 2001年09月28日 14時59分 (#25557) 日記

#Vim 6.0リリース記念ということで

村岡さんという人が Migemo をVimに組み込むためにCのライブラリとして書き直しています。バイナリ及びソースが村岡さんのpageから入手できます。

Re:ロケール自動認識 (スコア:1)

by yasushi (789) on 2001年09月28日 16時29分 (#25599)

「ロケール自動認識」ってありますけど、
実際にはcharsetの自動設定なんですよね。

「ロケール」というくらいなんだから、
メッセージやコマンドも日本語にしてくれないと。
:置換/ロケール/charset/
とか

# もちろん冗談ですよ^^;

ぜんぶ日本語 (スコア:1)

by kubota (64) on 2001年09月28日 16時37分 (#25605) ホームページ日記

メッセージやコマンドも日本語にしてくれないと。

｢日本語変換を開始する」というコマンドが日本語なんですけど、どうやって入力したらいいですか? :-p

正確には、LC_CTYPE ロケールの自動認識ですね。

Re:ぜんぶ日本語 (スコア:1)

by yasushi (789) on 2001年09月28日 17時17分 (#25626)

もちろん、日本語モードで起動しているはずなので切り換えは不要ですね。

Re:じゃあ Emacs の宣伝をしてよ (スコア:1, 余計なもの)

by mera (2504) on 2001年09月28日 17時51分 (#25644) ホームページ日記

Elispでガリガリカスタマイズする程に使い込んでんだけど、ACごときにゃいわれたかないね。

--
すらど宴会SNS開放中 [e-meet.jp]

Re:ロケール自動認識 (スコア:1, 興味深い)

by Anonymous Coward on 2001年09月28日 20時49分 (#25718)

にゃ。あ、そのあたり、基本的にはわかってますです。
# XTerm の実装は全然知りませんでしたが(^^;

私は半角全角を区別する考え方はナンセンスだと思って
ます。えーと、変換時の考え方としては原則「後者」
ですね。あと、まあ、「ポンド記号は半角で」ってこと
になりますか。正確には「新規文書中では互換文字は
使わない」なんですけど。

なので、Unicode にしたのなら、u+00A3 にするのが
当然だろうとおもって、前の記事のような内容になった
のですが･･････ってわかった。

新規文書の時でなくて、従来の文書を開いたとき
ってことっすね? それならわかります。
内部的に Unicode にするときにも「互換文字」に
わりふるように維持するってわけだ。ふむ。

強制的なコードの正規化(互換文字排除)はスイッチ
できるようになってると良いかも。ただ、その正規化
するかしないかが、ロケールによって勝手に決まると
むしろそれは混乱の元だと思います。
(新規ファイルのエンコーディング自体はロケール
で決定してよいと思う)

ということで、

○正規化の種別は次の三種類
a. 強制的に全部正規化
b. 正規化を設定ファイルで指定
　※これでたとえばポンドを正規化する/しないとか
　　半角かなや全角英数字の正規化ルールが選べる
c. 全く正規化しない
○正規化の種別は個別のエンコーディングで指定可能
(指定しない場合はデフォルト)
○エディタのデフォルトは a. の強制正規化。

このあたりが妥当ではないですかね。
コードの目的としては、互換文字は使わないに
こしたことはないのですから、デフォルトでは
排除方向でよいと思います。で、それが困る人は
その機能をＯＦＦにすればよろしいってことで。

しかしXTerm はこまったちゃんでのう。表示する場合には
互換維持の原則で、互換文字はそのまま表示するべき
だと思います。はい。

Re:じゃあ Emacs の宣伝をしてよ (スコア:1)

by oku (4610) on 2001年09月28日 23時21分 (#25760) 日記

それも程度問題でしょう。
私は vi 派ですが emacs で vip や viper は使いません。まあ、これはせいぜい canna-touroku と trr にしか使ってないからでしょうね。
で、本気で日本語を打つときは vim [56].x でなく jvim 3.0 を使っています。
これは Onew のキーバインドから離れられないから。 :-)
# Vim 6.0 の日本語処理が jvim に劣っている
# という趣旨ではありません。念の為

バイナリエディタ (スコア:1)

by oku (4610) on 2001年09月28日 23時28分 (#25762) 日記

普通の vim 使いなら

:set binary
:set display=uhex

で済ませてしまうんではないでしょうか？
あるいは

1G!Gxxd
1G!Gxxd -r

とかもありでしょう。

Re:XF86Config壊れたら (スコア:1)

by kai_kamome (4560) on 2001年09月29日 0時25分 (#25782) ホームページ日記

復旧手段なしって事？

--
wild wild computing

Re:いいからKDE使っとけ (スコア:1)

by oku (4610) on 2001年09月29日 0時31分 (#25786) 日記

kwriteマンセー

それは如何にも勿体のうございます。 :-)
GVim を一度お試しあらんことを。
# Windows でも X でも使えるし。

Re:キーアサイン (スコア:1)

by kai_kamome (4560) on 2001年09月29日 0時36分 (#25788) ホームページ日記

アサインだけじゃないけど、
* コード書く
* メール書く
* 文書書く
* etc.etc...テキストを扱うかぎり、同じキーアサイン、
同じマクロ、同じインデントルールを使いたいし、
いちいち全てのアプリを同じ操作感覚に再カスタ
マイズするのは面倒だし、非生産的ってのがあってEmacs使ってます。

まぁ。当時、自宅で Emacs 使いたくて Linux 入れたってくらいなので。

--
wild wild computing

Re:XF86Config壊れたら (スコア:1)

by oku (4610) on 2001年09月29日 2時22分 (#25819) 日記

XF86Setup
xhost +
(番外編) cp /backup-fd/XF86Config /etc/X11/

...という事で、ないわけでもないのではないかと推察します。

どうでもいいことだけど (スコア:1)

by kubota (64) on 2001年09月29日 8時33分 (#25852) ホームページ日記

Emacs でいう toggle-input-method が日本語という意味だったんだけど。あと、日本語の入力方法を選択する際に「かんな」「うんぬ」と入力できないと選択できないとか。

Re:いいからKDE使っとけ (スコア:1)

by Nautilus (2554) on 2001年09月29日 10時06分 (#25861) ホームページ日記

GVim を一度お試しあらんことを。
# Windows でも X でも使えるし。

X版はまだ使ってないからどうなってるかしらんけど、Windows版だとコマンドモードと入力モードでIMEの状態を別々に記憶しておいてくれるのはかなり便利。
慣れればかなりスムーズに操作できるようになるだろうなぁーと思いつつ未だにエスケープキーと漢字キーを連続で押してしまっている私(^_^;)

Re:いいからKDE使っとけ (スコア:1)

by asataku (2091) <takumi@asaki.jp> on 2001年09月29日 10時14分 (#25865) ホームページ日記

今はKateでっせ。
KVimという手もあるけど、バージョン古いしなぁ。
開発、まだやってるのかな。

--
-- Che Che - Bye Bye

Re:ロケール自動認識 (スコア:1)

by kubota (64) on 2001年09月29日 12時05分 (#25879) ホームページ日記

現在ある EUC の文書中のポンド記号を Unicode 変換時に互換文字に変換するとしたら、新しく Unicode で入力する文書にも、互換文字のポンド記号を入力したくなると思います。「その部分はまったく同一」な文書を作る必要があるときとか。

現在のシフト JIS や EUC においても、半角カナや全角英数の使用はあまりおすすめしない、ということになっていると思いますが、Unicode における互換文字の不使用もその程度の弱い「おすすめ」しかできないと思います。

どうしてもきれいな Unicode に移行したければ、移行過程のどこかで断絶を作る必要があります。が、それを要求するのはほぼ不可能でしょう。世界中がひとつの方式に従わないと、規格の意味がないですが、そんなことは不可能です。

互換文字を排除するかどうかについては、ぼく自身はどちらでもいいという意見です。「どちらか」という問題よりかは、｢世界中がどちらかで統一される」という問題のほうがよっぽど重要なことです。「長いものに巻かれろ」に近い。そして、Unicode Consortium は｢互換文字排除」の原則を緩めつつあるような印象をぼくは持っています。

どうせなら (スコア:1)

by brake-handle (5065) on 2001年09月29日 12時46分 (#25884)

emacs? なにそれ？

何だかインパクトが弱いなぁ... どうせなら

ed? なにそれ？

ぐらいだったら大笑いできたのに(某OSではマジ話になってしまったが)。

echo, cat, ed, vi, emacs, (perl || ruby) (スコア:1)

by SteppingWind (2654) on 2001年09月29日 13時42分 (#25890)

ぐらいを場合に応じて使い分ける方がUnix的にはスマートですね.

最近はgeditあたりも, 初心者に教えるには機能が少なくていいかなどと思っています.

単機能万歳!!

Re:ロケール自動認識 (スコア:1)

by numa (4467) on 2001年09月29日 14時48分 (#25896) ホームページ日記

どうしてもきれいな Unicode に移行したければ、移行過程のどこかで断絶を作る必要があります。が、それを要求するのはほぼ不可能でしょう。世界中がひとつの方式に従わないと、規格の意味がないですが、そんなことは不可能です。

それはその通りだと思います．まあ，新しいデータ形式を作ったときに，「ここでは UTF-8 以外は使うな」とか宣言してしまう以外にはうまい移行方式はないかもしれませんが．

なんせ，「ポンド記号の全角・半角問題」以外にも，「0x5C はバックスラッシュ (REVERSE SOLIDUS) か円記号 (YEN SIGN) か問題」とか「0x7E はチルダ (TILDE) か上線 (OVERLINE) か問題」とか，いろいろありますもので．昔は YEN SIGN 問題で盛り上がったものですが，最近は TILDE 問題の方が騒がれるようなのがなんとも．

私は，YEN SIGN 問題と TILDE 問題がないというだけでも UTF-8 に移行したい気分ですけど． (もちろん，「ＭＳ明朝」とかいったふざけたフォントは使わないという前提でね．)

Re:どうせなら (スコア:1)

by oku (4610) on 2001年09月29日 16時58分 (#25922) 日記

寡聞にして、なのですが ed のない Unices があるという事ですか？
# 一部の sh script が困るんじゃなかろうか。

Re:どうせなら (スコア:1)

by brake-handle (5065) on 2001年09月29日 17時04分 (#25923)

マジ話の方は「なにそれ?」の意味がちょっと違うので強引ではありましたが...

ある日、「crontab(1)を起動したらエディタが立ち上がらない」といわれて現場にいってみました。見てみるとSolarisが走っている計算機だったのですが、動いていたのはvi(1)ではなくed(1)だったという話です。

まぁ、初めて見る人には「なにそれ?」ってことで...

Re:いいからKDE使っとけ (スコア:1)

by oku (4610) on 2001年09月29日 17時07分 (#25924) 日記

KVimという手もあるけど、バージョン古いしなぁ。

これってウガンダ周りと GPL が衝突したりしないのでしょうか？
# ウガンダは「ライセンス」じゃなくて
# 「お願い」だから関係ないという事なのかな...

Emacs って単機能ですか？ (スコア:1)

by oku (4610) on 2001年09月29日 17時12分 (#25927) 日記

そりゃ『単機能な LISP インタプリタです』と言われれば反論のしようもありませんが。

fepctrl 機能 (スコア:1)

by oku (4610) on 2001年09月29日 17時44分 (#25939) 日記

X版はまだ使ってないからどうなってるかしらんけど、Windows版だとコマンドモードと入力モードでIMEの状態を別々に記憶しておいてくれるのはかなり便利。

それは十年以上昔に jstevie に実装された fepctrl 機能の事を仰っているのでしょうか...。その後、 jelvis や jvim にも日本語化の際に (だと思う) 同機能が導入されています。
但し、Vim の IME 制御は fepctrl とは別物 (のハズ) です。

環境変数の問題でしょう (スコア:1)

by oku (4610) on 2001年09月29日 17時51分 (#25943) 日記

$VISUAL も $EDITOR も unset だったんでしょう。
環境的にはあり得る話ではないかと。

全ての機能を使う責任は無い (スコア:1)

by SteppingWind (2654) on 2001年09月29日 19時02分 (#25958)

むしろキッチンシンクとまで言われるEmacsでも, 通常使う機能は絞った方がむしろ使いやすいって話で.

もっとも全 Emacs LISP 関数を暗記しているとでもいうなら話は全く変わりますが.

部門(オフトピック) (スコア:1)

by achika_j_kuonji (4703) on 2001年09月29日 22時56分 (#25984) 日記

＞ k-k-j-j-h-l-h-l-B-A 部門
　コナミコマンドかいっ！

　気づくまで５分掛かった。

Re:ロケール自動認識 (スコア:1)

by kubota (64) on 2001年09月30日 10時52分 (#26034) ホームページ日記

EUC-JP を使っていて YEN SIGN 問題から自由でないのなら、UTF-8 を使っても YEN SIGN 問題から自由ではいられないことでしょう。

というか、EUC-JP も Shift_JIS も ISO-2022-JP も一切扱わないのなら、それでもいいですが。そういうわけには、いかないでしょう。

よく、「全角」「半角」という言葉を使うと、「全角ってなに?」「半角ってなに?」という意地悪な答えが返ってくることがありますが、でも実状として、わたしたちは全角・半角という概念に依存しているわけです。顔文字やアスキーアート、プレーンテキストで表現された図表、curses ベースのソフトウェア、などなど。こんな意地悪な質問をして楽しんでられるのは、「全角」「半角」の概念と重要性を共有している仲間内だけです。漢字文化圏じゃない人々がそれを見たらきっと、「全角・半角の概念は一部のオタクたちがこだわっているだけで、無視して構わないんだ」って思われてしまいます。

ところで、最近、Unicode にかんして CJK Han Unification についての不満を聞かなくなりましたが、どうしてなのでしょうか。不満だった人はみんな TRON とかに移行して満足してしまったのでしょうか。それともぼくが寡聞にして知らないだけ? (たぶん後者だろうけど)。

じっさい、CJK Han Unification については、統合された文字の違い (or グリフの違い) を気にするのはほんのごく一部の日本の ISO-2022 な geek たちだけだ、という主張をよく聞かされました。その意見の主は Markus Kuhn さんですが。

なにそれ? (スコア:1)

by rug (55) on 2001年09月30日 12時56分 (#26036) 日記

> emacs? なにそれ？(とか言ってみる)

いまどきは

hjkl? なにそれ?

かもしれないとか思ったり。

Re:ロケール自動認識 (スコア:1)

by numa (4467) on 2001年09月30日 22時59分 (#26083) ホームページ日記

EUC-JP を使っていて YEN SIGN 問題から自由でないのなら、UTF-8 を使っても YEN SIGN 問題から自由ではいられないことでしょう。

というか、EUC-JP も Shift_JIS も ISO-2022-JP も一切扱わないのなら、それでもいいですが。そういうわけには、いかないでしょう。

そうそう，他の世界がなければいいんですけどね．

ところで、最近、Unicode にかんして CJK Han Unification についての不満を聞かなくなりましたが、どうしてなのでしょうか。不満だった人はみんな TRON とかに移行して満足してしまったのでしょうか。それともぼくが寡聞にして知らないだけ? (たぶん後者だろうけど)。

いや，もう既に外堀は埋められているのですよ． Windows を使うとか，Java を使うとか，はたまた XML を使うと言った時点で Unicode から逃れられなくなってしまう．今の世の中，この3つのどれからも自由でいられる人はなかなかいないでしょう．

TRON がいくらがんばったところで，外部データ表現が Unicode を基準にして決められてしまう状況ではいかんともしがたいと思います． (別に，私は TRON コードの肩を持つわけではありませんが．あれは，端的に変だ．)

じっさい、CJK Han Unification については、統合された文字の違い (or グリフの違い) を気にするのはほんのごく一部の日本の ISO-2022 な geek たちだけだ、という主張をよく聞かされました。その意見の主は Markus Kuhn さんですが。

それは単に Markus が知らないだけ．あいつの言うことを真に受けていては大変ですよ．まあ，字形の細かいところにこだわりすぎるのも何だとは思いますが (手書きの字形における細かな違いを明朝体の字形に反映しろと言われてもねぇ)，そういう人がこの国に多いのは事実ですから．

Re:ロケール自動認識 (スコア:1)

by kubota (64) on 2001年10月01日 18時12分 (#26253) ホームページ日記

それは単に Markus が知らないだけ．あいつの言うことを真に受けていては大変ですよ．まあ，字形の細かいところにこだわりすぎるのも何だとは思いますが (手書きの字形における細かな違いを明朝体の字形に反映しろと言われてもねぇ)，そういう人がこの国に多いのは事実ですから

いや、まあ、そうなんですけど (というか、彼が XFontSet について知らないと書いたのを見て、唖然としたことがあります)、彼の影響力は絶大なものがありますし。逆に、彼の考えを改めさせることで大勢の考え方を改めさせることも可能だという (きわめて困難ですが、不可能ではないです)。

あと、予断になりますが、Unicode Consortium の公式見解を改めさせるというのも、影響力という点では大きな効果があると思います。この FAQ とか、この FAQ の U+76F4 の部分とかはぼくのつっこみの結果として追加されたものですが、それまではお寒い状況でしたから。

それから、

外堀は埋められ

というか、篭城したら勝ち目はないでしょ。理想の世界について夢想して現実を嘆くよりも、現実を少しでも良くする方向へともっていかないと。ソフトウェアは動いてなんぼですから。:-)

Re:ロケール自動認識 (スコア:0)

by Anonymous Coward on 2001年09月28日 10時09分 (#25474)

ロケールを認識しないソフトをバグと呼ぶのなら、
JIS X 0212を認識しないのもバグじゃないですかね。

vim6に関する質問集はココまで (スコア:0)

by Anonymous Coward on 2001年09月28日 11時23分 (#25489)

http://cocoa.2ch.net/test/read.cgi?bbs=unix&key=990764339

Re:ロケール自動認識 (スコア:0)

by Anonymous Coward on 2001年09月28日 13時46分 (#25523)

JIS X 0213 が生き残るかどうか、というのは、今後の
全体の動向次第でしょう。

技術的には、JIS X 0213 を使うときは、JIS X 0212
を使わない新しい EUC 体系(名前失念)を使うという
ことで解決するかと思います。EUC-JP213だっけ？

旧文字コードがオーバラードされて消えるのではなくて、
新規文字コードが出現するってことですね。Mule の
JIS X 0213 用の実装がそんなかんじだったと記憶
しております。

RFCのドラフトだったか、IANA に提出する資料だったか
だれかが書いたけどなんか要件みたしてなくてけられて
そのあとどうなったかってのは追跡してないので
知りません。私も知りたいので知ってる人
たれこみよろしく。
＞新EUC,新ISO-2022-JP,新SJIS

Vim 6.0 正式リリース More ログイン

Re:ロケール自動認識 (スコア:4, 参考になる)

Re:ロケール自動認識 (スコア:3, すばらしい洞察)

ロケール自動認識 (スコア:2, 参考になる)

JIS X 0212 は使えます。 (スコア:2, 参考になる)

Debian な人は (スコア:2, 参考になる)

じゃあ Emacs の宣伝をしてよ (スコア:2, 興味深い)

Re:じゃあ Emacs の宣伝をしてよ (スコア:2)

VIMを EMACS 風 にするVIMスクリプト (スコア:2, 参考になる)

Re:ロケール自動認識 (スコア:2, 参考になる)

Re:どうせなら (スコア:2)

Re:ロケール自動認識 (スコア:1)

Re:ロケール自動認識 (スコア:1)

Re:ロケール自動認識 (スコア:1)

そんないいいもの？ (スコア:1, フレームのもと)

Re:そんないいいもの？ (スコア:1)

Re:そんないいいもの？ (スコア:1)

Vim and Migemo (スコア:1)

Re:ロケール自動認識 (スコア:1)

ぜんぶ日本語 (スコア:1)

Re:ぜんぶ日本語 (スコア:1)

Re:じゃあ Emacs の宣伝をしてよ (スコア:1, 余計なもの)

Re:ロケール自動認識 (スコア:1, 興味深い)

Re:じゃあ Emacs の宣伝をしてよ (スコア:1)

バイナリエディタ (スコア:1)

Re:XF86Config壊れたら (スコア:1)

Re:いいからKDE使っとけ (スコア:1)

Re:キーアサイン (スコア:1)

Re:XF86Config壊れたら (スコア:1)

どうでもいいことだけど (スコア:1)

Re:いいからKDE使っとけ (スコア:1)

Re:いいからKDE使っとけ (スコア:1)

Re:ロケール自動認識 (スコア:1)

どうせなら (スコア:1)

echo, cat, ed, vi, emacs, (perl || ruby) (スコア:1)

Re:ロケール自動認識 (スコア:1)

Re:どうせなら (スコア:1)

Re:どうせなら (スコア:1)

Re:いいからKDE使っとけ (スコア:1)

Emacs って単機能ですか？ (スコア:1)

fepctrl 機能 (スコア:1)

環境変数の問題でしょう (スコア:1)

全ての機能を使う責任は無い (スコア:1)

部門(オフトピック) (スコア:1)

Re:ロケール自動認識 (スコア:1)

なにそれ? (スコア:1)

Re:ロケール自動認識 (スコア:1)

Re:ロケール自動認識 (スコア:1)

Re:ロケール自動認識 (スコア:0)

vim6に関する質問集はココまで (スコア:0)

Re:ロケール自動認識 (スコア:0)

VIMを EMACS 風にするVIMスクリプト (スコア:2, 参考になる)