Anal Cunt 曰く、 "本家の記事によるとbash 3.0がリリースされた (via ftp)。GNUのミラーサイトにはまだ行き渡ってない模様。詳しくはREADMEやNEWS、CHANGESなどを参照されたし。"
known bug (スコア:3, 参考になる)
このため、UTF-8 ロケールでプロンプトにロシア文字や漢字などを設定すると、 行の折り返しがおかしくなります。 いま、Debian unstable (Sid) の bash 3.0-1 を使ってみましたが、 なおっていません。 すでに1年以上も放置されているバグ [debian.org]らしいです。
EUC-JP ロケールでは、(ASCII と JIS X 0208 に限れば) 文字幅とバイト数が一致するので、この問題は起こりません。
ちなみに、Debian において、debconf を readline インタフェースで ja_JP.UTF-8 ロケールで使うと画面がおかしくなるのは、これが原因です。
Re:known bug (スコア:1, 興味深い)
なんか毎度毎度同じようなバグがあっちこっちのアプリで出てくる現状は
ものすごく無駄な感じがしてしょうがないんですけど。
Unicode の中の人は死力を尽くして啓蒙活動する義務があるんじゃないか?
Re:known bug (スコア:1, おもしろおかしい)
ナイ。マッタクナイ。
どうして、ここで Unicode ダケが問題にされてるのか分からん。
日本語を使えるようにすることによるバグ情報ってどうにか整理できないんですかね。
なんか毎度毎度同じようなバグがあっちこっちのアプリで出てくる現状は
ものすごく無駄な感じがしてしょうがないんですけど。
日本人は死力を尽くして啓蒙活動する義務があるんじゃないか?
Re:known bug (スコア:0)
Re:known bug (スコア:1)
仕方ないので「project_ほげほげ」とかにして、「$ cd project*」や「$ cd p(tab-key)」で対応。それなりに使えますよ。周りも真似してくれるのは良いのだけど、半角にしている目的を知らない奴は全角で「project_ほげ」にしちゃうんだよな・・・。
vi使える人には「set -o vi」を教えてあげよう。案外知らない人が多いっす。
Re:known bug (スコア:1)
/home/s-tomo/projects
$ ls
project_????????/ project_????????/
$ echo *
project_ふがふが project_ほげほげ
$ cd project*
$ pwd
/home/s-tomo/projects/project_ふがふが
「ほげほげ」の方を指定するにはどうすれば.........
Re:known bug (スコア:2, 参考になる)
2370528 project_ふがふが
2370525 project_ほげほげ
> cd `find . -inum 2370528`
Re:known bug (スコア:1)
project_???????????? project_????????????
$ echo *
project_ふがふが project_ほげほげ
$ cd `echo * | awk '{ print $1 }'`
$ pwd
/home/ueyama/hoge/project_ふがふが
# UNIX系OSなら、色々なパターンがありそう。
Re:known bug (スコア:1)
以前は私もそう思いましたが (スコア:1, おもしろおかしい)
Re:known bug (スコア:0, 余計なもの)
あんたの好みを押しつけられても困る
つーか、コンピュータで日本語なんか使うなよ...
Re:known bug (スコア:1)
#使ったことない(笑)けどIDで
Re:known bug (スコア:0)
アホですか?
JIS X0208 では問題が起こらないからでしょ。
Re:known bug (スコア:2, 興味深い)
バイト数 == Half width の数 な関係ならば問題ないのだろうけど、 EUC-JP の JISX0201とか 3byte の部分とかならば問題出るとかそういう話なら、「Unicodeダケの問題」とはいえないのでしょう。 イロイロな意味で バイト数 != 文字列の幅 っていうことを言っていかないと。
JIS X0208 (スコア:1)
> JIS X0208 では問題が起こらないからでしょ。
JIS X 0208 は文字セット(character set)で、文字の一つひとつに値は与えられていますが、最終的なビット表現は規定しません。Unicode も同様。
問題になってるのは、ビット表現の話みたいなので、 関係してくるのは文字コード、正確には文字エンコーディング法(character encoding)でしょう。 JIS X 0208 の文字でも、Shift JIS、ISO-2022-JP、EUC-JP などの方法で表現できます。
Unicode でも、UTF-8、UTF-16、UTF-16BE、UTF-16LEなどなど。
二バイト系を毎日使ってる日本人でさえこのへんを良く分かってない人が多いわけで。「アホですか?」とか言ってるし。
参考リンク
Re:known bug (スコア:0)
encoding 方式が書いてないんだけど、SJISだと \(0x5c) で問題あるよ。
あ、上のほうで EUC-JP って言ってたっけ? JISX0201 はどうするの?
あぁ、JIS roman/kana は使うなって?じゃぁ、JISX0212 は?
日本語以外で言うなら、 EUC-TW とかどうすんの? EUCから逸脱してるから外す?
BIG5 も 0x5c 二バイト目に入るね。どうすんの? GBKは? GB18030は?
Re:known bug (スコア:1)
debconf の ja.po を UTF-8 にしないのか?とmaintainerから突っ込まれていたので、
それに対する返事の参考にします。やっぱり問題あるんですね。
ありがとう、ありがとう、ありがとう。
Re:known bug (スコア:2, 参考になる)
まあ、ja.po ファイルを UTF-8 で書くと、EUC-JP に変換不可能な文字が紛れ込んでしまい、EUC-JP 環境では文字化けするという可能性が生じますけど。
ついでに言えば、UTF-8 ←→ EUC-JP 変換テーブルがシステムというかベンダーごとに異なるので、たとえば Windows 用の UTF-8 対応エディタで ja.po を編集すると、EUC-JP (というか JIS X 0208) の範囲に入っている文字を使った場合でさえ、Linux 上で文字化けするなんてことが起こりえますが。たとえば「~」とか「-」とか。そういう面倒にかかわり合いたくなければ、po ファイルを EUC-JP で書くことをおすすめします。
Re:known bug (スコア:0)
EUC-JPを置換するものにはなりえないということ?
俺的にはEUC-JPの世界でのんきに暮らしたいのだが
WindowsとかGNOMEとかUTF-8が攻めて(?)きて
またーり出来んのだが。
Re:known bug (スコア:1)
UTF-8にしたければ、すべてを一斉にUTF-8にしないと不都合がでる。それを
Unicodeの欠点とみなすかどうかは、立場の違い。
#私の場合、未だにmltermとか、mozilla、emacsを立ち上げる時だけ、
#ja_JP.eucJPに設定して、それ以外はすべてCロケールですが。やっぱり、
#いずれenロケールに移行しないといけないのだろうか。
Re:known bug (スコア:0)
> #いずれenロケールに移行しないといけないのだろうか。
そうなの? C は廃止で en に移行する流れなの?
Re:known bug (スコア:1)
Re:known bug (スコア:1, 興味深い)
Re:known bug (スコア:2, 参考になる)
なければ Markus Kuhn's UTF-8 and Unicode FAQ [cam.ac.uk] にソースがあります。
Re:これでどうだ、UTF-8対応コラム幅パッチ (スコア:1)
こんな英語でいいのかな
自覚して使っていないorz (スコア:2, 興味深い)
リダイレクト意識して、パイプで繋いで なんて
<ぼそ>いわゆるGUIを起動するときだけだったりして</ぼそ>
(command.com)つかいぢゃないのでIDで・・・・
Re:自覚して使っていないorz (スコア:0)
#ソースを弄るとコンパイルエラーになるのでAC
インストールしてみたが (スコア:2, 参考になる)
シェルのメジャーバージョン上がっても気が付かない...。
「違いが分かる人」には分かるんでしょうね。
PCにECC Registeredメモリの利用を推奨します。
Re:インストールしてみたが (スコア:5, 参考になる)
Re:インストールしてみたが (スコア:2, 参考になる)
sambaでファイルサーバを作っているので、Shellで日本語ファイル名を使うことが時々あります。 つい最近まで2バイトファイル名に関するタブ補完の不具合があってちょっと困ってました。
http://bugzilla.redhat.com/bugzilla/show_bug.cgi?id=90201 [redhat.com]bashはやっぱり重要なソフトだなとそのとき初めて気づきましたよ(遅い)。
new features added to bash (スコア:1)
Re:new features added to bash (スコア:0)
Re:new features added to bash (スコア:0)
# マジレスじゃないよね?
# 僕が知らないだけでそれってbashのなんかの機能のことだったり?
Re:new features added to bash (スコア:1, 参考になる)
上の人はBashとかけてるんだろうが、つまらないネタに繋げてもFunnyにはならないな。
主な変更点は? (スコア:2)
Re:主な変更点は? (スコア:5, 参考になる)
・エラーメッセージの国際化
・正規表現のサポート
でした。
by lux
関連記事 (スコア:3, 参考になる)
自分はもう何年も触ってないのでよく分からんのですが(汗)
-+- 想像力を超え「創造力」をも凌駕する、それが『妄想力』!! -+-
感謝~ (スコア:1)
ていう発言がないのはなんで~?
むかーしむかしに初めて触ったLinux(たしかTurbo6.0?)でbashを使ってから、現在までbashユーザーです。(今はcygwinで使ってますけど)
#貧弱な回線環境なので、cygwinのbashがどうなっているのか確認できず……orz
ま、バグが残っちゃってるかもしれないけど、バージョンアップしたことをお祝いしたいです~
開発者のみなさん、お疲れ様でした~次も期待しています~
#日本語で言っても仕方ない?かな……
Bashの読み方は (スコア:1)
友達や知人との会話でBashの話なんて出てこないと思うけど。
Re:Bashの読み方は (スコア:1)
Re:Bashの読み方は (スコア:1, 参考になる)
「びーえーしぇる」ってのもそれなりに聞く。
ボックスは初耳だ。
bochs と間違えてるに一票
チープなロゴ (スコア:0)
いつできたの
Re:ID (スコア:0)
問題だと思います。どうしても掲載したければ、却下して、書き下ろ
しするという手もあります。そのうち、「XX事件の犯人は少年A
だ」というIDでタレコミがあったらどうするつもりなんでしょうか?
Re:ID (スコア:0)
あなたがあげた例は法律に違反しますが、タレコミ氏のIDは
下品ですが法に抵触しているわけではありません。
Re:ID(オフトピ:-1) (スコア:0)
Re:ID(オフトピ:-1) (スコア:0)
Re:ID(オフトピ:-1) (スコア:0)
何回か出たんでしょうか?
Re:ID(オフトピ:-1) (スコア:0)
Re:ID(オフトピ:-1) (スコア:0)
Re:ID(オフトピ:-1) (スコア:0)
「ごめんね。ページをかいくぐらせませんでした。」 [goo.ne.jp]
題名と部門名しか見てないなあ。興味あれば本文。