誰もが気軽にソフトウェアのローカライズに参加できるシステム「Honny」 38
ストーリー by hylom
匿名のパワーを活用しよう 部門より
匿名のパワーを活用しよう 部門より
あるAnonymous Coward 曰く、
長野高専の学生が、「Honny」と呼ばれるWebベースのOSSローカライズシステムを考案、論文の公開と共に運用実験を行っている。
ソフトウェアがコミュニティでローカライズされることは多くなってきている。だがまだ主要なオープンソースソフトウェアしか満足に翻訳されておらず、知名度が低くなればなるほど翻訳されている確率は低い。そして大人数で翻訳作業を行う仕組みが十分でないため、この問題は未だに放置され続けている。もちろんPootleやLauchpad、Transifexといったローカライズ基盤はあるものの、これらは日本人にとって扱いにくいといった問題点がある。
ひと通り使ってみた感想だが、翻訳は翻訳メモリなどが用意されておらず、正直「微妙」の一言に尽きるが、査読が簡単に行えるような仕組みが用意されているためいい感じだ。
コミュニティ形式でのソフトウェア翻訳について興味がある人は、一度チェックしてみてはどうだろうか? 何か得るものがあるかもしれない。(もちろん実験を目的としたものなのでそれを忘れずに……)
Honnyは匿名で翻訳に参加でき、また実際に翻訳作業を行うまでの手間を最小限に抑えることで、気軽に翻訳に参加できるようになっているあたりがポイントのようだ。
それより本家へのフィードバックをだね (スコア:4, すばらしい洞察)
諸外国製のソフトって、大抵の場合、
日本語に翻訳できない語順や区切りのメッセージカタログのせいで
途中からやる気がなくなるんですよね。これの方が大事じゃないかな。
単に "sent" って言われても
日本語では「送信しました」と「送信済み一覧」に分けたかったりしますし、
その直前に "%d messages" と "No message" があったりしますし。
だから、「これ日本語にできないから、こう直してよ」っていう
フィードバックの仕組みこそが大事だと思います。
もちろん翻訳しやすい仕組みもいいですが、それだけじゃなくて。
Re:それより本家へのフィードバックをだね (スコア:1, 参考になる)
そうそう、で、わけわかんない日本語になってて
USロケールにして意味を確認する、なんていう本末転倒な事態がしばしば。
同じ意味で使われている同じ英単語/表現がソフトによって異なる日本語に
訳されて混乱したりもする。
単なるUI上のメッセージのローカライズ、って本当に意味あるのかね。
USロケールのままつかってもメニューやダイアログに出てくる英語って
カタカナ語としても通用しているものが大半だし、そうじゃなくても
preferenceやconfigureみたいなよく使われる単語はすぐ意味理解できるだろうし。
限られたリソースをヘルプやチュートリアルの翻訳に注いだ方が建設的な気がする。
Re:それより本家へのフィードバックをだね (スコア:2, 興味深い)
> 単なるUI上のメッセージのローカライズ、って本当に意味あるのかね。
> USロケールのままつかってもメニューやダイアログに出てくる英語って
> カタカナ語としても通用しているものが大半だし、そうじゃなくても
> preferenceやconfigureみたいなよく使われる単語はすぐ意味理解できるだろうし。
需要はあるのでしょう。意味があるのかはともかく。
日本以外のフリーソフト(等)を「日本語のページを検索」すると、「他のキーワード:hoge 日本語化 hoge 日本語パッチ」とか出てくることが多々あります。
日本のパソコンユーザには、英語が出てくるだけで拒否反応を示して、読もうとさえしない人がかなりいるようです。大半の人は、読もうとする意志さえあれば、メニューやダイアログ程度は十分読めると思うのですけどねぇ。
#たぶん、中高生の間に、英語の知識と一緒に英語に対するアレルギーを植え付けられるのが原因。
Re: (スコア:0)
その「限られた」リソースをなんとかしようって言うシステムなのでは?
Re:それより本家へのフィードバックをだね (スコア:1, 参考になる)
> 日本語に翻訳できない語順や区切りのメッセージカタログのせいで
商用ソフトですら"read" になることはできませんでした [www.imou.to]だったりしますからね。
最近のはどうみても機械翻訳に意味もわからず手を加えただけで、結局英語の原文を見ないとさっぱり意味がわからなかったなんてひどいのもあります。
Re: (スコア:0)
手間掛けてろくでもない酷い翻訳が多いし(英語ですら)
日本人の平均では、英語以外で読み書きが十分な人は少ないだろうから、
そういったものだけ(仕方なく?)ローカライズでいいんじゃないのかなぁ
Re: (スコア:0)
それを説明するというのは、ものすごく大変です。
欧米人は、文法構造が大きく異なる外国語を勉強したことがない人がほとんどですから、
そういう問題が存在するということすら、理解が難しいと思います。
うまく説明できた例が、どこかの開発者MLのログに残っていたりしませんかね?
または、FAQやHowtoの形で、「説明はこれを読んでください」といったのは、
ないでしょうか?
Re:それより本家へのフィードバックをだね (スコア:3, 参考になる)
gettext のマニュアルがまさに該当しますね。
http://www.gnu.org/software/gettext/manual/gettext.html [gnu.org]
の
- 4.3 Preparing Translatable Strings
- 11.2.6 Additional functions for plural forms
など。
元のメッセージが訳しにくいというのは日本語に限った
話ではありません。ポーランド語の複数形などこのマニュアルを
見て初めて知りました。
最近の GNU ソフトウェアは結構元の msgid が良くなっていると思います
GlotPressとの違いは? (スコア:3, 興味深い)
筋の悪い話ではないと思うけど、GlotPressに対するアドバンテージとかどう考えているのだろう。
いやまぁ頑張ってほしいですね。
シイラの事例 (スコア:3, 参考になる)
というやり方です。シンプルだけど、これは有効に機能しているように見えます。
翻訳慣れしている人にとっては「使い勝手は微妙」? (スコア:2, すばらしい洞察)
PO-MOビルドの文字化けトラブルとか、メーリングリストに参加するとかバージョン管理システムにコミットするとか一切気にせずすべてWebベースで行える......これはいいところを抑えていると思います。一文ずつ英語の翻訳問題を一文だけ解くように、登録なし(AC)で参加できる翻訳。若い、しかも日本人らしい発想だなと思います。
ただ、高機能な翻訳ツールは使いこなせないけどそこそこ翻訳/査読経験があるACとしては、査読に本当に必要なのは「現物のUIに表示されたときに意味が通るのか」ということなんですね。だから原文+訳文を見せられても査読できません。一方で翻訳メモリも本気で読み手にわかりやすいUIを目指すのであれば頼りきるのは得策ではありません。英日併記状態にして組み込んで画面上でチェックなんてこともよくやります。うまいこと現物のUIと見比べながら作業できるのが一番うれしいなと思うところです。
Re:翻訳慣れしている人にとっては「使い勝手は微妙」? (スコア:1, 参考になる)
いや、まったく。文を一つだけ見せられても、文脈が全然わからないから、訳しようがないです。
どういう分野のどういうソフトで、どういう場面で使われている文なのかが分からないと。
せめて、「出典元文書:詳細」に示されているデータくらいは、デフォルトで表示させたほうがいいと思います。
でないと、これくらいの情報さえも見ずに翻訳作業なんかできるわけがないのに、できると勘違いする人が
出てきます。
.poファイルのほかの文章(出典元文書:詳細の中の文章一覧)を眺めて、やっと、なんとなくこんな感じかなあ、
というのが分かる程度。
Re:翻訳慣れしている人にとっては「使い勝手は微妙」? (スコア:1, 興味深い)
UI上に表示されたときの状態もさることながら、上のコメントにあるように、
どういう場面か、ということが重要だと思います。
現物のUIに表示されたときの状態を示すのは技術的に難しいだろうから、
ソースファイル中でその文書が使われている場所(の前後)を示すのなら
技術的に簡単だし、(ほとんどないかもしれないけど)役に立つ可能性も
あると思います。(それでどれだけ改善されるかは疑問だけど、否定的な
意見ばかり言っても仕方がないので)。
Re:翻訳慣れしている人にとっては「使い勝手は微妙」? (スコア:1, おもしろおかしい)
2000年1月1日が
2000year 1moon 1Sunday
になったのでAC
ちょっとやってみた (スコア:1)
英語クイズに近い感覚。
"何回ユーザーによって翻訳されたのか"が分かるんで、自分の英語感覚を見直せるかも。
なんだけど、翻訳対象はもうちょっと精査したほうがいいかな。
" mlvirsh " はさすがに訳せないですわ。設定ファイルの例文みたい。
Re:ちょっとやってみた (スコア:1)
正しくはこんな感じ↓
" <command>mlvirsh</command> "
適当に書いてもいいよということ? (スコア:0)
誰が査読するだろ?査読するぐらいなら自分で翻訳できるんじゃないの。使い勝手は「微妙」とか書いているし。
匿名だから適当に書いてもバレないんでガンガン書き込んでね、でも査読きちんとするから大丈夫だよ、なんていったい誰の夢。
Re:適当に書いてもいいよということ? (スコア:1, すばらしい洞察)
Re:適当に書いてもいいよということ? (スコア:1, おもしろおかしい)
> でも査読きちんとするから大丈夫だよ、なんていったい誰の夢。
コメントのふりして、スラドの悪口を言うのはやめていただきたい。
Re:適当に書いてもいいよということ? (スコア:1, おもしろおかしい)
ソフトの使い方を教えるときに、出力されるメッセージは誰でも匿名で自由に書けるので信用してはいけません、とか教えるのかな(wikipedia)
かえって面倒くさそう。
Re:適当に書いてもいいよということ? (スコア:1)
この部分はある意味正論かも。
とりあえず全部機械翻訳して査読で修正するようにすれば、最初の翻訳の手間が省けるかも知れませんね。
# 中の人はgoogle翻訳とか知らないのかな。
Re:適当に書いてもいいよということ? (スコア:2, 興味深い)
>とりあえず全部機械翻訳して査読で修正するようにすれば、最初の翻訳の手間が省けるかも知れませんね。
>
># 中の人はgoogle翻訳とか知らないのかな。
あくまで個人的な経験によるものですが、機械翻訳の精度は
未だに下訳に使用するには論外レベルだと思います。
最初は少し使っていたこともありましたが、かえって混乱する
ことの方が多かったので、結局使わなくなりました。
実際、自分が読んでわからない文章はたいてい機械翻訳でも
意味不明な文章になることが多いですし、その以外の部分も
自分で原文読んで訳す方が早いです。
訳してる時間はないけど、英語アレルギーの人に読んでもらう
ため、仕方なく気休め程度に使うぐらいですね。
Re:適当に書いてもいいよということ? (スコア:1)
しかし、タグや改行が無視される可能性があるので、コピペはしないでくださいとのことです。
Re:適当に書いてもいいよということ? (スコア:1, すばらしい洞察)
> 誰が査読するだろ?査読するぐらいなら自分で翻訳できるんじゃないの。
いや、翻訳したい人が仮にいるとすれば、査読したい人もいるはず。
むしろ他人のあら探しのほうが楽しいんじゃなくて?
# computerは「コンピュータ」だ、いや「コンピューター」だ、とか。
冗談はさておき、メッセージカタログの翻訳は、単に英文和訳すればいいという
ものではなく、そのソフトウェアを深く使い込まないと適切な和訳を選べない
ということも多々あります。和訳は得意だけどそのソフトウェアのことはあまり
よく知らないとか、その逆とかがありますので、翻訳と査読を分業するのは
良いことです。
それに、別コメントにもあるように、翻訳作業はソースファイル改変に相当する
くらい(セキュリティ的に)重大な意味があるので(たとえば、「delete all files」を
「お楽しみ映像」と訳してみるとか)、査読が入るのは必須だと思います。
むしろ、査読があれば悪意ある翻訳を防げるかというと、それだけでは不十分かも
しれません。
Re: (スコア:0)
誰のチェックも受けずにメッセージカタログを変更するって亊は,ソースコードをテストやレビューなしで変更するのと同じこと.
テストがあるからテキトーに書いたプログラムで良いなんて亊はないように,レビューがあるからテキトーに翻訳していいなんてことにもならない.
Re: (スコア:0)
>匿名だから適当に書いてもバレないんでガンガン書き込んでね、でも査読きちんとするから大丈夫だよ、なんていったい誰の夢。
まるでACモデレート
Re: (スコア:0)
適切且つ妥当に書けという事の何が間違っているのかって事
テキトーに書くのとは違うだろ
なんかご隠居に対する熊さんしか居ないってのが良く分かるね
おち○ちんおっきくなっちゃった? (スコア:0)
商業化のこと (スコア:0)
毎度の事ながら、商業化の方針が全く見えない。
ローカライズしたOSSを販売、というのは筋が悪かろう。
広告貼り付けて終わり、というのでは長続きしないだろう。
地方だから、まともな指導をしてくれる先生がいないのは、仕方のない事かも知れないけども。
Re: (スコア:0)
OSSの開発って、先生の指導のもとでやるものなんですか?
自分の興味で、自発的にやるものだと思ってた。
たしかに、最近だとOSS系の会社というのもあるけど、
OSSを利用するのならともかく、OSSの開発で食べていけるなんて
ほんとに例外的な一部じゃないかと思います。
それに、商業化しなきゃならないんでしょうか?
OSSやってる「先生」にいろいろ教えられて、それだけが全てと
思い込んでる学生ですかね。
Re: (スコア:0)
そういう噛み付き方は良くないと思いますよ。
元コメの人は、たぶん、 honny [honny.jp]のページに「Copyright © 2010-2011 Honny.jp, promoted by Ito Laboraory in Nagano Kosen.」って書いてあるからこそ「長野高専は技術ばっかり教えてないで、商業化の必要性やテクニックなども教えたらいいのに」ということを言っているのだと思いますよ。
商業化してはいけないということもないのでは?
元々発言の言っていることは「どうせやるなら商業化できるように考えとこうぜ」
Re: (スコア:0)
商業化っていったい何をどう商業化するって話なんでしょう。
というか、どういう前提で話してるんでしょう。
今のところ公表されている予定として「後日ソースを公開する」があります。また、このソフトウェアはOSSを支援することを目的としています。
これらから、今後開発を継続するならOSSとしてだろう、というのが元コメントの前提に思われます。その前提は、目標がこのソフトウェア「Honny」の開発を継続すること、その目的はgettextによるローカライズを支援すること、それがOSSの支援につながるから、と思われます。
で、
Re:商業化のこと (スコア:1, 興味深い)
たぶん、後者でしょう。
感覚の差。
#1893227 [srad.jp]や#1893008 [srad.jp]のACさんは、
という感覚でものを見ていらっしゃる。
対して、#1892995 [srad.jp]や#1893087 [srad.jp]のACさんは、うまく立ち回らないと継続できるものも継続できなくなっちゃうかもよ、的なものの見方をされている。
そこの差なんじゃないでしょうかね。
前者が「良い物ならば/需要があるならば」的な技術的視点からの意見であるのに対して、後者が「市場がなければ/うまく使ってもらわなければ/食わなきゃ死んじゃう」的な資本主義的(?)な視点からの意見であると考えればいいのではないでしょうか。
おそらく、そのメリットがなかった(自分自身のコントロールを失いたくなかった/消滅させずにコントロールできる自信があった)という点と、商業化を妨げる気はない(Linuxで商売している奴らはたくさん居ますね)という点を挙げるのではないでしょうか。
どの手法が一番良いかなんて言うのは事象毎に全て違うわけですから、根っこのコメントのように「商業化を考えようぜ」というのも、そこに連なるコメントのように「OSS関連なんだから商業化なんて!」という意見も、どちらも正しいと考えれば良いと思いますね。
できれば、どちら側の意見にも「(理想論ではなく現実論として)こうやれば上手く行きそうだよね」という点が挙がっていればより良いとは思いますけど。
なんでローカライズなのか (スコア:0)
システム化より翻訳職人を養成するほうが効率よくね? (スコア:0)
ローカライズって (スコア:0)
さらに、ここのコメントもその呼び方で通じていることに二重に衝撃を受けた。
自分はこのシステムを見たときドキュメント専用のリポジトリか何かかと思った。
Re: (スコア:0)
私は貴方がOSS開発の現状を何も知らない事に笑撃を受けました。
人力翻訳サイト系 (スコア:0)
http://hinamiki.com/ [hinamiki.com]