パスワードを忘れた? アカウント作成
4294 story

アナログディスクで世界の言語を永久保存 90

ストーリー by Oliver
あちこちに埋めまくり 部門より

torus 曰く、 " WIRED NEWS の記事によると、「今、科学者と技術者からなるグループ 『ロゼッタ・プロジェクト』が、現代版ロゼッタ・ストーンの作成に取り組んでいる。直径約7.6センチのニッケル製ディスクに世界の言語約7000種類のうち1400種類以上を記録し保存しようというのだ。「情報は、『0』と『1』ではなく、普通の文字で記録される。倍率1000倍の顕微鏡さえあれば、未来の人類はこの超縮小印刷されたテキストを読むことができる」のだそうで、デジタルの恩恵にどっぷり浸かっている立場からすると、時代に逆行しているようにしか見えませんでしたが、「耐用年数2000年」という記述をみて納得しました。
また面白いのは「『言語学界のリナックス』を完成させよう」という彼らの方針で、膨大な量のデータを扱うためにオープンソース的な方法を採用し、 無料のオンライン・アーカイブなども公開している。非常に遠い未来の言語学者によって活用されることを目的とした、この壮大なプロジェクト、これからの学問における文献の扱いや、多くの人による共同作業のあり方についてもいろいろ考えさせられて興味深い。"

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • 音声も収録予定 (スコア:2, 参考になる)

    by ferrocyan (7486) on 2002年11月12日 21時33分 (#199386)
     世界には、文字をもたない言語もあるわけで、プロジェクトではゆくゆくはネイティブスピーカーによる発音まで収録する方向のようですね。

     ただ、音声はどうやって記録するんでしょう。やはりレコードの溝みたいなのにするんでしょうか。
     昔のアイヌ語を録音した蝋管は、何十年も経ってから価値が再発見され、なんとか再生が可能だったようですが、今度のプロジェクトのは、いかに再生可能性を保証していくんでしょうか?

    #  宇宙を行くボイジャーには、異星人へのメッセージを吹き込
    # んだディスクを積んであるそうですが、これはさながら、未来
    # 人へのメッセージといえるでしょうか。
  • by rainforest (4616) on 2002年11月12日 21時46分 (#199401) 日記
    残そうという努力でしょう。

    本当はその言語を話す集団が存続できれば一番良いはずなんですが。
    主に、その言語圏では生活を完結できないというような
    経済的な理由からマイナーな言語は失われてゆくのでしょうね。

    # 世界の言語の90%が100年以内に消滅するという予想もあります。

    我々は日本語だけですべての教育を受けられ、生活できる幸せを
    もっと考えてもよいでしょう。

    我々の子孫が英語を話しながら、失われた祖先の言語を研究する、
    なんていうのはイヤですね。
    • 日本でも (スコア:3, すばらしい洞察)

      by kubota (64) on 2002年11月12日 22時06分 (#199411) ホームページ 日記
      我々は日本語だけですべての教育を受けられ、生活できる幸せを もっと考えてもよいでしょう。
      もしそれが本当なら、それは、すでに日本語以外の言語が日本から消滅してしまったからではないでしょうか?
      親コメント
      • Re:日本でも (スコア:2, 興味深い)

        by rainforest (4616) on 2002年11月12日 22時27分 (#199428) 日記
        > すでに日本語以外の言語が日本から消滅してしまったからではないでしょうか?

        その通りではあるでしょう。現に、かつて存在していたアイヌ語は
        実質的に失われてしまいましたし、日本語の亜種ともいうべき各地
        の方言も薄れつつあります。

        それと同じ事が地球規模で起こりつつあるというとに対して、
        せめて、今我々が話している言葉には生き残ってもらいたい
        と思わずにはいられません。
        親コメント
        • Re:日本でも (スコア:3, 参考になる)

          by m(__)m (7731) on 2002年11月13日 9時03分 (#199727) ホームページ 日記
          Ethlogue of Japanの分類 [christusrex.org]によると、
          日本国内で使われている言語は、手話を入れて15語。

          日本語を話す人口が圧倒的に多いですが、第二位のKoreanが5%もおります。
          他、アイヌはもちろん、沖縄「方言」は、各種島ごとに異なっていて、
          その違いは「言語レベル」という分類のようです。
          たとえば、一口に「沖縄方言」と言っても、
          「いらっしゃいませ」(標準語)に対して

          「めんそーれ」(沖縄本島)
          「おーりとーり」(八重山諸島)
          「んみゃーち」(宮古島)
          「おじゃりやれ」(大東諸島)

          ここまで違うと、確かにくくりきれませんね。
          ついでに、
          「いもりんしょれ」(奄美)
          ってのも挙げときましょう。

          ここは、単一民族どころか、意外に多文化な国です。
          親コメント
        • Re:日本でも (スコア:2, すばらしい洞察)

          by albireo (7374) on 2002年11月13日 7時18分 (#199681) 日記
          >日本語の亜種ともいうべき各地の方言も薄れつつあります。

          歴史的には標準語の方が亜種だと思うけど。
          --
          うじゃうじゃ
          親コメント
        • Re:日本でも (スコア:2, 興味深い)

          by kubota (64) on 2002年11月13日 9時41分 (#199758) ホームページ 日記
          ヨーロッパ言語だと、たとえばフランス語とイタリア語とスペイン語は非常に近い関係にあったり、セルビア語とクロアチア語もほとんどいっしょ、なんてことがあるけど、日本語にはなぜ似た言語がないのかな、ということを疑問に思ったことがあります。

          韓国語はよく似てるけど、日本人が韓国語を勉強しないで理解できるかというと全然そんなことないです。

          で、思ったのは、日本語に似た言語はすべて「方言」という捉え方をしているからじゃないか、と思うのです。(あるいは、日本語という単一の言語は存在しなくて、われわれがふだん「方言」と呼んでいる、諸言語の総称が「日本語」なのではないか)。だから、実際には日本には、互いに近い関係にある様々な言語があるんだけど、それを「方言」だとみなすものだから、近い関係にある言語があたかもないかのように見えてしまう。

          で、近代以降は、国家政策として言語の統一がはかられましたので、その成果として、標準語が本流の日本語で、方言はその亜流というか傍系であるという感覚を持つ人が現れるに至った、と。

          親コメント
          • Re:日本でも (スコア:2, 参考になる)

            by Acha. (9497) on 2002年11月13日 14時53分 (#199988)
            どこに付けるようか迷ったのだけどこのへんに。

            日本語と琉球語は奈良時代ぐらいに分かれ始めたと言われてますね。語彙と文法の両方が共通している点で、数少ない親戚同士ということになっています。共通の祖語に遡る単語は文献や音韻対応で確認できますし。
            # 砂の「スナ」対「シナ」とか、墓の「ハカ」対「パカ」とか
            # 古語の「ヒラサカ」(=坂。cf.黄泉比良坂)由来の「サカ」対「ヒラ」とか

            朝鮮語との関係は、文法は似通ってますが語彙に関しては漢語由来のものと渡来人がもたらしたものを除いて共通項が認められていないみたいですね。

            大陸系のアルタイ諸語との語彙の違いを説明するのに江上波夫氏の騎馬民族征服説 [inoues.net]が引き合いに出されることもありますが、この説自体が賛否両論です。
            また大野晋氏は南インドのタミル語に起源を求め、五七五七七も係り結びもタミル語起源だという日本語タミル語同系説 [amazon.co.jp]を展開しています。

            閑話休題、方言ですが、日本語がかぶさる前の日本各地は言語の異なる諸集団がいて、それが日本語の方言に影響を与えた、という説もあります。一般に東日本方言は子音が優勢、西日本方言は母音が優勢と言われますし、平安・鎌倉期の文献には「関東の奴等は『せ』を『se』で発音するんだぜ~」みたいな話が載っていたりします。(※当時の「標準語」ではサ行はシャ音。時代は下って三重県の尾鷲に鉄道が引かれ駅ができた時、駅名を「おわし」「おわせ」どちらにするかで一悶着あったのも、現地の発音がまだ「おわしぇ」で、維新国家の「標準語」に適合しなかったため)
            地名には古い音が残りやすいですから、同じ字でも東日本と西日本で読み方が違うものが結構目立ちます。たとえば「谷」は東日本では「ヤ」と読まれ、東京にも世田谷、雑司が谷、四谷、市谷、谷中とたくさんあります。鶯谷は「タニ」ですがこれは比較的新しい地名だとか。自治体名の「町」は東日本では多く「マチ」と呼ばれ、例えば東京都の五日市町(現あきる野市)も埼玉県の伊奈町も栗橋町もみんな「~マチ」であって「~チョウ」ではありません。一方四国南部や九州では「村」を「ソン」と読んだり、「原」を「ハル」と読んだりする地名が多いですよね。

            何だかキリが無いのでこのへんで強引にまとめると、方言そのものが残せないとしたら、せめて地名ぐらいは古いものが残って欲しいなぁと思いつつ。
            親コメント
        • 日本国内のマイノリティの中でもあまり知られていない 小笠原の欧米系日本人 [dti.ne.jp] の方々は
          英語と日本語を両方使っている [metro-u.ac.jp] そうです。
          英語を母語とする人は少数派であるにも関わらず、共通の言葉として使われたのは英語だそうで、
          異なる言語間の接触で自然にあらわれた「接触言語」であるとのことです。
          閉鎖せず人との関わりを持ち続ける限り、言語は変わらずにはいられないのではないでしょうか。
          親コメント
        • by rainforest (4616) on 2002年11月13日 11時29分 (#199830) 日記
          「亜種」という言い方は、元々の「日本語」があって
          その派生したものという印象を与えてよろしくないですね。

          では、変種(英語のvarietyの訳)ではどうでしょう。
          英語では、アメリカ英語、オーストラリア英語等、ある集団で
          話されている英語はすべてvarietyの一つであり、正しい英語と
          いうものはない、という話を聞いたことがあります。

          「標準語」ももちろん日本語の変種の一つです。
          親コメント
      • ポーランドを思い出しました。
        大昔は多民族、多言語の国だったようですが、
        近現代の戦乱により、ポーランド人の
        ポーランド語しか残らなかったそうです。

        # 国境も大きく揺れ動いていた模様
        親コメント
    • Re:せめて記録だけでも (スコア:1, すばらしい洞察)

      by Anonymous Coward on 2002年11月13日 11時45分 (#199840)
      我々の子孫が英語を話しながら、失われた祖先の言語を研究する、 なんていうのはイヤですね。
      我々の子孫が日本語標準語を話しながら、失われた祖先の言語 (ケセン語とか) を研究するなんていうのはイヤですね。
      親コメント
  • by u1p (2709) on 2002年11月12日 21時27分 (#199381) 日記
    大きくて良いから肉眼で見られるサイズも希望。

    ウェブで1400語を見てみたい気もするし。
    当然画像ファイルだったりするよな。(エンコード)

    方言とか古語とかは入らんの?
    物理的に彫っちゃうと、そう言うの追加していけないよね。

    などなど。
    • by nijimasu (2879) on 2002年11月12日 23時30分 (#199471) ホームページ 日記
      >ウェブで1400語を見てみたい気もするし。
      現用文字28種+歴史的文字89種ですが、

      『世界の文字』 [nacos.com]
      親コメント
    • by kubota (64) on 2002年11月12日 21時59分 (#199407) ホームページ 日記
      あるふたつの言語があったとき、 それは互いに「異なる言語」なのか、 それとも方言の関係にあるのか、 というのは、明確に線が引けるようなものではありません。

      むしろ、ひとつの言語と見たほうが都合がいいか、 それとも別の言語とみなしたほうがうれしいか、 といった、ひとの願望とか政治的意図とか社会的合意とか、 そういったもので決まってくる部分が大きいのではないかと思います。

      親コメント
  • by jack_mexfer (3850) on 2002年11月12日 21時32分 (#199385) 日記
    バージョン違いで大量に保存とか.
     
    --
    // jack_mexfer
  • 錆びたりしないのかなあ。

    ここは、少しお金がかかっても、プラチナとかの、錆びない
    ディスクの方が長持ちしていいんじゃないか、と。

    #たしか、ボスコーンの記録媒体もプラチナだったような。
    • by kai (5115) on 2002年11月12日 22時58分 (#199449) ホームページ
      あんまり高価な金属を使ってしまうと盗掘されてしまいそうだ。ここはやっぱり元祖ロゼッタストーンにならって石が良いのでは。容量の問題はあるけど。
      親コメント
    • でした。
      #マイナスモデレート希望。
      親コメント
  • 同一の体積で多くの文字を記録するならば、円盤よりも長方形の板のほうが効率が良いと思うのですが、なぜに円盤なのでしょう?

    中心を軸に回転させるような記録メディアのようなことはしなさそうにみえるのですが。

    --
    // kraymor
  • by Gamma8 (10685) on 2002年11月12日 22時15分 (#199419) 日記
    保存も結構なんだが、何語と正確に区分けできるほど、言語って固定してるもんだっけか?

    日本語一つとっても、年々変化しとるし、発生当時のオリジナルなんて、もはや存在してないと同義だと思うんだが?
    (ま、英語にしたところで、同じようなもんなんだが、JUDOが英語の辞書に載ってるのは有名な話だし)

    結局、遠未来の国語学者か言語関係の研究者用の玩具を残すプロジェクトにしか見えんのだが......
    --


    (_ _)ZZZZzzzzz...... I'm sleepy
    • by unnya (10872) on 2002年11月13日 13時33分 (#199918) ホームページ 日記
      そもそも、人間って何かというと「記録(というか、生きた証)を残したがる」動物だと思います。昔から洞窟の壁画や書物やなんだで残してきた記録って、色々な意味ですごく不完全な物のはずなんですが、あの時代の人たちって残す「意味」なんて考えて残してきたんでしょうか?

      玩具で結構、2,000年後の人に夢とロマンを与える(かもしれない)と思えばこのプロジェクトは無駄であるとは思いません。
      親コメント
    • 言語は確かに流動的ですし、その区分にも様々な要因が絡んで
      来るとは思いますが、それでも例えば今さっきあなたが書き込み
      私が答えている言葉は日本語以外の何物でもありますまい。
      曖昧な境界例があるのは確かですが、だからといって区分に
      意味が無いと言ってしまうのは極論では。

      あと、言語は単語だけからなるものでもありますまい。JUDOが
      英語になったからどうだというのでしょう。大量の外来語を
      取り込みながらも、日本語はやっぱり日本語ですわな。
      親コメント
    • なぜそんないい加減なけちのつけ方をするかなあ。何のために言語の研究をするのか考えてみた?
      固定してないからって今の姿を残さなくていいことにはならない。危機に瀕する言語が消滅してからじゃ遅いから今保存しないと取り返しがつかないんだし。変遷を研究するにもそのときどきの正確な姿が記録されていたほうがいいに決まっている。WIRED NEWS の記事にも

      言語の発達過程や人間の移動の特性を研究するうえで、非常に重要な研究用ツールになる

      って書いてあるでしょ。

      親コメント
      • 発達過程ですか?

        それなら、オリジナルが無ければ、お話にもならないのではないでしょうか?

        例えば、日本語一つをとっても、時代によってかなり違うものですしね。ケチをつけているんじゃなくて、変遷を本当に知りたいのなら、発生過程からの逐次記録がいると思っているわけです。もちろん、#199385の意見の様に、今現在をオリジナルのTHE 日本語とでも規定して、毎年、記録し続けるのも面白いかもしれませんが、それにしたところで、既に2000年以上も変遷を続けてきた結果ですし、果たしてそんな不備のあるデータで意味を成すんでしょうか?

        むしろ、今回のは文字通り、ロゼッタストーンにしかならないと思いますけどね。言語の保存というより、未来人の古代文献解読用の手がかりと思ったほうが正しいと思います。だいたいが、記録できるといったところで、日本語の一部でしょうし、そんな不完全なもので人類の移動まで調査できませんよ。本気でやるなら、各地方の方言も含めて、独立した言語として記録すべきでしょう。実際、方言は日本人の移動の記録として、考古学でも手がかりとなっているほどです。

        正直、この程度の不完全なものでは、それこそ、玩具でしょう。せっかく、古代よりも大容量が残せる時代なのですから、一枚に全部乗せようなんて思わずに各言語単位で、ディスク1枚とか(実際にはそれでも無理があると思うのだが)、できないのですかねぃ
        --


        (_ _)ZZZZzzzzz...... I'm sleepy
        親コメント
        • 言いたい事はわかりますし同意する部分もあるのですが、
          正直、この程度の不完全なものでは、それこそ、玩具でしょう。
          という発言が『ケチをつけている』事になると思います。

           ロゼッタストーンだって資料としては不完全ですし、量もわずかですが
          誰もそれが玩具でしかないとは考えていないと思います。
          --
          李 露星
          親コメント
          • もちろん、ケチですよ

            ある行動に関して否定的な意見なんですから、どんなに穏やかに指摘したところで、当事者から見ればケチでしょう

            大容量の記憶手段があるなら、それを活用すべきだし、この手段だと、登録できる文字数にも限界があるでしょう。文法だけが言語だとは思いませんし、単語数が多ければいいってものでもないですし、その兼ね合いが難しいのは分かるとはいえ、1枚に収めてしまう以上は意図的な情報の省略はしてるでしょうしね。そういう手抜きが嫌なだけですよ。

            目的を考えると、ただの辞書ディスクじゃまずいでしょうしね。後世に残すなら、できるだけの配慮はして欲しいですね。と言うか、本気でそのつもりなのかも疑問なんですけどね。
            --


            (_ _)ZZZZzzzzz...... I'm sleepy
            親コメント
            • このディスクに記録されなかったからといって否定されたり抹殺されるわけではないですよ。
              これは2000年後まで、技術の断絶があっても読み取り可能なアーカイブを作ることが目的です。
              それを可能にするために取りこぼしは覚悟の上で内容を選別するのは現実的な選択ではないでしょうか。

              別にこのディスクだけにすべてを頼る必要はありません。
              不十分だと思えばもっと大容量を記録できる他の手段を使ってもいいのだから。
              --
              うじゃうじゃ
              親コメント
            • 他の方法もいろいろやれば良いと思うけれど、 例えば一言語一ディスクにしたとして、2000年後まで 全てのディスクがひと揃いになっている保証はどこにも無いわけで。 バラバラになって、しかもそのディスクが何のためかという 情報さえも失われた場合のことを考えると、 「一枚のメディアに」「同じ内容が」「多種の言語で」記されている、 という資料はバラバラの情報を結びつける手がかりとして 非常に重要になるんじゃなかろうか。(まさにロゼッタストーンが そういう役割を果たしたように)。

              親コメント
            • by kero (6940) on 2002年11月13日 10時51分 (#199805) ホームページ 日記
              私は"人類"は不完全な生き物だと思っている.
              その程度のものならば,残す価値は無いでしょう.

              って考えなのかしら?

              #残せるデータは出来るだけ残しておくと,後で良いことがあるんじゃないかな.
              #短期的なものだと,仕様書とか・・・
              --
              kero
              親コメント
        • 未来人の古代文献解読用の手がかりと思ったほうが正しいと思います。
          まったくそのとおりですね。 タレこみ文ではそれが伝わらなかったかもしれませんが、 Wiredの記事を読んでもらえれば納得してもらえるんじゃないかな。
          記録できるといったところで、日本語の一部でしょうし、そんな不完全なもので人類の移動まで調査できませんよ。
          考古学では、 さびてぼろぼろになった銅剣に刻まれた漢字らしきものから 当時の王様の名前を推測したりする、 ある意味むちゃくちゃとも思える方法がまかり通っている (というか、それ以上の手がかりがない) くらいなんですから、 たとえ不完全でもこれだけの情報量を遠い未来に残すことが意味を成さないとは考えられないけどなぁ。

          「一枚に全部乗せよう」なんて、書いてありましたっけ? むしろあるものはみんなのせるぞ、くらいの勢いだと思うんでけど。

          --
          use Test::More 'no_plan';
          親コメント
    • by Anonymous Coward on 2002年11月12日 23時03分 (#199453)
      その通り、学者の研究用だと思いますよ。

      今、上代や平安初期の日本語研究をしてる人は
      えらく苦労をしていますからね。自分の遠い遠い後輩の苦労を
      少しでも軽減しようと言うのですから、素晴らしい努力だと思います。
      親コメント
  • おもしろ数のCountriesが出てきますね。
    ここで、Japaneseで調べると出てくるんですけれども。

    日本語って、案外いろいろなところで使えるのですね。
    #僕の誤解じゃないですよね。
  • やっぱり、C と FORTRAN と COBOL で個々別々に実装した Linux kernel を書いていただかないと...

    # で、未来人が解読する時に取っ掛かりにするのはどの言語?

typodupeerror

最初のバージョンは常に打ち捨てられる。

読み込み中...