アナログディスクで世界の言語を永久保存 90
ストーリー by Oliver
あちこちに埋めまくり 部門より
あちこちに埋めまくり 部門より
torus 曰く、 "
WIRED NEWS の記事によると、「今、科学者と技術者からなるグループ
『ロゼッタ・プロジェクト』が、現代版ロゼッタ・ストーンの作成に取り組んでいる。直径約7.6センチのニッケル製ディスクに世界の言語約7000種類のうち1400種類以上を記録し保存しようというのだ。「情報は、『0』と『1』ではなく、普通の文字で記録される。倍率1000倍の顕微鏡さえあれば、未来の人類はこの超縮小印刷されたテキストを読むことができる」のだそうで、デジタルの恩恵にどっぷり浸かっている立場からすると、時代に逆行しているようにしか見えませんでしたが、「耐用年数2000年」という記述をみて納得しました。
また面白いのは「『言語学界のリナックス』を完成させよう」という彼らの方針で、膨大な量のデータを扱うためにオープンソース的な方法を採用し、
無料のオンライン・アーカイブなども公開している。非常に遠い未来の言語学者によって活用されることを目的とした、この壮大なプロジェクト、これからの学問における文献の扱いや、多くの人による共同作業のあり方についてもいろいろ考えさせられて興味深い。"
音声も収録予定 (スコア:2, 参考になる)
ただ、音声はどうやって記録するんでしょう。やはりレコードの溝みたいなのにするんでしょうか。
昔のアイヌ語を録音した蝋管は、何十年も経ってから価値が再発見され、なんとか再生が可能だったようですが、今度のプロジェクトのは、いかに再生可能性を保証していくんでしょうか?
# 宇宙を行くボイジャーには、異星人へのメッセージを吹き込
# んだディスクを積んであるそうですが、これはさながら、未来
# 人へのメッセージといえるでしょうか。
せめて記録だけでも (スコア:2, 興味深い)
本当はその言語を話す集団が存続できれば一番良いはずなんですが。
主に、その言語圏では生活を完結できないというような
経済的な理由からマイナーな言語は失われてゆくのでしょうね。
# 世界の言語の90%が100年以内に消滅するという予想もあります。
我々は日本語だけですべての教育を受けられ、生活できる幸せを
もっと考えてもよいでしょう。
我々の子孫が英語を話しながら、失われた祖先の言語を研究する、
なんていうのはイヤですね。
日本でも (スコア:3, すばらしい洞察)
Re:日本でも (スコア:2, 興味深い)
その通りではあるでしょう。現に、かつて存在していたアイヌ語は
実質的に失われてしまいましたし、日本語の亜種ともいうべき各地
の方言も薄れつつあります。
それと同じ事が地球規模で起こりつつあるというとに対して、
せめて、今我々が話している言葉には生き残ってもらいたい
と思わずにはいられません。
Re:日本でも (スコア:3, 参考になる)
日本国内で使われている言語は、手話を入れて15語。
日本語を話す人口が圧倒的に多いですが、第二位のKoreanが5%もおります。
他、アイヌはもちろん、沖縄「方言」は、各種島ごとに異なっていて、
その違いは「言語レベル」という分類のようです。
たとえば、一口に「沖縄方言」と言っても、
「いらっしゃいませ」(標準語)に対して
「めんそーれ」(沖縄本島)
「おーりとーり」(八重山諸島)
「んみゃーち」(宮古島)
「おじゃりやれ」(大東諸島)
ここまで違うと、確かにくくりきれませんね。
ついでに、
「いもりんしょれ」(奄美)
ってのも挙げときましょう。
ここは、単一民族どころか、意外に多文化な国です。
Re:日本でも (スコア:2, すばらしい洞察)
歴史的には標準語の方が亜種だと思うけど。
うじゃうじゃ
Re:日本でも (スコア:2, 興味深い)
韓国語はよく似てるけど、日本人が韓国語を勉強しないで理解できるかというと全然そんなことないです。
で、思ったのは、日本語に似た言語はすべて「方言」という捉え方をしているからじゃないか、と思うのです。(あるいは、日本語という単一の言語は存在しなくて、われわれがふだん「方言」と呼んでいる、諸言語の総称が「日本語」なのではないか)。だから、実際には日本には、互いに近い関係にある様々な言語があるんだけど、それを「方言」だとみなすものだから、近い関係にある言語があたかもないかのように見えてしまう。
で、近代以降は、国家政策として言語の統一がはかられましたので、その成果として、標準語が本流の日本語で、方言はその亜流というか傍系であるという感覚を持つ人が現れるに至った、と。
Re:日本でも (スコア:2, 参考になる)
日本語と琉球語は奈良時代ぐらいに分かれ始めたと言われてますね。語彙と文法の両方が共通している点で、数少ない親戚同士ということになっています。共通の祖語に遡る単語は文献や音韻対応で確認できますし。
# 砂の「スナ」対「シナ」とか、墓の「ハカ」対「パカ」とか
# 古語の「ヒラサカ」(=坂。cf.黄泉比良坂)由来の「サカ」対「ヒラ」とか
朝鮮語との関係は、文法は似通ってますが語彙に関しては漢語由来のものと渡来人がもたらしたものを除いて共通項が認められていないみたいですね。
大陸系のアルタイ諸語との語彙の違いを説明するのに江上波夫氏の騎馬民族征服説 [inoues.net]が引き合いに出されることもありますが、この説自体が賛否両論です。
また大野晋氏は南インドのタミル語に起源を求め、五七五七七も係り結びもタミル語起源だという日本語タミル語同系説 [amazon.co.jp]を展開しています。
閑話休題、方言ですが、日本語がかぶさる前の日本各地は言語の異なる諸集団がいて、それが日本語の方言に影響を与えた、という説もあります。一般に東日本方言は子音が優勢、西日本方言は母音が優勢と言われますし、平安・鎌倉期の文献には「関東の奴等は『せ』を『se』で発音するんだぜ~」みたいな話が載っていたりします。(※当時の「標準語」ではサ行はシャ音。時代は下って三重県の尾鷲に鉄道が引かれ駅ができた時、駅名を「おわし」「おわせ」どちらにするかで一悶着あったのも、現地の発音がまだ「おわしぇ」で、維新国家の「標準語」に適合しなかったため)
地名には古い音が残りやすいですから、同じ字でも東日本と西日本で読み方が違うものが結構目立ちます。たとえば「谷」は東日本では「ヤ」と読まれ、東京にも世田谷、雑司が谷、四谷、市谷、谷中とたくさんあります。鶯谷は「タニ」ですがこれは比較的新しい地名だとか。自治体名の「町」は東日本では多く「マチ」と呼ばれ、例えば東京都の五日市町(現あきる野市)も埼玉県の伊奈町も栗橋町もみんな「~マチ」であって「~チョウ」ではありません。一方四国南部や九州では「村」を「ソン」と読んだり、「原」を「ハル」と読んだりする地名が多いですよね。
何だかキリが無いのでこのへんで強引にまとめると、方言そのものが残せないとしたら、せめて地名ぐらいは古いものが残って欲しいなぁと思いつつ。
Re:日本でも (スコア:2, 参考になる)
英語と日本語を両方使っている [metro-u.ac.jp] そうです。
英語を母語とする人は少数派であるにも関わらず、共通の言葉として使われたのは英語だそうで、
異なる言語間の接触で自然にあらわれた「接触言語」であるとのことです。
閉鎖せず人との関わりを持ち続ける限り、言語は変わらずにはいられないのではないでしょうか。
Re:日本でも (スコア:1)
その派生したものという印象を与えてよろしくないですね。
では、変種(英語のvarietyの訳)ではどうでしょう。
英語では、アメリカ英語、オーストラリア英語等、ある集団で
話されている英語はすべてvarietyの一つであり、正しい英語と
いうものはない、という話を聞いたことがあります。
「標準語」ももちろん日本語の変種の一つです。
Re:日本でも (スコア:1)
大昔は多民族、多言語の国だったようですが、
近現代の戦乱により、ポーランド人の
ポーランド語しか残らなかったそうです。
# 国境も大きく揺れ動いていた模様
Re:日本でも (スコア:1)
Re:せめて記録だけでも (スコア:1, すばらしい洞察)
思いつくままに (スコア:1)
ウェブで1400語を見てみたい気もするし。
当然画像ファイルだったりするよな。(エンコード)
方言とか古語とかは入らんの?
物理的に彫っちゃうと、そう言うの追加していけないよね。
などなど。
Re:思いつくままに (スコア:2, 参考になる)
現用文字28種+歴史的文字89種ですが、
『世界の文字』 [nacos.com]
方言 (スコア:1)
むしろ、ひとつの言語と見たほうが都合がいいか、 それとも別の言語とみなしたほうがうれしいか、 といった、ひとの願望とか政治的意図とか社会的合意とか、 そういったもので決まってくる部分が大きいのではないかと思います。
毎年保存? (スコア:1)
// jack_mexfer
ニッケルでいいのかなあ? (スコア:1)
ここは、少しお金がかかっても、プラチナとかの、錆びない
ディスクの方が長持ちしていいんじゃないか、と。
#たしか、ボスコーンの記録媒体もプラチナだったような。
Re:ニッケルでいいのかなあ? (スコア:2, すばらしい洞察)
Re:ニッケルでいいのかなあ? (スコア:1)
おお、ファインセラミックスですな。2000年保ちそう。 (刻むの大変?)
の
s/ボスコーン/エッドール/ (-1) (スコア:1)
#マイナスモデレート希望。
Re:金じゃすぐに磨耗しちゃうよ… (スコア:2, 参考になる)
耐酸化性が求められるジェットエンジンのタービンブレードはNi基超合金がほとんどです(高温強度もそこそこあるし)。
しかし、
>Niは高価なステンレスを作るための材料でもあるので、酸化は極表面でとまるはずです。
っていうのがちょいと引っかかりますね。
一般的にステンレス鋼はCrの酸化被膜で不動態化するんですが、
「高価なステンレス」では不動態膜がNi酸化物になるんでしょうか?
聞いたことないなぁ。
Niはもっと別の効果を狙って添加されているはずです。
β相(オーステナイト)領域を常温まで拡大するとか。
#鉄鋼材料の勉強をしたのはだいぶ前なので詳細は忘れました…。
「酒を飲むと酔っ払う。すべての酒には水が入っている。だから酔っ払うのは水のせいだ」みたいな理屈になってますね?
>PtとかAuとかいってる奴らは出直してきて下さい。
上記のごとき与太を飛ばすあなたもね。
なぜに円盤?(素朴な疑問) (スコア:1)
同一の体積で多くの文字を記録するならば、円盤よりも長方形の板のほうが効率が良いと思うのですが、なぜに円盤なのでしょう?
中心を軸に回転させるような記録メディアのようなことはしなさそうにみえるのですが。
// kraymor
Re:なぜに円盤?(素朴な疑問) (スコア:1)
だが、いいこともあるぞ、外の天気は上々なんだ
Re:なぜに円盤?(素朴な疑問) (スコア:1, 興味深い)
Re:なぜに円盤?(素朴な疑問) (スコア:1)
#「言語」じゃなくて「用字」という説もあるが、ま、それはさておき。
iida
Re:なぜに円盤?(素朴な疑問) (スコア:1)
例えばアラビア語を知らない人が、上下を間違えたり、左から読もうとしてみたりしてもおかしくない。
// Give me chocolates!
何の意味があるんだか? (スコア:1, 興味深い)
日本語一つとっても、年々変化しとるし、発生当時のオリジナルなんて、もはや存在してないと同義だと思うんだが?
(ま、英語にしたところで、同じようなもんなんだが、JUDOが英語の辞書に載ってるのは有名な話だし)
結局、遠未来の国語学者か言語関係の研究者用の玩具を残すプロジェクトにしか見えんのだが......
(_ _)ZZZZzzzzz...... I'm sleepy
意味がないといけないんですかね? (スコア:3, すばらしい洞察)
玩具で結構、2,000年後の人に夢とロマンを与える(かもしれない)と思えばこのプロジェクトは無駄であるとは思いません。
Re:何の意味があるんだか? (スコア:2, 興味深い)
来るとは思いますが、それでも例えば今さっきあなたが書き込み
私が答えている言葉は日本語以外の何物でもありますまい。
曖昧な境界例があるのは確かですが、だからといって区分に
意味が無いと言ってしまうのは極論では。
あと、言語は単語だけからなるものでもありますまい。JUDOが
英語になったからどうだというのでしょう。大量の外来語を
取り込みながらも、日本語はやっぱり日本語ですわな。
Re:何の意味があるんだか? (スコア:2, すばらしい洞察)
なぜそんないい加減なけちのつけ方をするかなあ。何のために言語の研究をするのか考えてみた?
固定してないからって今の姿を残さなくていいことにはならない。危機に瀕する言語が消滅してからじゃ遅いから今保存しないと取り返しがつかないんだし。変遷を研究するにもそのときどきの正確な姿が記録されていたほうがいいに決まっている。WIRED NEWS の記事にも
って書いてあるでしょ。
Re:何の意味があるんだか? (スコア:1)
それなら、オリジナルが無ければ、お話にもならないのではないでしょうか?
例えば、日本語一つをとっても、時代によってかなり違うものですしね。ケチをつけているんじゃなくて、変遷を本当に知りたいのなら、発生過程からの逐次記録がいると思っているわけです。もちろん、#199385の意見の様に、今現在をオリジナルのTHE 日本語とでも規定して、毎年、記録し続けるのも面白いかもしれませんが、それにしたところで、既に2000年以上も変遷を続けてきた結果ですし、果たしてそんな不備のあるデータで意味を成すんでしょうか?
むしろ、今回のは文字通り、ロゼッタストーンにしかならないと思いますけどね。言語の保存というより、未来人の古代文献解読用の手がかりと思ったほうが正しいと思います。だいたいが、記録できるといったところで、日本語の一部でしょうし、そんな不完全なもので人類の移動まで調査できませんよ。本気でやるなら、各地方の方言も含めて、独立した言語として記録すべきでしょう。実際、方言は日本人の移動の記録として、考古学でも手がかりとなっているほどです。
正直、この程度の不完全なものでは、それこそ、玩具でしょう。せっかく、古代よりも大容量が残せる時代なのですから、一枚に全部乗せようなんて思わずに各言語単位で、ディスク1枚とか(実際にはそれでも無理があると思うのだが)、できないのですかねぃ
(_ _)ZZZZzzzzz...... I'm sleepy
Re:何の意味があるんだか? (スコア:2)
『正直、この程度の不完全なものでは、それこそ、玩具でしょう。』
という発言が『ケチをつけている』事になると思います。
ロゼッタストーンだって資料としては不完全ですし、量もわずかですが
誰もそれが玩具でしかないとは考えていないと思います。
李 露星
Re:何の意味があるんだか? (スコア:1)
ある行動に関して否定的な意見なんですから、どんなに穏やかに指摘したところで、当事者から見ればケチでしょう
大容量の記憶手段があるなら、それを活用すべきだし、この手段だと、登録できる文字数にも限界があるでしょう。文法だけが言語だとは思いませんし、単語数が多ければいいってものでもないですし、その兼ね合いが難しいのは分かるとはいえ、1枚に収めてしまう以上は意図的な情報の省略はしてるでしょうしね。そういう手抜きが嫌なだけですよ。
目的を考えると、ただの辞書ディスクじゃまずいでしょうしね。後世に残すなら、できるだけの配慮はして欲しいですね。と言うか、本気でそのつもりなのかも疑問なんですけどね。
(_ _)ZZZZzzzzz...... I'm sleepy
Re:何の意味があるんだか? (スコア:1)
これは2000年後まで、技術の断絶があっても読み取り可能なアーカイブを作ることが目的です。
それを可能にするために取りこぼしは覚悟の上で内容を選別するのは現実的な選択ではないでしょうか。
別にこのディスクだけにすべてを頼る必要はありません。
不十分だと思えばもっと大容量を記録できる他の手段を使ってもいいのだから。
うじゃうじゃ
Re:何の意味があるんだか? (スコア:1)
他の方法もいろいろやれば良いと思うけれど、 例えば一言語一ディスクにしたとして、2000年後まで 全てのディスクがひと揃いになっている保証はどこにも無いわけで。 バラバラになって、しかもそのディスクが何のためかという 情報さえも失われた場合のことを考えると、 「一枚のメディアに」「同じ内容が」「多種の言語で」記されている、 という資料はバラバラの情報を結びつける手がかりとして 非常に重要になるんじゃなかろうか。(まさにロゼッタストーンが そういう役割を果たしたように)。
不完全? (スコア:1)
その程度のものならば,残す価値は無いでしょう.
って考えなのかしら?
#残せるデータは出来るだけ残しておくと,後で良いことがあるんじゃないかな.
#短期的なものだと,仕様書とか・・・
kero
Re:何の意味があるんだか? (スコア:1)
「一枚に全部乗せよう」なんて、書いてありましたっけ? むしろあるものはみんなのせるぞ、くらいの勢いだと思うんでけど。
use Test::More 'no_plan';
Re:何の意味があるんだか? (スコア:1, すばらしい洞察)
今、上代や平安初期の日本語研究をしてる人は
えらく苦労をしていますからね。自分の遠い遠い後輩の苦労を
少しでも軽減しようと言うのですから、素晴らしい努力だと思います。
Japaneseで調べると (スコア:1)
ここで、Japaneseで調べると出てくるんですけれども。
日本語って、案外いろいろなところで使えるのですね。
#僕の誤解じゃないですよね。
Re:Japaneseで調べると (スコア:1)
「おもしろ数」→「面白い数」です。
「ここで」というのは、示されているサイトの検索システムを使って、ということです。
これで、わかります?
「ロゼッタ」というからには... (スコア:1)
# で、未来人が解読する時に取っ掛かりにするのはどの言語?
Re:「ロゼッタ」というからには... (スコア:1)
穿孔テープ
うじゃうじゃ
Re:「ロゼッタ」というからには... (スコア:1)
APLとか
Re:つーか (スコア:1)
> 解読なんてほぼ不可能でしょう?
そうかなあ? 単にそういう表記をする言語というだけで解読不能ってことはないんじゃない?
(´д`;)
Re:つーか (スコア:1)
テキストデータを符号化する際に二進数を使うからデジタル(エンコード)なんであって、
符号化しないでそのまま文字として書き込んだものをアナログと呼んでいいんでしたっけ?
アナログってそういう意味でした?
Re:つーか (スコア:1)
「つーか」何?
use Test::More 'no_plan';
Re:つーか (スコア:1)
紀元1年ごろは、文明と呼ばれるものが栄えている地域も少なく、その中で文字を知り、
それを記述する手段を持った人々は全地球人口の中でも一握りであったろうと思われます
2000年後の現在では、そのころよりはるかに人口も増え、地上のかなりの部分が文明化されて、
情報はその文明化された地域の隅々にまで広がって、情報のアーカイブも2000年前とは
比較にならないほど偏在しています。
いわば現代文明の差分データや増分データのバックアップが世界中に保存された究
極のリダンダントバックアップといってよいかと思います
したがって、くだんのディスクが符号化してある/ないに関わらず、2000年後にその媒体を
読み出す技術もその理論も失われてしまうとは考えにくいです。
民生品としては廃れた技術であっても、理論あるいはその記述が残されていれば読み出し
装置の製造は可能なのではないでしょうか。
逆に、将来小惑星の衝突や、温暖化による大海進、複合汚染による被害などで現在の
技術文明が滅んだとしても、これだけ世界各地に蓄えられた情報のアーカイブがすべて
失われるとはやはり考えにくく、くだんのディスクはいずれ読み出されれ、その情報は、
残された情報アーカイブを補う貴重な情報になると考えます
アシモフのファウンデーションみたいにね(笑
Re:つーか (スコア:1)
Re:つーか (スコア:1)
use Test::More 'no_plan';