「日本語」話す人工知能「カイワ」登場 38
ストーリー by kazekiri
ロボットと老後を過ごす人生 部門より
ロボットと老後を過ごす人生 部門より
yuki-kun 曰く,"読売新聞の記事によれば、文部科学省宇宙科学研究所のOBらが設立したベンチャー企業が、人間を相手に日本語で自然な会話ができるコンピューターシステム「カイワ」を開発した。会話のパターンを何通りも記憶させた従来型の会話システムと異なり、名詞や助詞などの組み合わせをもとに人工知能が文章の意味を理解する。人工知能によるコンピューターの会話システムは英語ではすでに実用化されているが、英語より語順の組み合わせなどがはるかに複雑な日本語では世界で初めてとなる。 との事。
また、単語の数などの知識量を用途に応じて自由に設定できるほか、会話の中で理解できない新語が出てきても、言葉の意味を教えれば次々と理解していく。「怒りっぽい」「温和」といった性格付けや、老若男女の区別、「野球好き」「盆栽が趣味」などのし好もあらかじめ設定することができる。 らしい。
肌色ゲームに応用したら萌えるだろうか??"
この技術は (スコア:2)
組み込まれることになる。井上トロに近い情報筋
によると「上手にお話しできる様になって、胸キュン。」
とのことだ。
There is no spoon.
vs 人工無能 (スコア:2)
追加情報 (スコア:2)
開発元PtoPA社にデモ版が用意されているようです。(要登録)
しゃべるってチャットの事だったんですね。ちょっとガッカリ
IDENTIFICATION DIVISION.
AUTHOR YUKI-KUN.
Re:日本語は非論理的? (スコア:2)
日本語を母国語として生活している人間ですらよく分からないときがありますからね(^^;
日本語が他の自然言語と異なる難関の1つに、主語を省略することが多いことが
挙げられるのではないでしょうか?
あと、本来は一人称の単語が二人称に使われたりすることとか。
--- 墓穴を掘らずんば虎子を得ず --- by Miharu.T
Re:日本語は非論理的? (スコア:2)
> それと同じくらい「論理的な日本語」教育をやってほしいものです.
同感です。
「作文」の授業は小学校で終わってしまい、あとは大学受験用に「希望者に対して」小論文の添削が行われるのみ、という状態では、「論理性」そのものを学ぶ機会がありません。
大学生の「数学力」が問題になっていますが、国語力の低下もおそらくかなりのものと思います。
そして、国語力の低下はコミュニケーション能力の低下をまねきそうでこわい。
Re:追加情報 (スコア:2)
一般には開放してないそうです。残念。
システム持ってデモに伺いますがって言ってたので
興味がある人はいかが?
資料も送ってくれるそうですよ。
IDENTIFICATION DIVISION.
AUTHOR YUKI-KUN.
肌色ゲーム (スコア:1)
-- やまぐち
Re:肌色ゲーム (スコア:1)
#「肌色の微妙なグラデーションを愉しむゲーム」という表現がより適切かな?(爆)
萌えますねぇ… (スコア:1)
「何か」に組み込んで、電脳執事に…ならないって
でも、元記事では情報が全然足りない…。
社名を検索エンジンに掛けても引っかからないし…
もっと詳しい情報が欲しいー!!
#読売新聞に電話するしか…
Re:萌えますねぇ… (スコア:1)
クニタチダイガク
コクリツダイガク
のどちらですかって。
英語より語順の組み合わせなどがはるかに複雑な日本語 (スコア:1)
これには反対っす。日本語は、前にある言葉が後ろにある言葉に「かかる」という原則がすごく強い。英語だと、動詞に対して主語は前から、目的語や補語は後から「かかる」。(大部分の)形容詞は名詞に対して前から、関係代名詞(句)は後から「かかる」。
むかし、これを利用して、まったく辞書なしで構文解析もどきをやったことがあります。文節の最後の文字(ひらがな)によって体言、用言、体言を修飾する語、・・・などと分類し(文節区切りは人間が与えないといけない)、「かかる」「かかられる」関係は入れ子になることはあっても交差することはない(言葉でいうと説明しにくいけど、BASIC で多重 FOR~NEXT をやったとき、FOR の変数の逆順で NEXT を書かないといけないのと同じといえば分かるかな)、文節に「、」がついたときは直後の文節に「かかる」ことを禁止する、などのルールによって「かかる」「かかられる」の可能なパターンをすべて表示するというもの。
ずいぶんと昔のことだからかなり忘れてしまったけど、「かわいい 目の 青い 女の 子」なんか何十通りにも解釈できる、という結果になったと思う。
本多勝一『日本語の作文技術』に載っている、「刑事は 血まみれになって 逃げる 強盗を 追いかけた」という例についても、この文はあいまいな文だということを指摘することに成功しました。(どこがあいまいかって?血まみれなのは強盗?それとも刑事?) というか、このプログラム自体が、この本に触発されて作ったものです。この本オススメ。
たぶん 100 行程度の perl スクリプトか C のプログラムだったと思うけど、それでもここまでできる、という例。
まだどこかにソースが残ってたらいいんだけど。。。
アレゲな人相手は高そうだ :P (スコア:1)
大体ちょっと遊ぶ程度ならわかるけど、本当に話し相手になれるのか?すぐに飽きてしまうようなものじゃないのか?
サンプル見てみたいけど見つかんないなぁ。
Re:英語より語順の組み合わせなどがはるかに複雑な日 (スコア:1)
よく判らなかったんですが、
>何十通りにも解釈できる
かつ
>>英語より語順の組み合わせなどがはるかに複雑な日本語
>これには反対っす
ってことはもしかしてもしかすると、
日本語は、語順の組み合わせなどは簡単だが、
その先に存在する多数の解釈から1つの正解を
見つけるのが超困難な言語だ、という話なのでしょうか?
問題は簡単だけど答えは難しい(笑)って奴?
俗に言う「日本語は非論理的だ」とかいうあれに
通じるんでしょうかそれって?
Re:英語より語順の組み合わせなどがはるかに複雑な... (スコア:1)
すみません、分かりにくい書き方をしてしまいいました。
何通りにも意味がとれる文というのは、どんな言語でも存在します。英語だったら、(形容詞) (名詞1) and (名詞2) という表現があったとき、(形容詞) は (名詞1) だけにかかるのか、それとも (名詞1) と (名詞2) の両方にかかるのか、という両方の解釈が成立します。日本語でも同じですね。日本語だけがとくに非論理的というわけではないと思います。
日本語は構文が簡単なので、構文チェックプログラムみたいなのが簡単に書けてしまう、というつながりのつもりでした。
Re:アレゲな人相手は高そうだ :P (スコア:1)
エキスパートシステムとしての利用と対比させて、
「話を聞いて相槌を打つだけでよい」という利用なら実現は簡単だよー、
って言いたかったんだろうね…
#しかし、人工知能から「おじいちゃん、その話はさっき聞きましたよ」って言われたら鬱だ…
# mishimaは本田透先生を熱烈に応援しています
日本語は非論理的? (スコア:1)
「日本語は非論理的だ」ってよく言われるけれど,あれほどナンセンスな主張はないと思っています.論理的な文章を日本語で書くことはできないというのかな? 大学教育すら日本語でできるのに.そもそも,非論理的な自然言語ってあるのですか?
私の知る限り,「日本語は非論理的だ」という主張は,
日本語は注意しないと曖昧になりやすいことには同意しますが,英語だってそういう性格は持っています.ただ,少なくとも英語の世界では,論理的明晰さを重視する technical writing の技術が確立・普及しているのに対し,日本語の世界では,まだ十分に確立しておらず,そのための教育もろくに行われていないということじゃないでしょうか?
私見では,義務教育の「国語」の授業が,小説や詩歌などの「美しい日本語」教育に偏りすぎているのが大いに不満です.それと同じくらい「論理的な日本語」教育をやってほしいものです.
------
Yoshige
Re:vs 人工無能 (スコア:1)
Re:日本語は非論理的? (スコア:1)
「カイワ」ですけれど、これはいわゆる文語で表される「、(読点)」「。(句点)」の扱いなどは、もちろん考慮されるんですよね? 口語では微妙な「間(息継ぎ)」で表現されますけれど、記事を見た限りでは掲載されていなかったので、どうかわかりませんです。
さらに、ユーザの声から文章を解析して、それに対して音声で返事をするシステムだと思うのですけれど、やっぱりカーニングとか必要なのでしょうか?
日本語は、諸外国と違う文法(動詞が文章の最後の方にくる)であることと、漢字・カタカナ・ひらがなという異なった3種の文字の組み合わせのために、その難解さから「東洋の魔術語」などと呼ばれたりしたらしいです。しかし、それと同時に、諸外国の言葉をカタカナ語として柔軟に取り込んだりもできる、表現力豊かな言語だと思いますです。そのため、表現が多彩な分、簡単に曖昧になるのではないでしょうか? また「論理的明晰さ」を欠きやすいのかもしれないと思ったです。
「カイワ」がどの程度のあいまいさをもっているのかはわかりませんけれど、技術的には立派な研究だと思うので、がんばってほしいです。
それとは別に、いわゆる最低限の「日本語の書き方」=「作文技術」(小論文の書き方とまではいきませんけれど)を身に付けたいな、とも思いますです。肝心の人間が「高次元日本語」を話すようでは、「カイワ」も解析に困ってしまうでしょうし。
-------- SORAMINE Yukino
ネーミング (スコア:1)
しかし、こういうネーミングセンスから、完成品の味付けが何となく想像出来てしまうんだよな・・・。
--
10 beep
20 goto 10
日本語文解析プログラム (スコア:1)
日本語は逆ポーランド記述 (スコア:1)
ですから, 主語に当たる物がスタック上に存在していれば問題無いんですね. だから, スタックがクリアされた状態だとスタックアンダーフローが発生して「何が?」というエラーメッセージが発せられることになるわけです.
さらにオブジェクト指向的特徴も持っていて, スタック上に有るオブジェクトのクラスによってメッセージの実態が動的に定義されるので, 会話の際にはインターフェイスのチェックをおろそかにできません.
有名な「僕はウナギだ.」という文例も, スタック上に注文クラスのオブジェクトが有るという状態なら, 最初の「僕は」が注文クラスに渡された段階で個人別注文オブジェクトが結果としてスタックにプッシュされ, 最後の「ウナギだ」で「ウナギ」という値がセットされるという処理が期待できます.
Re:日本語は非論理的? (スコア:1)
日本語の文法は、英語等に比べると例外等が少なく、自然発生したのではなく、まるで最初に言語仕様(文法)がきっちり決められていたかの様だ。
赤ん坊の話し方を見ると、主語、動詞、目的語という(英語等のような)語順で話しをすることが多いが、その語順をひねった文法となっているのは、日本語は英語等よりも”高級”なのではないか?
ということでした。
これが真実であれば、日本人としての心をくすぐられますね。
ただし、一言語学者の意見に過ぎないかも知れません。
(朝日新聞掲載記事だったかな?)
Re:ネーミング (スコア:1)
何の脈絡もなくいきなり「ここで問題です!」と言ってクイズを出したり、何故か「ときめきメモリアル」に詳しかったりと、本来の目的とは違う意味で面白いサービスでした。
※調べてみたらまだ「会話くん」は現役らしい
一人暮らしの老人や「引きこもり」との会話が例に出てくるということは、とりあえずカウンセリングやメンタルケア用途で導入したい意向なのでしょうか。
ELIZA みたいなエキスパートシステムをイメージした方が近いのかも。
Re:ネーミング (スコア:1)
Re:英語より語順の組み合わせなどがはるかに複雑な... (スコア:1)
現実として感じてはいますが、それに賛同する気には
なれない人間の一人です。
上の文であの説を引っ張り出しましたが、
それを応援する気はまったくありません(笑)。
>日本語は構文が簡単なので、構文チェックプログラムみたいなのが簡単に書けて
構文「は」簡単にチェックできる、ってことですか。なるほど。
Re:日本語は非論理的? (スコア:1)
(論理から見て)ノイズの多い言語は有るんでしょうけど、
ノイズのみから成る言語ってのは、多分人間にとって
理解不能でしょうから、「無い」でしょうね。
Re:日本語は非論理的? (スコア:1)
その助詞の使われ方が結構ふらついていたり。
"それは私の好きなものです"
"それは私が好きなものです"
の二つがどっちも同じ意味を指す(ことが出来る)なんていう事実により、
ちょっと異人さんにお勧めするのを躊躇しちまいます。
こんなので大丈夫なのかよ?と。
文脈や文脈以外の何か(with?)に、強く依存して
色んな意味にサレちゃうんですよねえ、単語が。
ちと、辛い。
Re:日本語は逆ポーランド記述 (スコア:1)
そういや日本語Forth「Mind」なんてのもありますね。
http://www.scripts-lab.co.jp/mind/ver7/v7unix_download.html
>さらにオブジェクト指向的特徴も持っていて, スタック上に有るオブジェクトのク
>ラスによってメッセージの実態が動的に定義される
あと手前ソースのこれも日本語通るようにしたいなあ。
似たような言語(PostScript風)なんだし、OOPなんだから。
まぁEUCならそのまま通るか(笑)
http://member.nifty.ne.jp/guion/SOFT/INDEX.HTM#bbbb
>最初の「僕は」が注文クラスに渡された段階で個人別注文オ
>ブジェクトが結果としてスタックにプッシュされ, 最後の「ウナギだ」で
あっそうか。「僕」Objectの前に「注文取り」Objectが
既にStackに乗っているんですね(^^;
実は注文取りObjectへのメソッドだった、と。
ただ、そうすると尚のこと、助詞は捨て(=意味的に無視)なのか?という
日本語伝統に対して寒い結論が、近づいてきそうで…(^^;
Re:日本語文解析プログラム (スコア:1)
ver000の奴ばっかり3つ並んでいる。
Re:日本語文解析プログラム (スコア:1)
素人考えでは (スコア:1)
その”場”に何が求められているかがわからないと 正しい(とその場で判断される)意味を汲み取れないということですよね。
小説とかでよく同じ言葉が冒頭に出てきたシーンと、すべてからくりが明かされた後でまったく意味が変わって来るのも、似てませんか?違うかな?
だから、日本的なものというのは”察し”ないと、上手く使えないのではないかと邪推します。
Re:ネーミング (スコア:1)
Re:日本語は非論理的? (スコア:1)
あとは受験で小論文が必要になって「新聞の社説を読みましょう」って…
#新聞の社説程度のレベルでいい、ということだな……
某氏の signature でも名高い「理科系の作文技術」で初めて気が付かせられて愕然としたんだけど、テーマの絞り込み方とか主張する順序の選び方とかって、論理立てて伝達できるようなテクニックだったんですねぇー
上の文書くのに、例示や表現で苦労してしまったんですけど、そのあたりが日本では教授されることがなかった所為で、そもそも概念の蓄積が乏しくて苦しむことを示してますね…。
「それがどうした、おれたちには関係ない」
Re:日本語は非論理的? (スコア:1)
英語のようなヨーロッパ語は,主語+動詞というのが文の最小構成要素という説が主流です.そのため,主語が抜けていると「主語を省略した」ということになります.
実際,英語圏の人は,"It's fine today" の "It" を省略するのは,これが単なる形式のための主語だと分かっていても,不自然だと思うそうです.
これに対し,日本語の最小構成要素は「用言」のみで,後はすべて修飾語とみなす立場の文法もあります.この立場からすると,主語を省略したのではなく,わざわざ言う必要がないので付けなかったと解釈します.
私自身の感覚でも,いわゆる「主語」を付けなくても不自然だと思いませんし,「私は」「私は」なんて連呼されるとかえって変に感じますので,「主語は修飾語」だという説に納得するものがあります.むしろ学校で教えている日本語文法の方が,ヨーロッパ語文法を無理に日本語に当てはめているだけの,不自然なものに見えます.
主語を明示しなくて,唯一困るのは,英語に翻訳するときですね.でもそれは,単に「日本語と英語がかなり違う」というだけのことで,日本語が特殊というのとはちょっと違う気がします.
----
「本来は一人称の単語が二人称に使われたりする」というのは,方言の問題では? 同じ人が同じ言葉を一人称と二人称とで使い分けているという例が思いつかなかったもので.もしそうなら,それは「日本語の難しさ」ではなく,「方言の多様さ」という別の問題に思えます.
------
Yoshige
Re:素人考えでは (スコア:1)
でもこれは言語の本質ではなくて,運用の問題だと思います.気配り・思いやりなど「察することで幸せになれる」分野では大いにやるべきでしょうが,論理的明晰さや政治的明瞭さが求められる分野では「察しないと分からない」ようなことを肯定してはいけないと思います.ケースバイケースで使い分けるのが吉ということでしょう.
しかし,「察するのは日本の文化だ」というような言い方は,しばしば論理的明晰さ・政治的明瞭さの欠落をごまかすときに使われているようで,私はあまり好きではありません.
------
Yoshige
Re:日本語は非論理的? (スコア:1)
その言語学者の言い方を真似ると,「古い語順を今も保っている日本語は,英語等よりも『原始的』なのではないか?」という理屈も言えますね.
私は日本語が好きですし,日本語と他言語との差異を知るのも好きです.でも,日本語と他の言語との優劣を語るこの学者さんのような意見には,なんかちょっと違うものを感じます.日本語が他の言語より優れていないといけないんですかね?
無粋なツッコミですみません.
------
Yoshige
Re:日本語は非論理的? (スコア:1)
「文には主語が必要」という考え方は、もしかしたら、ヨーロッパ言語に独特な特殊なものかもしれません (全然証拠がありません。たんなる可能性として)。それに、日本語でも、文脈上、省略しても意味が通じるときにしか省略されないでしょう。(←この文の主語は「主語が」ですが、省略しても意味が通じてますよね?)
ちなみに、別コメントに書いた文法解析プログラムですが、「主語は述語にかかる要素のひとつにすぎない」という立場にたっています。これはべつに誰かの学説を読んだわけではなくて、自分でそう考えました。(だから、日本語では、主語と、それ以外の「述語にかかる言葉」(英語文法では目的語や補語にあたる言葉)の順番を入れ替えても平気でしょ?)
一人称と二人称ですが、方言というよりは、(1)場面 (2)時間的変化 だと思います。(1)の例としては、ちっちゃな子どもに対して you の意味で「ぼくちゃん」などと呼びかけるとか、(2) なら「おのれ」とか。
ぼくの感覚では、婉曲表現とかと関連がありそうな気がします。あ、これは尊敬の意味の二人称が時代を経るとともに軽蔑の意味になるとか (「きさま」) の場合の話かな。
Re:アレゲな人相手は高そうだ :P (スコア:0)
老人の話し相手(という作業)程度って意味で。
会話する相手の能力ではなく、要求次第ですよね
暇つぶしの世間話なら、内容が限られても、間違っても
許容されるけど、例えばユーザサポートでは許されません
うまく表現できないけど、「会話の内容を厳密に要求され
ない程度」と言いかえれば良いかな
「本当の話し相手になれるのか」ってのには疑問が残る
けど、一人さびしくTVを見てるよりはボケ防止に役立ち
そうです
本当の会話の代わりでは無く、新しい遊びって捉えると
人口無能って楽しいのですよね