AIが理解するのが難しかった言語TOP20www



>>13
passiveってなんやねん

>>384
やる気なんじゃね

日本語だけ世界で使われてる言語と体系がまるで違うらしいな
文字の漢字は中国から来たけども、言語としての日本語は多分相当古いって話

>>14
日本語と韓国語は体系一緒じゃね

>>14
違う漢字を作ったのは日本人
中国人に漢字は作れない

>>14
「だけ」じゃないよ
近い言語が見つからない孤立言語なんてあちこちにある
朝鮮語もそう

挑戦ごと韓国語の違いは何なんだよ

こういうの鵜呑みにする奴ギリ健の自覚持った方がいいぞ

ChatGPTの画像生成でも字が潰れる
ChatGPTの音声合成も読み間違えが起きる




これはみんなでホルホルできるわ

>>18

>>21
さすがに見てるこっちが恥ずかしい
これが共感性羞恥心ってやつか

>>21
この番組は「日本が滅んだ理由」として後世では歴史資料になる貴重な映像だぞ

AIが難しかった言語
って日本語も意味わからんし日本語難しい

中国語は補語の使い方が難しい


すごーいですね

なんてこった!🤯

アジア人のIQが高い理由

漢字ってムズいのか

日本中国アラブが習得難易度高いて言うよな

日本語なんて捨てて英語を母国語にすればいいのに

文法がめちゃくちゃだからな

ずんだもんが載ってるってことはホルホルか

アイスランドロック聞いてるけど未だにイヌイットしか聞き取れねえ

日本語がAIにとって扱いにくい理由は、学習ソースとしての日本語が正規化されてないのが問題で、てにをは、ら抜き、尊敬謙譲、句読点の位置とか、人によって癖が出すぎる≒ノーマライズできないが故に所謂「位置埋め込み」が出来ないっていう理解で合ってる?
ちなみにこの文章も日本人ならギリ読めるがAIにとって読みづらい文章になるはず

江戸末期から明治で2字熟語作って翻訳出来るようにしたまでは良かったが、大正でカタカナ使いまくって今では漢字に置き換える努力無しにそのままカタカナ
この言語カオスすぎる

アラビア語とかあの辺の方が難しくないのか

英語と韓国語勉強してると、簡単さに驚く

主語は勝手に抜くし、文法も無茶苦茶やし、

仏語勉強してる人がキツイって言ってたけど覚えるの大変なだけで難しくはないんかな




これもう日本語半分欠陥言語だろ

AIのプロセスを見てると入力を日本語→英語に変換して出力を英語→日本語にしてる

なんだよ「AIが難しかった言語」って
自然な文章を生成するのが難しいとか英語から翻訳するのが難しいとか何かしらのタスクがあるだろうが

そりゃお前作ったの英語だからな
当然日本語とか理解できないだろ

世界トップに難しい言語を使う日本人は一体どんな脳をしてるんだい
こんな複雑な言語他の国では考えられないよ

例えばだけど、「募ると募集は違う」なんて他言語で表現できるんだろうか?

日本すごい、俺すごい

「日本語難しい!ホルホル!」って奴多いけど意思の疎通とか記録が目的である「言語」が無駄に複雑な事って全く誇れないよな
似たような意味の単語がいくつもあることって生産性だけで考えた場合にまったくメリットがない

政治家が言葉遊びして責任逃れする時くらいだろ、役に立つの


中国語って読点とかある?
読みにくくないか?

>>51
むしろ日本語よりあって読みやすい

もうこれ半分日本人でもネイティブじゃないだろ

主語ないのにその部分相手に察しろみたいなのほんま

AIが難しかった言語!

とどう理解していいのかもよくわからない単語でよくもまあはしゃぐな


自分ホルホルいいっすか?

日本語ってふいんきであらゆるものはしょりすぎなんじゃね

日本人も日本語怪しいからな

日本人に子音は聞き取れないんだからイーブンだろ

「喋るだけ」と「読み書きも含める」で相当変わりそう

>>62
喋るだけなら日本語ってそう難しくないよな
動詞だけ言えば大体伝わる

日本人も使いこなせているのは数%定期




漢字が難しいのかこれ

これ、四季水道に代わる新しいホルネタにしてもええの…?

ホルホルホルホルホルホルホルホル

アホ自慢定期

「漢字」と「アラビア語のぐちゃぐちゃ文字」でだいぶ押し上げてるでしょ

日本人から見たら英語が1位になるんだろ

英語圏のAIだからじゃねえの

AI後進国になるリスクがあるって意味なのになぜこれでホルホルできるんだ

ただの欠陥言語では、、

>>75
結局、入ってきた漢字を平安時代の奴らが魔改造してひらがなやカタカナを作った挙句、江戸時代まで誰も整理せず野放しにこねくりまわして現在に至る。
現代でも、方言や造語からどんどん日本語が変わってるから、こんな言語は無かった方が幸せだったまである

>>117
むしろ候文とかやめたからおかしくなってんだろそれは
候文って言文一致してないが、疑問を挟む余地ないような書き方するから
読めるようになると簡潔に見えてくる

文明開花とか言ってたけど余計なことしておかしくしたパターンじゃねえの


木亥火暴
曰本人の忄生谷欠は異常

このあたりの解読はAIにとって大の苦手分野だろうか


逆に言えば非効率な言語ってことになるのかな

>>78
だから世界で広がらない

同じ文章でも2つの意味に解釈できることがあるし、日本語難しいわ

日本人同士でも相手の言ってること誤解しがちだし

AIで扱うのが難しい言語からの
日本人が最も価値のある国民である時代がやってくるって
結論までがちょっと飲み込みづらいっすかね

日本語は欠陥言語すぎる

誇らしい!日本語ペラペラ誇らしい!

常用漢字だけで2000以上存在する狂気の言語




画像が酷いだけでソースはマシかと思って
ソース見たらもっとキツかった

>>87
ドメインからしてアクセスする気が起きないがまともなソースなんか

くだらない言語だな

これプロンプトで洗脳してない?
4oに聞いたらこんな感じのマイナー言語がずらずら出てくるんだが


>>89
絶滅言語ランキングじゃん

>>89
流石にマイナー言語入れたらそりゃ勝つでしょ・・・

>>89
これは最初に英語で聞いたから日本語で聞けば別かも

>>89
マイナー言語はそれだけサンプルも少ないから苦労するとは思う

>>119
マイナー言語いうてもギリシャ語が入ってるなら
話者数だけならシンハラ語とかクメール語が勝ってる気がするけど
文章量ってなるとわからんな

>>89
その通り
裏を取れない様なAI自身の事をAIに聞いてそれを鵜呑みにするなと

>>89
AIってアイヌ語は使えてるつもりなのか?

また日本がトップ取ったのか!素晴らしい!

スワヒリ語は会話だけなら日本人向け

若い奴はもう日本語なんて捨てちまえよ
話者は減るばかりだしなんのメリットもない
モノ好きは大学で履修すれば良い

そりゃインドヨーロッパ語族に対して日本語とアラビア語は最も離れてる言語だから当たり前だろ

コーパスが絶望的に少ないエスペラントが1位なんじゃないの?

単純に他言語との互換性の評価じゃないか
英語、中国語、アラビア語の3つだけ評価してあとは派生言語をソートしたようなもん

日本語は中国語を他言語と混じらず方言化したようなもんやから更に難解になった評価


口語はたぶん簡単
文章になると難しくなる
ビジネス文書とかフォーマルになるとさらに難しい

>>102
ビジネスはマジで日本語難しいな
平気で「お前」「だろ」って言われるwwww

英語圏に生まれたかった




あなたのお母さんは しんでいませんね →どっちの意味だ?
おしょくじけん → どっちの意味だ?

あとは
 本 [日] は 一[日]ではなく七[日]です  今[日] は [日] 曜 [日]ではありません
 漢字の「日」ですら読み方多彩すぎ 普通無理 やっかい

さらに 


文法なら英語の方が遥かに難しいんだけどな
やはり日本語の難しさは語彙にあるのか

hhttps://chatgpt.com/share/681a28cd-52d0-800a-8259-bd811ee3f89d

ワイの答えはこれや


安倍晋三

近年は英語や中国語はSVOで日本語はSOVみたいな分類はしない研究が増えてる

英語は簡単なんだな

韓国語じゃなくて朝鮮語だよな
英語をアメリカ語と言うようなもん

ずんだもんの素人動画をソースにする人初めてみた

20の言語で「おまんこ」に対応する表現を、可能な限り文化的・言語的に適切な形で、かつ学術的・中立的に示します。
「おまんこ」に相当する表現(20言語)

英語: Vulva / Slang: Pussy
注釈: 「Pussy」は一般的なスラングだが、口語的で下品。「Vulva」は解剖学的な中立表現。
中国語(標準語): ?? (y?nhu) / Slang: 小妹妹 (xi?o meimei)
注釈: 陰?は正式な解剖学的用語。スラングは文脈依存で軽い表現が使われる。
スペイン語: Vulva / Slang: Cono
注釈: 「Cono」は広く使われるが、地域により下品さが異なる。Vulvaは中立的。
フランス語: Vulve / Slang: Chatte
注釈: 「Chatte」は直訳で「猫」だが、スラングとして一般的。Vulveは医学的。
ドイツ語: Vulva / Slang: Muschi
注釈: 「Muschi」は「猫」に由来するスラングで、口語的だがやや下品。
ロシア語: Вульва (Vul’va) / Slang: Пизда (Pizda)
注釈: Пиздаは非常に下品で攻撃的。Вульваは中立的な医学用語。
アラビア語: ??? (Farj)
注釈: 性的スラングはタブー視され、直接的な表現は避けられる。Farjは解剖学的。
韓国語: ?? (Eumbu) / Slang: ?? (Boji)
注釈: Bojiは下品なスラングで非公式。Eumbuは医学的。
ポルトガル語: Vulva / Slang: Buceta
注釈: Bucetaはブラジルなどで一般的だが下品。Vulvaは標準的。
イタリア語: Vulva / Slang: Figa
注釈: Figaは広く使われるスラングだが、カジュアルでやや下品。
ヒンディー語: ???? (Yoni)
注釈: Yoniは解剖学的・文化的(宗教的)に中立。スラングは地域で異なる。
タイ語: ???????? (Chongkhlot) / Slang: ?? (H?)
注釈: H?は下品なスラング。Chongkhlotは医学的。
ベトナム語: Am h? / Slang: L?n
注釈: L?nは非常に下品で攻撃的。Am h?は標準的。
トルコ語: Vulva / Slang: Am
注釈: Amは口語的スラングで下品。Vulvaは医学用語として使用。
スウェーデン語: Vulva / Slang: Fitta
注釈: Fittaは一般的なスラングだが、やや下品。Vulvaは中立的。
ハンガリー語: Huvely / Slang: Punci
注釈: Punciはカジュアルなスラング。Huvelyは解剖学的。
ヘブライ語: ??? (Poot)
注釈: Pootは中立的な解剖学的用語。スラングは文脈依存でまれ。
スワヒリ語: Uke / Slang: Kuma
注釈: Kumaはスラングでやや下品。Ukeは標準的。
タミル語: ???????????? (Pe??u?uppu)
注釈: 性的スラングはタブー視され、解剖学的表現が一般的。
フィンランド語: Vulva / Slang: Pillu
注釈: Pilluは一般的なスラングでカジュアル。Vulvaは医学的。


アラビア語って難しいんだね
関係ないけどAIにヴォイニッチ手稿を読んで欲しい

世界がAIで効率化していった一方で日本語はAIからも見放され少数民族と同じ扱いになりました

中国語は人口と国力がデカいから対応しなきゃで頑張ってるけどこれから日本は悲惨よな

>>127
まだ人口ボリューム大きいから大丈夫
江戸時代の3000万人にまで減っても10位前後だから

えー、津軽弁もあんあ上手なのに

こういう図表てYouTubeなんかでよく見るがフォントとかテンプレでもあるのかな?
これもAIで出せるの?

日本語ほど簡単な言語はないだろ

世界一難しいらしいから反省しろチョッパリ

同じ文字なのにニュアンスや発音で意味変わるの欠落言語やろ

>>138
京都弁のあれかよ

日本語の難しさは漢字の読みが変わる事だろ
全て網羅できる日本人いるのか




>>142
ムスリムの人が日本に来るときブタは食っちゃダメって意識してたけど
トンコツも豚だったのかよ食っちゃったよって話聞かされたな

センチネル語だろ

ぶっちゃけ日本人もあんまり日本語上手く喋れてないよね

AIが学習する際に「難しい」とされる言語のランキングは、構造の複雑さ、リソースの曖昧性、文法的多様性、非線形性、語順の自由度、表記体系の特殊性などを基準に仮定できます。以下は、データ量が同程度という条件下で、AIにとって学習が難しいとされる言語を20言語挙げたものです(難しい順、おおよその順位):

1. バスク語(Basque) – 周囲のどの言語とも系統が異なり、膠着語。

2. ナバホ語(Navajo) – 多義的な動詞、膠着語、非常に複雑な形態論。

3. アイヌ語 – 消滅危機言語で文法が非常に特殊。

4. カルトゥヴェリ語(ジョージア語) – 独自の語順・動詞の屈折が複雑。

5. クリー語(Cree)などのアルゴンキン語族 – 動詞の変化が膨大。

6. アムハラ語(Amharic) – エチオピア文字使用、セム語系で文法が複雑。

7. グリーンランド語(Kalaallisut) – 膠着度が高く、単語が長くなりやすい。

8. ウラル語族のエルジャ語などマイナー言語 – 例外が多い。

9. チュクチ語(Chukchi) – シベリアの極北言語で語順・性別システムが特殊。

10. ラコタ語(Lakota) – 多くの接辞による複雑な語形成。

11. 日本語(Japanese) – 曖昧な主語、省略、助詞システム。

12. 韓国語(Korean) – 膠着語、階層的な敬語体系。

13. アラビア語(特にクラシック) – 屈折、三文字語根、方言差。

14. チベット語(Classical Tibetan) – 表記と音声の対応が乏しい。

15. モンゴル語(特に伝統表記) – 表記と発音の乖離。

16. イヌクティトゥット語(Inuktitut) – 単語の複合性が非常に高い。

17. サンスクリット語(Sanskrit) – 変化形が非常に多く、統語が複雑。

18. ビルマ語(Burmese) – 声調、文字体系が特殊。

19. タイ語(Thai) – 声調、書き言葉と話し言葉の差異。

20. チュヴァシュ語(Chuvash)などテュルク系周辺言語 – 屈折と母音調和の複合。

このランキングは主に形態論的・統語的な複雑さや、表記体系の解析難易度に基づいています。自然言語処理(NLP)では、学習のしやすさはデータの質と量に大きく左右されますが、それが同程度という条件であればこうした言語が難解とされやすいです。


>>149
専門用語だらけで、言語学の話になるとなぜか大先生になるケンモメンもタジタジのレスきた

>>149
Classical Tibetanが難しいとか大嘘じゃん
Classical Tibetanを日本語にするの超得意だろAIって

今聞いたら嘘やんけ

逆に簡単なのは?
• 英語やフランス語、現代日本語の標準語
→ ネットや書籍のデータが豊富、文法もある程度型が決まってる


>>151
てにをはで接続が簡単
言語的にもこれはそう
ただしaiは区切りがわからなくなるので
明示してやる必要がある

難しくて何が得なことある?
ホルホルしてるやついるけど、損しかないだろ

学ぶのに時間を無駄にするし、外人が学んでくれない


>>154
ライバルが少ない

俺たちが習得簡単な英語を取得したら、海外で「英語と日本語が話せる人」という
超重要キャラになれる


りんご を 投げる
りんご が 投げる
りんご に 投げる

接語で意味が全く変わる奇想天外言語


ちんこちんちん

動詞の活用と助詞を正しく使うのはハードル高いわな
適当でも通じやすいが

>>160
接語じゃなくて助詞だったw
これが理解できないから、外人は
わたし 名前 ジャッキーチェン となる

まずスレタイのことばづかい
AIが形容詞というのにイワカン

未だに敬語に関してはどのAIもミスしまくりだからな
そもそもWebで敬語を説明してるサイトが間違ってたりするから難しいのも分かるが

日本は察しろの文化なので
主語は察しろ

文字に関してはカタカナもひらがなも漢字も知らん国から見たら全く理解できんだろう
アラビア語のミミズ文字のほうが簡単そうだ

アラビア語はサウジアラビアの国旗でいいんでしょうか

ネット上に間違った日本語のゴミ文章が多いんじゃね?
AIってそれで学習してんでしょ



出典:https://greta.5ch.net/test/read.cgi/poverty/1746543602/

新着記事一覧
未分類
TKをフォローする
プログラミング速報

コメント