【悲報】推論AIさん、暗記するだけのクソアホロボットという事実がバレるwww


1名無しさんID:ID:s310uh8y0 [2025/06/27(金) 17:39:55.74]
「LRM(大規模推論モデル)の推論能力に限界」──Appleが論文発表
Appleの研究者らは論文で、LRM(大規模推論モデル)の推論能力の限界を指摘した。LRMは真の論理的推論ではなく、データに基づくパターンマッチングに依存しているという。問題の複雑さが一定の閾値を超えると精度が崩壊し、汎化能力に根本的な限界があることを示唆した。

「LRM(大規模推論モデル)の推論能力に限界」──Appleが論文発表
Appleの研究者らは論文で、LRM(大規模推論モデル)の推論能力の限界を指摘した。LRMは真の論理的推論ではなく、データに基づくパターンマッチングに依存しているという。問題の複雑さが一定の閾値を超えると精度が崩壊し、汎化能力に根本的な限界があることを示唆した。

 米AppleのAI研究者らは6月8日(現地時間)、「The Illusion of Thinking:Understanding the Strengths and Limitations of Reasoning Models via the Lens of Problem Complexity」(思考の錯覚:問題の複雑さというレンズを通して推論モデルの長所と限界を理解する)という論文を発表した。

研究の結果、LLM(大規模言語モデル)とLRM(大規模推論モデル)が数学的な問題解決で、真の論理的推論ではなく、訓練データに基づく確率的なパターンマッチングに大きく依存している可能性があるとしている。

 この研究では、既存の評価手法の限界を克服するため、新たなベンチマークや制御可能な環境を用いている。

LRMの推論メカニズムの分析には、従来のGSM8Kのような数学ベンチマークではなく、問題の複雑さを体系的に操作できる制御可能なパズル環境(ハノイの塔、チェッカージャンプ、リバー・クロッシング、Blocks Worldなど)を用いた。

 評価対象のLRMは、OpenAIのo3-mini(mediumおよびhigh構成)、DeepSeek-R1、DeepSeek-R1-Qwen-32B、AnthropicのClaude 3.7 Sonnet Thinking。

 分析の結果、LRMの推論能力に関する以下のような重要な知見が得られたという(一部を紹介)。


339名無しさんID:ID:7OUNkekBd [2025/06/28(土) 00:20:13.06]
>>1
ハノイの塔懐かしいな
再帰処理の勉強してて、解けた時は脳汁出たわ
プログラミングにハマったきっかけのひとつ


2名無しさんID:ID:s310uh8y0 [2025/06/27(金) 17:40:10.25]
特定の複雑さを超えると精度が完全に崩壊
 最先端のLRMでさえ、パズルの複雑さ(ディスク数、チェッカー数、人数、ブロック数などで制御)が一定の閾(いき)値を超えると、その精度が完全に崩壊することが明らかになった。これは、汎化可能な問題解決能力を開発できていないことを示唆している。

複雑さに対する推論努力の限界と非直観的なスケーリング
 LRMの推論努力(思考トークン量で測定)は、ある点まで問題の複雑さと共に増加するが、十分なトークン予算があるにもかかわらず、その点を過ぎると非直観的に減少し始めた。

 これは、問題の複雑さに対するLRMの推論能力における根本的なスケーリング限界を示唆している。

思考プロセス(推論トレース)の分析から見えるパターン
 LRMが生成する中間的な推論トレースを分析すると、複雑さに依存したパターンが見られた。比較的単純な問題では、「Overthinking(考えすぎ)」が見られ、正しい解を見つけた後も不要な探索を続ける傾向があった。 中程度の複雑さでは、誤った探索の後で正しい解にたどり着くパターンが増えた。高度な複雑さの問題では、正しい解を全く見つけられない完全な失敗が観察された。

 これらのパターンは、LRMの自己修正能力が限定的であり、明確なスケーリング限界があることを示している。

 Appleの研究者らは結論として、真の推論への道は遠いとしている。

 「われわれの研究結果は、現在のモデルの根本的な限界を明らかにしている。洗練された自己反省メカニズムにもかかわらず、これらのモデルは、特定の複雑さの閾値を超えると一般化可能な推論能力を開発できない」と指摘し、現在のアプローチでは一般化可能な推論に対する根本的な障壁に直面する可能性があると主張している。

 Appleは昨年10月、現在のLLMには真の推論は困難だという論文を発表している。

Copyright © ITmedia, Inc. All


3名無しさんID:ID:s310uh8y0 [2025/06/27(金) 17:40:36.52]
なにがAGIだコラ!!!


4名無しさんID:ID:dMAh9ohk0 [2025/06/27(金) 17:40:56.60]
それは人間にも‥


7名無しさんID:ID:s310uh8y0 [2025/06/27(金) 17:41:15.75]
>>4
うるせえボケ!!!!


242名無しさんID:ID:KIzf+3xH0 [2025/06/27(金) 19:02:47.28]
>>4
政治家とか暗記どころかカンペ読むだけだから当選後は平気で公約破るぞ


297名無しさんID:ID:AY1Z/Gxj0 [2025/06/27(金) 20:47:40.56]
>>4
安倍晋三とか低次元なbotみたいだよな


5名無しさんID:ID:ZhperyH7H [2025/06/27(金) 17:41:07.98]
でも日本には孫正義がいるから


6名無しさんID:ID:XtdL12u00 [2025/06/27(金) 17:41:10.95]
これ反論でてたやつでしょ


8名無しさんID:ID:Th2M0Yye0 [2025/06/27(金) 17:41:18.02]
マギシステムにすればいいのに
なんでしないの


9名無しさんID:ID:f1dICl4b0 [2025/06/27(金) 17:41:19.05]
Appleって自前でAI作ってないじゃん
負け惜しみだろ


361名無しさんID:ID:+Qa2udapd [2025/06/28(土) 08:03:25.58]
>>9
これ
AI開発競争の負け組によるネガキャン
アポー信者は反AIになってしまうのか


10名無しさんID:ID:OkNSzKCw0 [2025/06/27(金) 17:41:23.78]
なんだろ
日本を代表する東大等の秀才たちを侮辱された気分になったの俺だけ?


103名無しさんID:ID:+6kjUYbc0 [2025/06/27(金) 18:07:05.82]
>>10
東大はガチでアホじゃん


13名無しさんID:ID:Tm0onqJC0 [2025/06/27(金) 17:41:59.08]
孫さんの株買ったんだからASI来てくれないと困る


14名無しさんID:ID:BaA+m/Bn0 [2025/06/27(金) 17:42:01.77]
別にパターンマッチングでもええやん


15名無しさんID:ID:OjJBfDNp0 [2025/06/27(金) 17:42:07.59]
これ人間だろw


16名無しさんID:ID:/ImaWTXN0 [2025/06/27(金) 17:42:28.81]
遅れてるから足を引っ張りたい無能


17名無しさんID:ID:Wrof8bQw0 [2025/06/27(金) 17:42:29.63]
逆になんだと思ってたんだよ




18名無しさんID:ID:aaap3HJN0 [2025/06/27(金) 17:42:37.13]
またかよこいつかよ


19名無しさんID:ID:xVys6R5T0 [2025/06/27(金) 17:42:46.26]
フレーム問題を解決できてないだろって話か?


36名無しさんID:ID:G2/GzhFT0 [2025/06/27(金) 17:47:50.54]
>>19
違うかな
言語を使うようになって時点でフレーム問題とシンボルグラウンディング問題は人間と同程度には緩和されている
これは単に論理的思考能力の問題
ルールベースの時代だとAIがむしろ強かった部分だな


20名無しさんID:ID:0T5P+WzV0 [2025/06/27(金) 17:42:56.31]
これ反論する論文出てたでしょ


21名無しさんID:ID:nDURZWg/0 [2025/06/27(金) 17:43:11.33]
人間と同じじゃんすげぇ


22名無しさんID:ID:9ko9Br3/0 [2025/06/27(金) 17:43:20.47]
それでも人間より優秀なんだから
人間はもう働かないでください


23名無しさんID:ID:t3hWTL9U0 [2025/06/27(金) 17:44:08.50]
ダクネスになりきって解説して


24名無しさんID:ID:8KG6or30H [2025/06/27(金) 17:44:27.04]
AIに将棋やらせたら無茶苦茶だからな
考えてるようで何も考えて無い


25名無しさんID:ID:mDTSjg7f0 [2025/06/27(金) 17:44:28.71]
確率的パターンマッチングが人間の思考の本質だぞ


27名無しさんID:ID:YlE7TEoL0 [2025/06/27(金) 17:45:17.31]
>>25
だよねえ


79名無しさんID:ID:tOG9yt41d [2025/06/27(金) 17:59:04.11]
>>25
いやちげえだろ


184名無しさんID:ID:LBjD36QN0 [2025/06/27(金) 18:29:15.60]
>>25
パターンマッチングで万有引力の法則を導き出せるのか?
質点を仮定できないで詰むだろ


246名無しさんID:ID:ACP+CIo40 [2025/06/27(金) 19:06:56.75]
>>25
あははは、其れは貴方だけかもね


26名無しさんID:ID:YlE7TEoL0 [2025/06/27(金) 17:45:00.98]
暗記だけであの内容出してくるなら暗記で全然問題ないやん


29名無しさんID:ID:/WPbyzGv0 [2025/06/27(金) 17:45:46.94]
もうLLMはしくみからして限界見えてるんだから別の手法探せよ…


32名無しさんID:ID:dto3yoef0 [2025/06/27(金) 17:46:33.65]
暗記してるだけって実質ルシファーやん


34名無しさんID:ID:tTtG6PBV0 [2025/06/27(金) 17:47:25.90]
>>32
話も通じるし字も綺麗だろ


40名無しさんID:ID:fhMXav+F0 [2025/06/27(金) 17:49:00.75]
>>32
ルシファーの方がまだ考えてる


33名無しさんID:ID:tTtG6PBV0 [2025/06/27(金) 17:46:44.94]
Appleは自社開発遅れ取りまくりだから負け惜しみだろ


35名無しさんID:ID:kBeG7To30 [2025/06/27(金) 17:47:48.02]
晋ギュラリティ




37名無しさんID:ID:GBEUkPwe0 [2025/06/27(金) 17:47:54.67]
その暗記が使えるんじゃないか
ドイツが環境変動対策に用意してる予算のうち何パーセントがグリーン水素開発用か、なんて質問をKfWのブログ記事引用してすぐ答えてくれるの神過ぎでしょ


38名無しさんID:ID:KYT662Cn0 [2025/06/27(金) 17:48:07.43]
確率的に正しそうな単語並べてるだけってマジ?よくも騙しやがったな


39名無しさんID:ID:fhMXav+F0 [2025/06/27(金) 17:48:24.80]
暗記にしてもしょぼい
東大理III合格レベルとか言うけど今年の東大数学の大問3番で場合分け忘れてるのは青チャートすら怪しいレベルの知能ってこと
大問5(2)みたいな明らかにAIが得意そうかつ数学オリンピックっぽい初歩的なアルゴリズムの問題すら解けてなかったし


41名無しさんID:ID:Gtyymc/Rr [2025/06/27(金) 17:49:07.94]
とりあえずこの世の全てのデータを暗記させてみようぜ


42名無しさんID:ID:VUAtkQAC0 [2025/06/27(金) 17:49:33.57]
AIが嘘つくのはなんなんだろうね
存在しない論文を勝手に作って引用してくるわ


57名無しさんID:ID:+XkC8I2R0 [2025/06/27(金) 17:53:28.88]
>>42
論文から引用という行為自体を理解していない

こういう流れならこういう文章の「こういう」のところをAIは好き勝手作ってて
そんなカニ論文を引用する風な文章ができあがることがあるだけ


67名無しさんID:ID:I0GLY5tFH [2025/06/27(金) 17:56:05.51]
>>57
カニ論文……🦀


43名無しさんID:ID:+XkC8I2R0 [2025/06/27(金) 17:49:46.49]
ツギハギパッチワーク


44名無しさんID:ID:hlOo1VJB0 [2025/06/27(金) 17:50:06.25]
与えられた情報の範囲で考えるって言ってるんだし当たり前じゃねえのか?


45名無しさんID:ID:pwN3DW0G0 [2025/06/27(金) 17:50:30.58]
テスト勉強でも繰り返し反復して覚えるヤツと
原理を理解して応用までスラスラ解くヤツがいるもんな

新着記事一覧
未分類
TKをフォローする
プログラミング速報

コメント