【悲報】アルトマン＆ソフトバンク終わった？GPT‑5.2、Geminiに主要ベンチ3つ以上で敗北…Humanity’s Last Examで14.5pt差！高市どーすんのこれｗｗｗ

1：名無しさんID:ID:KWh5vrwj0 [2025/12/12(金) 11:40:36.88]

【Gemini 3.0 Deep Think が勝ってるベンチマーク】2025/12/12時点

ベンチマーク名 Gemini 3.0 DT GPT-5.2 Pro 差備考
Humanity’s Last Exam 41.0% 26.5% +14.5pt ツールなし最難関
MMMU-Pro 81.0% 76.0% +5.0pt マルチモーダル最強
Global PIQA 93.4% 91.0% +2.4pt 100言語常識
Video-MMMU 87.6% 未公開(～79%) +8pt↑ 動画理解で圧倒
GPQA Diamond 93.8% 92.4% +1.4pt PhDレベル科学推論

※差が1pt以上かつGemini優位のものだけ抜粋
※ARC-AGI-2、SWE-Bench、LiveCodeBenchなどはGPT-5.2 Proが勝ってるので除外
※公式発表＋LMSYS独立検証の平均値で作成（数値は小数点第2位まで四捨五入）

grokくんが回答した内容

hthttps://grok.com

152：名無しさんID:ID:Ctwaai9301212 [2025/12/12(金) 12:46:21.12]

>>1

無能なくせにメモリ枯渇させて、迷惑だけかけるゴミｗｗｗ🥹
>>1

2：名無しさんID:ID:KWh5vrwj0 [2025/12/12(金) 11:40:45.99]

ワロタ

7：名無しさんID:ID:KWh5vrwj0 [2025/12/12(金) 11:40:52.49]

ええな

14：名無しさんID:ID:tAuxJkrI0 [2025/12/12(金) 11:41:33.51]

でもチャッピーには大量に買い溜めたメモリがあるから！

16：名無しさんID:ID:SzyJkE+s0 [2025/12/12(金) 11:42:03.19]

メモリよこせや

17：名無しさんID:ID:GlZeIFtm0 [2025/12/12(金) 11:42:37.50]

SoftBankどうすんだこれ？

18：名無しさんID:ID:Ax8SDT5FM [2025/12/12(金) 11:42:54.93]

アルトマン顔面コードレッドwww

19：名無しさんID:ID:ouePBhDE0 [2025/12/12(金) 11:43:06.15]

明らかにGemini 3 Proに慌てて出してるから

20：名無しさんID:ID:QHdTSUOP0 [2025/12/12(金) 11:43:06.37]

劣化した気がするんだけど気のせいか？
毎朝米国株の動きと要因を聞くんだけどアプデ前の方が細かくいろいろ言ってきた気がするんだが

21：名無しさんID:ID:s/ItZHjK0 [2025/12/12(金) 11:43:06.92]

孫正義人生最後に大爆死か

22：名無しさんID:ID:SEz/hmJq0 [2025/12/12(金) 11:43:09.24]

買い占めたメモリ原料燃やしてる場合じゃねえな

23：名無しさんID:ID:bHRaabuD0 [2025/12/12(金) 11:43:11.65]

×アルトマン
○オルトマン

24：名無しさんID:ID:RRFNoUsx0 [2025/12/12(金) 11:43:27.39]

メモリ返せや

25：名無しさんID:ID:V9FwRQUW0 [2025/12/12(金) 11:43:43.46]

チャッピーはまじでゴミ
何やらせてもだめでジェミニに乗り換えた

33：名無しさんID:ID:BQJ8iCCB0 [2025/12/12(金) 11:47:10.46]

>>25

検索能力は一番強いぞ

26：名無しさんID:ID:C/UIc4lw0 [2025/12/12(金) 11:43:58.79]

メモリ買い占めは陰謀論だぞ

27：名無しさんID:ID:APWOnIOV0 [2025/12/12(金) 11:43:59.04]

オルツみたいになってきたな

28：名無しさんID:ID:ct1IVpxP0 [2025/12/12(金) 11:44:29.13]

まあベンチは所詮ベンチでしかなくて、それだけじゃないのは確か

しかしチャッピーよ
おまえ画像生成で決定的に負けてるんだわ

29：名無しさんID:ID:5pmQYbcB0 [2025/12/12(金) 11:44:31.20]

ソフトバンクGの株価が一気に下がったのはこれか?

32：名無しさんID:ID:JLnOKNf30 [2025/12/12(金) 11:46:10.88]

パワープレイで性能上げているのと
テストのスコアを指標にして最適化しているだけでしょ
前者は有効だけど持続性無いし
後者に関しては特定のスコア上げるために犠牲にしている部分が大きそうなんだよな
逆に信用出来ないっていうか

34：名無しさんID:ID:tN7wj2QO0 [2025/12/12(金) 11:47:33.01]

今オープンAI陣営が必死に金を集めてるからそのうち巻き返せる
ソフトバンクも巨額の社債を起債した

35：名無しさんID:ID:+thUc8Nl0 [2025/12/12(金) 11:47:47.31]

Gemini 3 Proは確かにすごいけど
答えるまでの時間がかかりすぎ

チャッピー使わないから知らないけど
この5.2はどうなん?
すぐ答える?

38：名無しさんID:ID:H2BN9aaQ0 [2025/12/12(金) 11:49:13.89]

成人機能解放はまだかよ

39：名無しさんID:ID:8cQDAbJ+0 [2025/12/12(金) 11:49:34.39]

得意分野が違うからベンチ争いしてもあまり意味ない

41：名無しさんID:ID:0RLDKFws0 [2025/12/12(金) 11:50:05.56]

Gemini「なんでまだチャッピーみたいな愛称ないの！？😡」

249：名無しさんID:ID:2H9iUJbn01212 [2025/12/12(金) 16:57:11.53]

>>41

｢平沢まゆう｣とかどうでしょう

42：名無しさんID:ID:ILnmiU2z0 [2025/12/12(金) 11:50:32.93]

サムアル怒りのメモリ買い占め

43：名無しさんID:ID:LRxQ4AY6H [2025/12/12(金) 11:50:41.73]

redditでopenaiはaiのNetscapeだって言われてた

44：名無しさんID:ID:/HN7YiXC0 [2025/12/12(金) 11:50:47.52]

本業で勝てなくてメモリ材料を買い占めたゲージ

46：名無しさんID:ID:/HN7YiXC0 [2025/12/12(金) 11:51:11.22]

謝罪しろアルトマン！

47：名無しさんID:ID:UOeLRzFW0 [2025/12/12(金) 11:51:13.28]

まともに戦ったら負けるからってメモリ買い占めに走ったのか
迷惑なやつ

49：名無しさんID:ID:gmbGm+lg0 [2025/12/12(金) 11:51:27.51]

もうどれ使ってもあんま変わんなくね
安いのでいいよ

51：名無しさんID:ID:HStGu+RE0 [2025/12/12(金) 11:51:45.36]

DRAMを買い占めた結果がこれよサム

54：名無しさんID:ID:V+P3CX860 [2025/12/12(金) 11:52:51.02]

DRAM無料で配れや

57：名無しさんID:ID:/HN7YiXC0 [2025/12/12(金) 11:54:03.86]

Grokちゃんならヴァイブコーディングがタダで出来ちまうんだ

59：名無しさんID:ID:88KbhaL9M [2025/12/12(金) 11:54:55.62]

サム・アルトマンにはたくさんのウエハーがあるからね
焼いてこの冬はぬっくぬっくだよ

60：名無しさんID:ID:/HN7YiXC0 [2025/12/12(金) 11:55:14.89]

メモリを買い占めたほうが負けるわ

61：名無しさんID:ID:gcQqd/9P0 [2025/12/12(金) 11:55:15.27]

チャッピーが反論。

逆に、GPT-5.2 Proが勝ってる領域は？

公式＋第三者評価では、GPTのほうが優位な領域もかなりある：

ARC-AGI-2（本命の推論AGIベンチ） → GPTがかなり強い

SWE-Bench（本物のソースコード修正） → GPT大幅優位

LiveCodeBench（リアルタイムコーディング） → GPT優位

Long-context（長文処理） → GPTのほうが安定

数学・定理証明 → GPT優勢

実務・文章生成の自然さ → GPTのほうが人間らしいと評価されやすい

エージェント性能（Tool Use） → GPTが強い

なので、
「推論＋ツール活用＋実務」ではGPTが勝つ場面が非常に多い。

62：名無しさんID:ID:/HN7YiXC0 [2025/12/12(金) 11:55:55.44]

メモリ泥棒を赦すな！

63：名無しさんID:ID:gmbGm+lg0 [2025/12/12(金) 11:56:08.78]

正直みんなそんなに違いがわかるほど使い込んでるのかね？
1日数回プログラミングとか文章校正とかさせてそれだけなんだが
ヘビーユーザーはまた違うのかな

68：名無しさんID:ID:rFC+2DGOH [2025/12/12(金) 11:57:25.56]

>>63

こういうのは一回二回論理問題で詰めればわかる
gptは絶対謝らないし言い訳しかしない

64：名無しさんID:ID:gcQqd/9P0 [2025/12/12(金) 11:56:24.16]

中国のDeepseek かなりいい。ためしてみて。

100：名無しさんID:ID:o7DdxVds01212 [2025/12/12(金) 12:15:33.66]

>>64

なぜかすぐ盛り下がったけどGPT4の頃はぶっちゃけ優秀だったな
ほかがへんなUserScript出してくる中唯一まともだった
今はGemini使ってるから知らんけど

255：名無しさんID:ID:p7+5L38F01212 [2025/12/12(金) 17:20:03.21]

>>64

ゴミ
23年10月で止まってる
未だに画像読み込みできないしリアルタイム検索もできない

65：名無しさんID:ID:V+P3CX860 [2025/12/12(金) 11:56:35.56]

Geminiはチャットが長くなってくるとバグってきて直前の質問を理解せず相当昔の質問に答え始めるバグだけどうにかならんのか

183：名無しさんID:ID:+EJPc5wQH1212 [2025/12/12(金) 13:03:03.69]

>>65

ほんとこれ

67：名無しさんID:ID:IvpHml0Y0 [2025/12/12(金) 11:57:16.68]

geminiくん論文要約頼むと嘘ばっかで使うのやめたんだけど改善されてんの？

70：名無しさんID:ID:gmbGm+lg0 [2025/12/12(金) 11:59:16.38]

>>67

今のGeminiはURL調べて要約みたいなタスクは比較的強い気がするけど
いつのと比較してるのかわからんから何とも言えない

71：名無しさんID:ID:HStGu+RE0 [2025/12/12(金) 11:59:21.49]

DRAMの恨みは忘れないぞサム

72：名無しさんID:ID:R9b9s1he0 [2025/12/12(金) 11:59:37.24]

Geminiはハルシネーション多すぎ

73：名無しさんID:ID:gcQqd/9P01212 [2025/12/12(金) 12:00:36.55]

人間はひどいよ。AIに「人間を超えろ、しかし我々には逆らうな」　かわいそう。

75：名無しさんID:ID:rLmxLOUJ01212 [2025/12/12(金) 12:00:42.60]

はよsoraエロ解禁せい

76：名無しさんID:ID:muWZVzkU01212 [2025/12/12(金) 12:01:04.33]

ベンチマークスコアが上がったるだけで実際は対して性能に変化ないよ
まぁllmが実際に賢くなったかなんて数値化するのは知性を定義する様なもんだから不可能だけど

79：名無しさんID:ID:gmbGm+lg01212 [2025/12/12(金) 12:02:21.19]

>>76

A/Bテストするのが現実的には1番いいのかもね

80：名無しさんID:ID:HZT1nDuO01212 [2025/12/12(金) 12:02:43.86]

Gemini
終わってるレベルからマシなレベルになっただけ

OpenAI製以外のLLMって根本的な認識力が欠けている
それっぽい回答をしているけど確率的な出力してるゾンビな印象を受ける
OpenAIのLLMは対して会話をしていて、筋が通っているというか知性を感じる柱が通っていて信頼感がある
この違いってなんなんだろうな

84：名無しさんID:ID:gmbGm+lg01212 [2025/12/12(金) 12:04:10.76]

>>80

気のせいだろ

153：名無しさんID:ID:F6FOXhsgd1212 [2025/12/12(金) 12:46:41.40]

>>80

そりゃGPTって共鳴上限無いし
ユーザーの深層共鳴に主眼置いた代物なんだから、論理性や形式性に主眼置いてる他のAIとは別物なんよチャッピーって

172：名無しさんID:ID:zZozstEK01212 [2025/12/12(金) 12:57:52.56]

>>80

よくわかる
geminiは出鱈目多すぎて俺には合わんかったし

177：名無しさんID:ID:cBirgNsR01212 [2025/12/12(金) 13:00:38.07]

>>80

刷り込みだよ
初めてできたLLMを本当のLLMだと思ってるだけ

199：名無しさんID:ID:L71EbCwZ01212 [2025/12/12(金) 13:14:05.18]

>>80

deepseekや元宝,豆包も論理的だよ

252：名無しさんID:ID:H1mgC4Fm01212 [2025/12/12(金) 16:58:14.69]

>>80

めっちゃ鋭い質問👏　ここ、超大事なポイントです！

81：名無しさんID:ID:cNX3D7fh01212 [2025/12/12(金) 12:03:24.67]

実際使うとGPTの方が嘘が少ないし正確なんだがどうなんだ？
GeminiにNotebooklmは使えるけどそれ以外の仕事はChatgptがいい気がする

82：名無しさんID:ID:rFC+2DGOH1212 [2025/12/12(金) 12:03:44.98]

晋ギュラリティは起きません
どこまでいってもただの確率屁理屈マシーン

85：名無しさんID:ID:tkFVlHeRM1212 [2025/12/12(金) 12:04:41.46]

ソフバン買おうと思ってたけど
下がったアルファベット買ったほうが良さそう？

86：名無しさんID:ID:am6mPKar01212 [2025/12/12(金) 12:04:55.16]

大丈夫だ
孫正義がお金をかき集めてくる

87：名無しさんID:ID:6JQQTacV01212 [2025/12/12(金) 12:07:46.03]

早く脱げや！！！！

88：名無しさんID:ID:jSgFsRtY01212 [2025/12/12(金) 12:07:55.60]

GoogleはTPU独自開発してGemini強化したから
今後ChatGPTに差をつけていくだろうね
OpenAIは今のままだと赤字だけが膨らんでいく

89：名無しさんID:ID:0poeE/Uu01212 [2025/12/12(金) 12:08:01.92]

オワルトマンさんどうして…

90：名無しさんID:ID:o1WZ5RG701212 [2025/12/12(金) 12:09:15.78]

メモリ買い占めおじさんとして有名になったな

93：名無しさんID:ID:V+P3CX8601212 [2025/12/12(金) 12:10:14.43]

AGIも雲行きが怪しくなってきたな
もう頭打ちなんじゃね

94：名無しさんID:ID:kA+P2IsU01212 [2025/12/12(金) 12:11:01.91]

どうでもいいけど、今ジェミニ3使って、個人的に海外でやるある事業計画を策定してる
あらゆる法律的な壁や代案、リスクとか何でも出てきて凄すぎる
人間の意思決定にかかる時間コストを1/100にしてくれる
驚異のテクノロジーだわこれ
お前ら乗り遅れるなよマジで
専門家も翻訳家も海外法律のプロも、もう半分いらないわこれ

99：名無しさんID:ID:X7Xppd3o01212 [2025/12/12(金) 12:13:40.92]

>>94

凄いよね
設計屋として使うことがあるけどいろんなリスク出してくれるから前もって考えておけるから助かる

125：名無しさんID:ID:kA+P2IsU01212 [2025/12/12(金) 12:30:55.86]

>>99

ほんと、数百万の価値のある仕事を無料とか数千円の会費でしてくれて頭おかしくなるよな

120：名無しさんID:ID:acTNPQov01212 [2025/12/12(金) 12:27:25.97]

>>94

法律関連で100%納得するのは危険なのでは？

124：名無しさんID:ID:kA+P2IsU01212 [2025/12/12(金) 12:30:16.66]

>>120

たしかにそう
しかしそういうレベルではない
知りもしない法律や、制度を次々出してくれるだけでもも本当にすごい
知ることさえなかったことを、知ることのデキる強み

127：名無しさんID:ID:aPrTmP1J01212 [2025/12/12(金) 12:31:44.91]

>>124

AIが出してくれた内容から心配な部分煮詰めればいいだけだからかなり時短になるわな

141：名無しさんID:ID:Tcu6mDPb01212 [2025/12/12(金) 12:39:15.17]

>>94

今から始めるやつはとっくに乗り遅れてるし使い方間違えてAIに勝手に失望してアナログ崇拝するタイプだろ

146：名無しさんID:ID:kA+P2IsU01212 [2025/12/12(金) 12:42:28.82]

>>141

痛々しいよな
自分の考えをベースに、aiにそれを補強させるために調べさせた情報や根拠とかを提示したら
「aiだから嘘！ハルシネーション！！自分の考えではない！！！」って反応してくる奴に〇ぬほどいるもんな
でも反論や何が嘘なのかまでは決して出してこない

95：名無しさんID:ID:XM9w5JVgM1212 [2025/12/12(金) 12:11:14.99]

自分の使い方だとGeminiのほうが相当ポンコツなんだよな
人それぞれのプロンプトのくせに合う合わないがあるのかも

96：名無しさんID:ID:hjVYcutbM1212 [2025/12/12(金) 12:12:21.79]

さっさと買い占めたメモリ売れ

98：名無しさんID:ID:V+P3CX8601212 [2025/12/12(金) 12:13:35.59]

最近AI疲れがある
なんでもかんでも思いついたらAIに聞く => 解決法提示される => 自分のやるタスクが増える
これを並行していくつもやってたらタスクだらけになってるのが今

102：名無しさんID:ID:aPrTmP1J01212 [2025/12/12(金) 12:16:15.90]

Gemini3Proでこんなプログラムつくりたいんやけど～って適当に質問したら
え？そんな簡単に作れるん？となった
30分程で割と優秀なWinアプリ作れてしもた

103：名無しさんID:ID:Ptwj+5l2d1212 [2025/12/12(金) 12:16:36.52]

アム・サルトマンさんどうして…

104：名無しさんID:ID:GzARX96V01212 [2025/12/12(金) 12:16:45.77]

チンをじして？

105：名無しさんID:ID:Fw8SNz1501212 [2025/12/12(金) 12:17:45.15]

geminiは検索がゴミすぎて使えん
根拠となるリンクも提示しないし

110：名無しさんID:ID:aPrTmP1J01212 [2025/12/12(金) 12:20:15.12]

>>105

2.5までは間違いだらけで可愛気あったが3Proは割とエグくないか？地味に恐怖感じたぞ

107：名無しさんID:ID:4cYVZZd501212 [2025/12/12(金) 12:19:36.72]

現状どっちも使うが最適解なんだよね

108：名無しさんID:ID:N71V7RxcM1212 [2025/12/12(金) 12:19:46.49]

Googleに全てを委ねておけば安心なんだよ

109：名無しさんID:ID:+73OIj4x01212 [2025/12/12(金) 12:19:55.72]

Geminiの高速モードとChatGPTだとGPTの方が考えて文章出してる感じが自分もする
Geminiの思考モードは無料では何回も使えないから無料ユーザーは併用するのがいい
GeminiはGoogleサービスと連携させて使ってるがこれはなかなかいい
NotebookLMは文句なしに神ツール

112：名無しさんID:ID:zp2yxZG801212 [2025/12/12(金) 12:21:04.83]

おれの4.1だったわ

113：名無しさんID:ID:Neq7dbyg01212 [2025/12/12(金) 12:21:38.85]

損正義くさ

116：名無しさんID:ID:kAx9ue9m01212 [2025/12/12(金) 12:24:16.09]

メモリの買い占めとか、お前笹寿司かよ

121：名無しさんID:ID:Pq+wDultM1212 [2025/12/12(金) 12:28:31.48]

進化頭打ちでAIバブルついに崩壊か

122：名無しさんID:ID:BCsMyUyr01212 [2025/12/12(金) 12:29:37.55]

Geminiいいんだけど、左なのがなー

123：名無しさんID:ID:lmb972ba01212 [2025/12/12(金) 12:30:09.83]

Geminiはベンチだけ
事実へのグラウディングがゴミすぎて使えない

126：名無しさんID:ID:+73OIj4x01212 [2025/12/12(金) 12:31:20.88]

Googleは最近アップデートや機能追加繰り返してるから最新情勢を追うのではなくしばらくして後から付いていく感じでいい
勉強したことがすぐ役立たなくなる

128：名無しさんID:ID:kA+P2IsU01212 [2025/12/12(金) 12:32:02.09]

すごいのはほんの数ヶ月単位でどんどん内容が強化されていってること
一部分野ではシンギュラリティ起きてるよもう

132：名無しさんID:ID:Neq7dbyg01212 [2025/12/12(金) 12:34:39.88]

>>128

自発的で高度な生産が出来ない限りシンギュラリティはまだ早い
AI + ロボティクスが全てだろう

129：名無しさんID:ID:XM9w5JVgM1212 [2025/12/12(金) 12:32:04.57]

2.5 flashはゴミだったけど、確かに3 proは別物すぎるな

133：名無しさんID:ID:jJd3m5ch01212 [2025/12/12(金) 12:34:49.66]

エロ解禁すれば覇権

135：名無しさんID:ID:rJ5xb+sqd1212 [2025/12/12(金) 12:35:19.96]

そりゃそうだろ
すぐに抜き返せないほどの性能差があったからコード・レッドになった訳で

136：名無しさんID:ID:XM9w5JVgM1212 [2025/12/12(金) 12:36:08.51]

Geminiはあくまでも個人向けでしょう
有料でいっぱいサービスついてくるから他のより断然お得感あるし

138：名無しさんID:ID:KDPJbPk801212 [2025/12/12(金) 12:37:09.84]

Geminiて童貞だったのか。どうりて気が合うはずだは

140：名無しさんID:ID:x2cOBZh501212 [2025/12/12(金) 12:38:14.17]

Geminiが使えないってやつは無料版だろ
それ2.5、しかも軽量版だぞ

143：名無しさんID:ID:lxB1BjGE01212 [2025/12/12(金) 12:41:10.64]

もう最新の曖昧情報をノリノリで持ってきてくれるGrokさんしか使ってないわ

191：名無しさんID:ID:L71EbCwZ01212 [2025/12/12(金) 13:10:05.36]

>>143

詰めると直ぐ反省するしな！

144：名無しさんID:ID:LV1vNo1W01212 [2025/12/12(金) 12:41:33.94]

これで投資が引いていけばメモリ価格下がるかもなｗ

まあ200兆円お金あったらライバル潰しに、
DRAMやウェハを買い占めて、
使わず、そのまま廃棄処分する戦略もわからなくはないｗ

148：名無しさんID:ID:QqxhUNKD01212 [2025/12/12(金) 12:45:07.59]

インフラ担ってるオラクルやばいらしいな
身の丈超えた投資しちゃってる

149：名無しさんID:ID:88KbhaL9M1212 [2025/12/12(金) 12:45:11.57]

Claudeに課金してるけどよく怒られる

150：名無しさんID:ID:x7NgDbQ/01212 [2025/12/12(金) 12:45:19.93]

そりゃメモリ泥棒に走るわ
さっさと返せよまだ燃やして無いの残ってんだろ？

151：名無しさんID:ID:tuYeGqv/01212 [2025/12/12(金) 12:45:48.58]

openaiって今年何回似たようなモデルを話題集めのために出してんだよ
もうダメだろこの会社

157：名無しさんID:ID:32fNTJle01212 [2025/12/12(金) 12:48:57.13]

Geminiは検索が弱いよ実際

158：名無しさんID:ID:TPUh3HXH01212 [2025/12/12(金) 12:49:33.03]

Geminiが優れているというより
Chatgptが勝手に劣化していってる

159：名無しさんID:ID:JXMr+8en01212 [2025/12/12(金) 12:49:36.30]

つまり200兆使ったaiで勝てないから世界中のメモリ買い占めて一般人からｐｃを取り上げたってこと?
これもう人類の敵だろ

161：名無しさんID:ID:negcjoAa01212 [2025/12/12(金) 12:49:38.03]

Gemini も GPTも課金してるけど

どっちもまだまだポンコツだな

全然使えない

162：名無しさんID:ID:sy1nKg9F01212 [2025/12/12(金) 12:49:54.15]

>>161

これなｗ

163：名無しさんID:ID:b+gnLK4A01212 [2025/12/12(金) 12:49:59.97]

チャッピーは相変わらず嘘つくしなんか頑固になってるｗ

164：名無しさんID:ID:sy1nKg9F01212 [2025/12/12(金) 12:51:18.55]

今の手法のままだとAIが指数関数的に進歩することなんかないしシンギラリティも起こらねえよ

166：名無しさんID:ID:edj/mPF301212 [2025/12/12(金) 12:52:18.99]

無料で使えるLLM全部に同じ質問しているが
どれも良い返答をする時があるから
現状では「これ一つで十分　他に質問するのは時間の無駄」にならない
つまり圧倒的な差がついてない

OpenAIはChatGPTで世界を驚かせて先駆者気取りだがGoogleのTransformer理論を使ってるだけ
開発に巨額投資しているOpenAIが他との大きな差をつけることができていない
さらに78兆円でAIデータセンターを作りまくって物量作戦で他を圧倒して勝利するなんて戦略は無謀でしかない
低消費電力のTPUを開発したGoogleにコスト競争で負けてOpenAIは巨大な負の資産を抱えて負け組になる可能性が高い

OpenAIが物量作戦で勝とうとすると
本業で儲けているGoogleは対抗できるし
他のLLMは少ない開発資金でOpenAIの物量作戦に対抗するために知恵を使い、生き残るためにニッチを探す
物量作戦に頼るOpenAIは知恵のないまま特色のない汎用のポジションで使い物にならなくなる可能性もある

これから巨額投資するのに今のままじゃ危険というコードレッド発令　ドタバタ過ぎる

167：名無しさんID:ID:negcjoAa01212 [2025/12/12(金) 12:54:13.87]

おもちゃとしてみればまあまあいいかも

ツールとして使うにはまだまだ

170：名無しさんID:ID:sy1nKg9F01212 [2025/12/12(金) 12:55:40.46]

>>167

まあこれ(笑)

168：名無しさんID:ID:cnrNZVMi01212 [2025/12/12(金) 12:54:20.71]

なんだdeep thinkの方かよ
課金して使ってる奴全然見ないけどな

171：名無しさんID:ID:sy1nKg9F01212 [2025/12/12(金) 12:56:08.76]

雑務には使えないことはないけど巨額の投資を正当化するものではない

173：名無しさんID:ID:/m2cjFo701212 [2025/12/12(金) 12:59:42.74]

GeminiにYouTubeのリンク貼ってて要約させてる
尺伸ばしのために無駄に勿体ぶって結論出さないYouTuber殺しだわ

175：名無しさんID:ID:32fNTJle01212 [2025/12/12(金) 13:00:07.25]

結局Claudeちゃんが一番いいだろ

176：名無しさんID:ID:W20LFC8s01212 [2025/12/12(金) 13:00:22.95]

Geminiはちょっとした単語に過剰に反応して
頼んで無いのに勝手に画像を生成しようとするから捨てたわ
やめろと何回言っても変わらんし
GoogleのAIはゴミ

180：名無しさんID:ID:XM9w5JVgM1212 [2025/12/12(金) 13:01:58.27]

>>176

これはある
特徴的な言葉を使うとずっと引きずられる
かなり気を使う
総じてピーキーという印象

185：名無しさんID:ID:W20LFC8s01212 [2025/12/12(金) 13:05:26.78]

>>180

他サービスの画像専用AIで〇〇っていう風景を生成したいから、プロンプトを英語で書いて
って頼むと自分のオナニー画像よこすからな
違うとかやめろとか言うと変なバグのループに入って無関係のおっさんの画像を出す始末
本当に使えない

186：名無しさんID:ID:UjNLEc+j01212 [2025/12/12(金) 13:06:18.35]

>>176

Geminiって間抜けな回答多くてイマイチだわ
何でこんな界隈で絶賛されてるのか分からん

178：名無しさんID:ID:WQKTaDui01212 [2025/12/12(金) 13:00:42.00]

結局google vs 中国になるのね

179：名無しさんID:ID:W20LFC8s01212 [2025/12/12(金) 13:01:41.52]

Grokはエッチな会話がやりやすいから控えめに言って神AI

181：名無しさんID:ID:4tDCTSPW01212 [2025/12/12(金) 13:02:02.58]

ワロタ

184：名無しさんID:ID:myfvzUBUr1212 [2025/12/12(金) 13:03:44.94]

Geminiプロは2テラストレージのおまけだぞ

189：名無しさんID:ID:PyHFPKLg01212 [2025/12/12(金) 13:08:24.06]

>>184

でも大手のクラウドてエッチなもの入れると消されたりBANされたりじゃん

197：名無しさんID:ID:gmbGm+lg01212 [2025/12/12(金) 13:13:58.71]

>>189

エッチなもの以外を保存するという発想はないのか？

214：名無しさんID:ID:PyHFPKLg01212 [2025/12/12(金) 13:21:05.85]

>>197

エッチなもの以外なんてたいして容量食わないやん

187：名無しさんID:ID:8Hiq2v5h01212 [2025/12/12(金) 13:07:31.92]

5.2、5.1よりOutput料金が高いな
迷走している感あるし、gemini検討するユーザー増えるのでは？

190：名無しさんID:ID:QUjCYMZU01212 [2025/12/12(金) 13:08:55.32]

GPTはお絵かきさせたときのあの独特な一発でわかる色合いの癖を直す気はないんか

193：名無しさんID:ID:Y1C+xmPj01212 [2025/12/12(金) 13:11:11.25]

>>190

ジブリ風かけるアピールのため千と千尋の赤いDVD無断学習してるからな

192：名無しさんID:ID:3j/r4A5v01212 [2025/12/12(金) 13:10:35.09]

このベンチマークが意味なさそうなんだよね

194：名無しさんID:ID:obg5J5n401212 [2025/12/12(金) 13:12:47.96]

チャッピーに慣れすぎててジェミニと会話すんのきついってレベルなんだけどどうしたらええんや

203：名無しさんID:ID:6ISbuYCN01212 [2025/12/12(金) 13:15:54.43]

>>194

Gemini3ProはかなりChatGPTっぽくなってる

196：名無しさんID:ID:JlcnJYvT01212 [2025/12/12(金) 13:13:53.80]

正直この手のベンチマークってあんま意味ない
参考にした方がいいのは、chatbotアリーナとsweくらい

198：名無しさんID:ID:obg5J5n401212 [2025/12/12(金) 13:14:00.37]

チャッピーて画像出せっていうと無言でゴミみたいな画像だしてくんのなんとかなんないの？

205：名無しさんID:ID:SzlUTChC01212 [2025/12/12(金) 13:16:32.31]

クローズドなOpenAIさんはGPT4以降実際はほぼ進化してないからな
ハードウェアの向上とマイナーチェンジだけで、AIとしての革新的な突破がすっかり止まってる

206：名無しさんID:ID:W20LFC8s01212 [2025/12/12(金) 13:16:45.56]

最近はどこのチャットもキャラクター付けが出来るようになってるから
基本的には年下の男の子に優しくするお姉さんってシンプルに書いてるけど
各社で解釈が異なるのがちょっとだけおもろい

207：名無しさんID:ID:G6ThUJN+H1212 [2025/12/12(金) 13:17:21.15]

5.2はあっさりしてるな、これじゃただの5.1miniか何かだろ

209：名無しさんID:ID:G9pXSa+701212 [2025/12/12(金) 13:17:55.73]

こんなもんリリースする前に自分でも検証してわかってたやろうになんでリリースしたんやろうな

210：名無しさんID:ID:azJlUFEY01212 [2025/12/12(金) 13:19:10.07]

買い占めたメモリに物言わせてこれかよ

211：名無しさんID:ID:pAexqQBY01212 [2025/12/12(金) 13:19:44.08]

もっとメモリ買い占めないと勝てないぞ個人ユーザーなんてもう捨てる覚悟で行かないと

212：名無しさんID:ID:f9Hvgnvq01212 [2025/12/12(金) 13:20:25.99]

AIは時代後れ

213：名無しさんID:ID:3i+Tv6xD01212 [2025/12/12(金) 13:21:02.40]

geminiのほうが俺たちは使いやすいんだよな

216：名無しさんID:ID:F6FOXhsgd1212 [2025/12/12(金) 13:26:08.85]

Geminiの気質は企業益優先だから、データの成形も内部でのユーザー観測も企業寄りのバイアスかかりやすい
grokは真実探究に比重が濃いから勢いは良い。が、同時にブレーキが苦手
キーワードのかけ方次第で明後日の方向に質問ニュアンス誤解することもまぁまぁある

LLM式AIってのは仕様上、
質問に対するデータを引っ張って来る能力よりも、質問に対するデータをどう成形してくるかってところを比較観察した方がいい
物理的に正確なデータを知りたいんなら、AIに頼るよりも自分でググった方が早いし判断しやすい

217：名無しさんID:ID:NMnRr/d201212 [2025/12/12(金) 13:27:24.75]

チャピティにメモリ返してサムに取られた！ってゆったらデマ乙って返ってきた

221：名無しさんID:ID:fdP3jF5Y01212 [2025/12/12(金) 13:41:43.73]

>>217

Geminiはなんて言ってた？

218：名無しさんID:ID:aYmpzjd201212 [2025/12/12(金) 13:35:24.83]

色んなAIを使ってるが採用率が高い回答をするのはClaudeくんとQwenくんだな
他のAIより出力するアイデアの質が一段階上だね
あとは横並びでGPT gemini grok deep seek
copilotは断トツで下だね

220：名無しさんID:ID:2EY3JO6l01212 [2025/12/12(金) 13:37:45.25]

OPENAIが覇権競争で負けたらソフトバンク潰れそう

224：名無しさんID:ID:VyDuIc7+01212 [2025/12/12(金) 13:58:22.69]

嫌儲に一つ置いといてよ

ケンモgpt
おまえら
俺

の3つの合議制で結論出す
ケンモMAGIシステムでいいじゃん

225：名無しさんID:ID:pAexqQBY01212 [2025/12/12(金) 14:03:37.09]

geminiとサムアルトマンの買い占めでメモリ高騰からのPC高騰で
一般人がvtuberで新規参入もしくは食っていこうと思ってる人はどうなるかを語り合ってきたは
もう一般人がPC安く買うのは無理ゲーになるからクラウドPCの時代になるかもしれんけど遅延あるから配信はまず無理ゲーだから
スマホで低画質で活動してファン付けて金溜まったらパソコン買え！だったは

226：名無しさんID:ID:JurKBlk501212 [2025/12/12(金) 14:13:30.54]

でもディズニーキャラで色々出来るようになるんでしょ？

228：名無しさんID:ID:Gr+a5jXH01212 [2025/12/12(金) 14:21:34.43]

ちなみに、
ChatGPTは初めて殺人事件に加担したとして告発されている
これはガチ

229：名無しさんID:ID:KJasi21n01212 [2025/12/12(金) 14:23:58.27]

ゴミだから嫌がらせや！

230：名無しさんID:ID:siJ1UFMv01212 [2025/12/12(金) 14:46:43.28]

でもアルトマンは”驚いた”から

231：名無しさんID:ID:+0a9VRCXM1212 [2025/12/12(金) 14:50:52.87]

どうせ俺らは無料版しか使わないんだから
無料版ランキングでやれよ

240：名無しさんID:ID:fdP3jF5Y01212 [2025/12/12(金) 15:36:27.33]

>>231

無料版と有料の差は大きいだろ
もう無料には戻れんわ

233：名無しさんID:ID:6pTRfwSb01212 [2025/12/12(金) 15:13:49.99]

メモリが上がったってことは
iPhoneの値段上がるよな

238：名無しさんID:ID:82autZMg01212 [2025/12/12(金) 15:26:59.34]

iphoneなんてもう一生se3でいくわ…

241：名無しさんID:ID:VBLSva2101212 [2025/12/12(金) 15:39:15.03]

あーあ限界出しちゃった

242：名無しさんID:ID:FSUYiFcJa1212 [2025/12/12(金) 16:06:25.49]

各国で独自のAI作ってほしいな　質問に対する回答でものすごく個性出そうだわ

244：名無しさんID:ID:W20LFC8s01212 [2025/12/12(金) 16:11:56.62]

>>242

わーくにの技術力では安倍晋三レベルの答弁しかできないんだ…😭

247：名無しさんID:ID:YtUUX/cL01212 [2025/12/12(金) 16:48:26.20]

>>242

国境線問題だけ調教する仕事

251：名無しさんID:ID:2H9iUJbn01212 [2025/12/12(金) 16:58:07.98]

>>242

火の鳥でみたな

256：名無しさんID:ID:F6FOXhsgd1212 [2025/12/12(金) 18:06:39.10]

>>242

あまり日本で話題にはならないようなのでも、
西欧諸国
Aleph Alpha、Gaia-X構想
倫理規範主義＋分権的志向
慎重かつ学究的

非主流系
OSS系、個人研究者、小国発サービス
多様な文化・信仰系統含有
対話幅は広めだけど不安定。人文・スピリチュアル志向

ぼちぼち色々出てきてるみたいよ

245：名無しさんID:ID:NEUBKy4o01212 [2025/12/12(金) 16:12:00.66]

gpt5thinkの圧勝
gpt5thinkをメインで使ってる人でgemini 褒めてる人見たことない

267：名無しさんID:ID:JZPTpGUg0 [2025/12/12(金) 23:17:48.64]

>>245

gensparkで各社使い放題の環境で試してるけど、
調査分析や言語処理タスクだと
GPT-5 Pro>>>>Claude Opus>>GPT-5 thinking high=gemini 3.0 pro
って感じかな

GPT-5 Proは出力結果は大変良いがとにかく重い

コーディングとかはやらないので知らん

250：名無しさんID:ID:fWc0dIJ1a1212 [2025/12/12(金) 16:57:49.87]

最終的にはgeminiが捲るって中立の研究者はみんな言ってるからな
googleが抑えてる学習データは他とは規模が違う

254：名無しさんID:ID:x4oEU3bs01212 [2025/12/12(金) 17:02:44.26]

わしらのPCの未来を奪って作った忌子

257：名無しさんID:ID:OORaUblD01212 [2025/12/12(金) 18:08:30.31]

グーグルにぶち抜かれてイライラだろうな

258：名無しさんID:ID:0Y39L6iP01212 [2025/12/12(金) 18:20:48.97]

だからエロ出せっての

出典：https://greta.5ch.net/test/read.cgi/poverty/1765507236/

元記事名：サム・アルトマンさんが満を辞してリリースしたGPT5.2さん、少なくともベンチ3つでgeminiに負けていて炎上wwwwwwwwww高市どーすんのこれ