ChatGPTとかClaudeにハマってる奴は浅いよな。本物はローカルLLMに手を出す


今は時期が良いぞ
5ちゃんねるdatが存在しません。削除されたかURL間違ってますよ。。

思考モードの制限も当然無いか
でもお時間かかるんでしょう??

>>2
(数百万クラスのPCなら)ちょっと3秒くらい考えればできると思いますよ

>>7
5万や無理やな

今マジで熱いよな

H200を1枚買うだけで600万かかるやん

bonsaiってのがすごいらしいな

>>6
よくあれだけ圧縮できたよな
リソース1/8くらいなのに去年より性能いいし

ollama使ったけどいまいちだった

>>9
モデルによるやろ

ローカルで30Bくらいが動けば十分

遅くてストレスあるわ、エージェントとして裏で作業させるにはいいけどチャット用途は契約したほうがいい

オンラインの方が早いから制限解除とかセキュリティとかのメリットしか無いな

会社のDC休日は私用で使っていいことになってて遊ばせて貰ってるわ
エロ画像生成してるやつも居たらしくて休日中に痕跡を消しとけとやんわり通達出てたのには笑った

遅い?ローカルの回答めっちゃ早くない?

GMKtec EVO-X2
メモリ128GB
去年30万で買った。

RTX PRO 6000 Blackwellでコンテキスト長MAXで動かしてる動画ないのかな?

まあトランスフォーマーの仕組みの汎用性の高さに気づいてからが本番ではある

gemma4 26bのコーディング性能ってどうなん?
GPUは16GBしかないけどいける?

Gemma4はなかなか凄いとは思うけど
結局クラウドには勝てないから一昔前のPCベンチマーク代わりとか物好きの趣味レベルよな
別にgeminiでもclaudeでもエロ用途だろうがそこそこ緩いし
Gemma4が一般的なPCでも動く時代になったら夢が広がるが




ローカルエージェントで遊びたい

コーディングさせるには無理がある

個人レベルじゃ知恵遅れ程度の性能しか出ない印象なんだが最近は違うのか?

ローカルで満足のいく返答を得るコストが高すぎ

WormGPT…

Gemma4のE4Bしか使えないゴミPCだけど漫画50枚読み込ませて内容説明出来た
特に使い道ないからそれで終わったけどな
普段遣いならチャッピーでいいし

ローカルllmって性能的にchatgptとかclaudeとかに全く及ばない
llmそのものに興味があって実験とかしたい人にはいいけど、それ以外は意味ない

Rimtalkで使ってる
無制限に出来るから助かるわ

Mac Studioとか中途半端で使い道無かったけど
クラスター化できる機能で化けたな

コーティングエージェントで使うにはまだ能力が足らない

いいねぇ

蔵人を評価してるけど最近の双子座(ジェミニ)は賢さが蔵人に追いついてきたな
GPTはお世辞や陰謀論を言うからダメ
蔵人はツンツンして媚びないから良い

微妙に違うけど画像整理でAIタガー使っててwd14タガーからcamieタガーに変えたら収録キャラが大幅に増えて名無しの画像整理が捗ったわ

ローカル無能過ぎて回帰までがセット

だったらローカルLLMを使うべき理由を分かりやすく提示してくれ
例えばGemini 3.1 Flash Liteと同等以上の性能を出そうとしたら、Flash Liteよりコストかかるのでは?

一般的な構成だとo3miniくらいらしい

ローカルLLMの脆弱性を知らない奴はモグリ

ローカルLLM勢ってメインメモリ90GB以上積んでて当然みたいなイメージ
5090持ってるけどメインメモリ32GBしかないから無理そうだわ

最近の有料AIはなにか画期的なことが出来ることを売りにしてるんじゃなくて、ベンチマークのグラフや数字を自慢してるだけだから終わってる

いやちょっと知恵借りる程度ならお金払うじゃん?

タクシーとかバスとか否定するタイプ?




ローカルLLMってVRAM12GBじゃ人権無い感じ?
Q4とかでも17GBが最低ラインやん?

>>48
普通にそのへんが多数派だろ
3090はともかく4090や5090の頃にはGPUが値上がりしまくってるから掲示板で型番連呼するやつはたくさんいても実数はいないはず

ローカルで脱獄(エロとか調教されていない版)があるという噂も

数十万のpcでローカルllmするぐらいならopwnrouterの無料で十分じゃないの?

>>52
Macminiも3060あたりのデスクトップPCも高騰してない時期だったら10-14くらいで他のビジネス用PCと大差ない値段でそれを流用してる人のほうが多いだろう
LLM専用に50万も60万も予算つかってPCを新調したりGPU抽選に参加してる人らはニュースにはなっても実際の数としては例外的割合のはず

翻訳させるには何がいいの

5080、メモリ128GBでエロ漫画のプロット書ける?
Geminiよりええんか?

DGX Sparkでローカルllm使ってるケンモメンおらんの?

60万円コースかぁ

もとを取った頃には廃棄処分なんだろなサーバー

qwen3.5の9bでオープンクロー動かしたら小学生低学年並みのヤバさだったぞ。
GPT5.4クラスが動かんとキツい。

ゲームがん無視で4060ti(16GB)が売れてた理由がようやく判明したな
ローカルか

Qwen Image Rapid AIOは凄いよ
嫌儲で拾った画像の女を片っ端から脱がせられる

chatGPTはオワコンになる前にエロ解禁してよ

使いもんなんねーよ

gpu必須だよな
メモリやcpuだけだとどうにもならん感じか

突如実用化した1ビットLLM Bonsai-8B もう推論にGPUはほぼ不要になる。その先に何が起きるか
突如実用化した1ビットLLM Bonsai-8B もう推論にGPUはほぼ不要になる。その先に何が起きるか
ソフトウェアの革命は、突然やってくる。ように見える。 カリフォルニア工科大学(以下カルテック)のババク・ハッシ…

大学や研究所とかでは48GB以上のGPUを使ってあれこれ新しい技術にチャレンジしている人達が、
ローカルで動かしたい人向けに頑張ってくれて動かせるようになるラインが16GBぐらいの印象

AI用に5090欲しい
でも60万円は無理だお

良くわからん
ネットから情報集めまくってAIがこねくり回して何かを作るんだろ?
ローカルってオフライン?自分のパソコンの中だけで完結するなら情報足りなくて大したものできないんじゃないの?
素人からしたらそう思うんだが
ちがうのん?




>>73
その通り。
でも情報足りないけれど公開されたサービスでは抑止されているエロ用途とかに使える

大ロシア幼女横キック


3060を2枚 pcie x8 x2でも4090よりちょっと遅いくらいだから5090を2枚とかにする気がないならIntelやRadeonの16G2枚から入ればいいんじゃないかな

エロ画像生成ならローカル一択だけど推論目的で使うのは大容量VRAM必須だから微妙じゃね

余ったゲーミングPCで音楽と動画の生成やってるけどおもちゃとしては十分だね

Macでもいける?

遅くないとか言ってるのは思考してないモードだからだと理解してない
そもそもchatgptやgeminiのシンキングモードと高速モードの差も理解して無さそう

gemma4-31B凄すぎる
特にgeminiapiの無料枠で一日1500回使えるのが頭がおかしい
当然のことながらredditに同じ事を考えてる奴が居てAIエージェントで複垢で無料枠限界まで使ってる奴がいた
こりゃ早晩規制キツくなるな

実際ローカルで揃えようとすると月20ドルがいかに安いかがよくわかる

iPhoneにgemma4入れたけど動くの確認しただけで満足してしまった

gemma4は脱獄版が話題になっているね
x.com/i/status/2040605292971315328

claude codeは代替先がない

なんかミラ・ジョヴォヴィッチがエージェントAI用のメモリシステムを開発メンバーだとかのニュースが流れて来たのを確かめたら本当だった
まあスポンサーとしてお金を出したとかなのかもしれんが

いくら性能上がっても所詮はオンラインより低性能だなら需要がないんでしょ
毎月課金したくないのに先に数十万払う本末転倒だし
元々ガン積みなゲーミングとかワークステーション持ってる奴ならいいけどそんな奴は少ない
俺もVRAM24GBにRAM200GBくらいはあるけどあんまり使ってない

>>92 >>93
>>93

翻訳・要約・写真分析・雑学質問程度だったらローカルで足りる
プログラムや小説みたいな仕事で使ってる人はその性能では困るのだろうけど
日常や趣味レベルで毎月何千円も出したくない


少し性能が低いんじゃなくて、大幅に性能が低い上に、
モデルの更新も遅いから、新しい情報を知らないうえに、ウェブ検索も難しいんで、ハルシネーションが起きまくる
ローカルllmは相当限られた用途でしか使えない

QWEN3.5の無制限版にイケない質問したら震えたわ
これはローカルでしかできないヤバさだよな

qwenに天安門事件とか尖閣諸島について聞いてみればいい
結局llmってオープンと言っても、モデルが利用できるだけで、自分でモデルを改良するのはできないというか、ほぼできない

>>95
qwen3.5のuncensored(検閲なし)版出回ってるぞ

Qwen3.5は確かに凄いんだけど、これでAIエージェントできないのがなぁ
Continue使っても出来ることは限られてるし




qwen3.5のuncensored使ってるけど
たしかにNSFWなことも生成してくれるが
非NSFWなほうに振ろうとする努力も垣間見えてイケイケな感じじゃないんだよな

Qwenは画像の日本語読みが優秀

glm5でVRAM 800GB

4Bとかたまごっちみたいな育成ゲームだと思ってる(´・ω・`)

ローカルLLMなんて安倍晋三小説を書くくらいしか使い道がないだろ

フラックス入れたけどコミュファイとかいうのが意味不明すぎて
画像作れてないんだが。

クウェンもリリース直後はバグ動作しまくってたしgemma4ももう少し待った方が良い。

notebooklmって簡易ragの一種に過ぎない
ナレッジの追加はclaudeやchatgptのプロジェクトやgptsでもできる

大差ないよ
要するに推論する時に外部ナレッジを検索てしるだけ
どの生成aiサービスでもやってることは同じ
使い勝手の違い程度しかないし、使い勝手ならプロジェクト作れてgptsでオリジナルのチャットボット作れるchatgptがいい

gemma4-26b-a4b弄ってるけどgeminiの高速モードくらいには使えるのがすごい
VRAM16Gで動くローカルLLMでこれってすごい時代になったなぁと感心してる
あと検閲が全くと言っていいくらい効いてないのも凄い

エロ絵とプログラムの人ですごい温度差が

どの生成aiにもメモリー機能はある

gemmaが4bの次26bなんだけど
4bさすがに頭よくないし間を出せや

qwenってclaude入ってる9bより27bのckaude無しiq2の方が賢くね?


>>117
小説書かせると26B A4Bより31Bの方が明らかに頭良くて31Bよりもうちょっと上のが欲しいったなるわ

Gemma 4は英語のコミック画像を翻訳させると読み取りも翻訳(意訳)の精度が大分高いなって感じる
エロ小説も指示通り作ってくれるけどこっちは文章が堅いというかGeminiっぽさがあって抜ける文章の域まで達していないかんじ

コーディングエージェントで日本語プロンプトに対応できんの?

NotebookLM連携は単純なベクトル検索、キーワード検索だけじゃなくて、データの構造化、要約、生成によるクエリ検索までやってると言われてるね
要はNotebookLMに入れたデータのデータベース化も自動的にやって、そこにgeminiがアクセスする形になってる
googleのマネ―パワーよ

出典:https://greta.5ch.io/test/read.cgi/poverty/1775478424/

新着記事一覧
TKをフォローする
プログラミング速報

コメント